Bagaimana mendapatkan pekerjaan pertama anda dalam Sains Data?

Bagaimana seseorang boleh mendapatkan pekerjaan peringkat pertama sebagai Saintis Data atau Penganalisis Data? Sekiranya anda menelusuri forum sains data, anda akan menemui banyak persoalan mengenai topik ini. Pembaca blog sains data saya (data36.com) meminta saya sama dari semasa ke semasa. Dan saya dapat memberitahu anda ini masalah yang benar-benar sah!

Saya telah memutuskan untuk meringkaskan jawapan saya untuk semua soalan utama!

BARU! Saya telah membuat kursus video dalam talian yang komprehensif (percuma) untuk membantu anda memulakan Sains Data. Klik di sini untuk maklumat lebih lanjut: Cara Menjadi Saintis Data.

DAFTAR DI SINI (PERCUMA): https://data36.com/how-to-become-a-data-scientist/

# 1: Apakah kemahiran dan alat saintis data yang paling penting? Dan bagaimana anda boleh mendapatkannya?

Berita baik - berita buruk.

Saya akan mulakan dengan yang buruk. Dalam 90% kes, kemahiran yang mereka ajarkan di universiti tidak begitu berguna dalam projek sains data kehidupan sebenar. Seperti yang telah saya tulis beberapa kali, dalam projek sebenar, 4 kemahiran pengekodan data ini diperlukan:

  • bash / baris arahan
  • Python
  • SQL
  • R
  • (dan kadang-kadang Java)
sumber: KDnuggets

2 atau 3 yang mana yang paling berguna untuk anda bergantung pada syarikat… Tetapi jika anda mempelajarinya, akan lebih mudah untuk belajar yang lain.

Jadi soalan besar pertama ialah: bagaimana anda boleh mendapatkan alat ini? Inilah berita gembira! Semua alat ini percuma! Ini bermaksud anda boleh memuat turun, memasang dan menggunakannya tanpa membayar sesen pun untuk mereka. Anda boleh berlatih, membina projek hobi data atau apa sahaja!

Saya menulis artikel langkah demi langkah baru-baru ini mengenai cara memasang alat ini di komputer anda. Lihat di sini.

# 2: Bagaimana belajar?

Terdapat 2 cara utama untuk mempelajari sains data dengan mudah dan menjimatkan kos.

1st: Buku.

Agak lama, tetapi masih merupakan kaedah pembelajaran yang baik. Dari buku anda dapat memperoleh pengetahuan yang sangat terfokus, sangat terperinci mengenai analisis data dalam talian, statistik, pengekodan data, dan lain-lain ... Saya mengetengahkan 7 buku yang saya cadangkan dalam artikel saya sebelumnya, di sini.

7 buku data teratas yang saya cadangkan

Ke-2: Webinar dalam talian dan kursus video.

Kursus dalam talian sains data hadir dengan harga yang berpatutan ($ 10- $ 500) dan merangkumi pelbagai topik mulai dari pengekodan data hingga kecerdasan perniagaan. Sekiranya anda tidak mahu membelanjakan wang untuk ini pada awalnya, saya telah menyenaraikan kursus dan bahan pembelajaran percuma dalam catatan ini.

(3: Kursus Bulan Pertama Saintis Data Junior Saya telah membuat kursus sains data dalam talian selama 6 minggu untuk calon saintis data untuk mempraktikkan dan menyelesaikan tugas-tugas sebenar-ke-hidup pada set data yang benar-benar hidup: Bulan Pertama Saintis Data Junior .)

# 3: Cara berlatih, dan bagaimana mendapatkan pengalaman hidup sebenar

Ini sukar, bukan? Setiap syarikat ingin mempunyai orang yang mempunyai sedikit pengalaman kehidupan sebenar… Tetapi bagaimana anda memperoleh pengalaman kehidupan sebenar, jika anda memerlukan pengalaman kehidupan sebenar untuk mendapatkan pekerjaan pertama? Tangkapan klasik-22. Dan jawapannya adalah: projek haiwan kesayangan.

"Projek haiwan kesayangan" bermaksud anda menghasilkan idea projek data yang membuat anda teruja. Kemudian anda mula membinanya. Anda boleh memikirkannya sebagai permulaan kecil, tetapi pastikan anda terus fokus pada bahagian sains data projek dan anda boleh mengabaikan bahagian perniagaan. Untuk memberi anda beberapa idea, berikut adalah beberapa projek haiwan kesayangan saya sejak beberapa tahun kebelakangan ini:

  • Saya membina skrip yang memantau laman web harta tanah dan menghantar e-mel tawaran terbaik dalam masa nyata kepada saya - jadi saya boleh mendapatkan tawaran ini sebelum orang lain.
  • Saya membina skrip yang menarik semua artikel dari ABC, BBC dan CNN dan, berdasarkan kata-kata yang digunakan, menghubungkan artikel-artikel yang mempunyai topik yang sama persis di 3 portal berita yang berbeza.
  • Saya membina chatbot pembelajaran kendiri di Python. (Walaupun tidak terlalu pintar - kerana saya belum melatihnya.)

Jadilah kreatif! Cari projek haiwan peliharaan yang berkaitan dengan sains data dan mulakan pengekodan! Sekiranya anda menghantam dinding dengan masalah pengekodan - itu boleh berlaku dengan mudah, apabila anda mula mempelajari bahasa data baru - cukup gunakan google dan / atau stackoverflow. Satu contoh ringkas saya - mengenai seberapa berkesan stackoverflow:

sebelah kiri: soalan saya - sebelah kanan: jawapannya (dalam 7 minit)

Perhatikan cap waktu! Saya telah menghantar soalan yang agak rumit dan saya mendapat kembali jawapan dalam 7 minit. Satu-satunya perkara yang perlu saya lakukan ialah menyalin-menampal kod tersebut ke dalam kod pengeluaran saya dan boom, ia berjaya!

(Nota: Cross Validated adalah forum hebat lain untuk soalan berkaitan Sains Data.)

Cadangan +1:

Walaupun agak sukar, cubalah dapatkan mentor. Sekiranya anda cukup bernasib baik, anda akan menemui seseorang yang bekerja dalam bidang Saintis Data di syarikat yang bagus dan yang boleh menghabiskan 1 jam setiap minggu atau dua minggu sekali dengan anda dan berbincang atau mengajar perkara.

# 4: Di mana dan bagaimana anda menghantar permohonan pekerjaan pertama anda?

Sekiranya anda belum berjaya menemui mentor, anda masih dapat mencari yang pertama di syarikat pertama anda. Ini akan menjadi pekerjaan pertama yang berkaitan dengan sains data, jadi saya cadangkan untuk tidak memberi tumpuan kepada wang yang besar atau pada suasana permulaan yang sangat mewah. Fokus untuk mencari persekitaran di mana anda dapat belajar dan memperbaiki diri.

Mengambil pekerjaan sains data pertama anda di syarikat multinasional mungkin tidak sesuai dengan idea ini, kerana orang di sana biasanya terlalu sibuk dengan perkara mereka, jadi mereka tidak akan mempunyai masa atau / dan motivasi untuk membantu anda meningkatkan (tentu saja, selalu ada pengecualian).

Bermula pada permulaan kecil sebagai orang data pertama dalam pasukan bukanlah idea yang baik dalam kes anda, kerana syarikat-syarikat ini tidak mempunyai orang data senior untuk belajar.

Saya menasihati anda untuk memberi tumpuan kepada syarikat bersaiz 50–500. Itulah maksud emas. Para saintis data kanan ada di kapal, tetapi mereka tidak terlalu sibuk untuk membantu dan mengajar anda.

Baiklah, anda telah menemui beberapa syarikat yang bagus ... Bagaimana cara membuat permohonan? Beberapa prinsip untuk CV anda: soroti kemahiran dan projek anda, bukan pengalaman anda (kerana anda belum mempunyai bertahun-tahun untuk meletakkan kertas). Senaraikan bahasa pengekodan yang berkaitan (SQL dan Python), yang anda gunakan, dan pautkan beberapa repositori github yang berkaitan, sehingga anda dapat menunjukkan bahawa anda benar-benar telah menggunakan bahasa tersebut.

Juga, dalam kebanyakan kes, syarikat meminta surat lamaran. Ini adalah peluang yang baik untuk menyatakan semangat anda, tentu saja, tetapi anda juga boleh menambahkan beberapa butiran praktikal, seperti apa yang akan anda lakukan dalam beberapa minggu pertama jika anda diambil bekerja. (Contohnya "Melihat aliran pendaftaran anda, saya rasa laman web ____ memainkan peranan penting. Dalam beberapa minggu pertama, saya akan melakukan ___, ___ dan ___ (analisis khusus) untuk membuktikan hipotesis ini dan memahaminya dengan lebih mendalam. Ini dapat membantu syarikat untuk meningkatkan _____ dan akhirnya mendorong _____ KPI. ")

Mudah-mudahan ini akan memberi anda wawancara kerja, di mana anda boleh bercakap sedikit mengenai projek haiwan kesayangan anda, cadangan surat lamaran anda, tetapi kebanyakannya adalah mengenai pemeriksaan keperibadian dan kemungkinan beberapa ujian kemahiran asas. Sekiranya anda sudah cukup berlatih, anda akan melakukannya… tetapi jika anda seorang yang gugup dan anda ingin berlatih lebih banyak, anda boleh melakukannya di hackerrank.com.

Kesimpulannya

Baiklah, itu sahaja. Saya tahu kedengarannya lebih mudah ketika ditulis, tetapi jika anda benar-benar bertekad untuk menjadi Saintis Data, tidak akan menjadi masalah untuk mewujudkannya! Semoga berjaya dengan itu!

Sekiranya anda ingin mencuba, bagaimana menjadi saintis data junior pada permulaan yang benar-benar hidup, lihat kursus sains data dalam talian selama 6 minggu saya: Bulan Pertama Saintis Data Junior!

Dan jika anda ingin mempelajari lebih lanjut mengenai sains data, periksa blog saya (data36.com) dan / atau langganlah Newsletter saya! Dan jangan ketinggalan siri tutorial pengekodan baru saya: SQL untuk Analisis Data!

Terima kasih untuk membaca!

Nikmati artikel itu? Beritahu saya dengan mengklik di bawah. Ia juga membantu orang lain melihat ceritanya!

Tomi Mester pengarang data36.com Twitter: @ data36_com