7 keterampilan untuk meningkatkan kelayakan kerja untuk posisi ilmu data

Dalam artikel ini, saya akan membahas hal-hal yang akan membantu Anda mendapatkan pekerjaan ilmu data pada tahun 2022. Jika Anda memenuhi semua persyaratan ini, saya yakin Anda akan bisa mendapatkan pekerjaan ilmu data dengan cukup cepat.

Saya membuat artikel serupa beberapa waktu lalu di mana saya mencantumkan keterampilan ilmu data yang diperlukan untuk tahun 2020. Saya merasa saya tidak terlalu jauh. Namun bidang ilmu data terus berubah dan sepertinya ini saat yang tepat untuk membuat versi baru.

Namun bukankah ilmu data sudah mati?

Saya telah melihat beberapa artikel menjadi viral yang mengatakan bahwa “ilmu data sudah mati”.

Mungkin masa emas untuk beralih ke ilmu data telah berakhir, tetapi Anda masih bisa mendapatkan pekerjaan ilmu data pada tahun 2022. Ada banyak pekerjaan di luar sana, dan saya yakin bahwa memasuki pekerjaan data (teknis) masih merupakan pilihan yang baik untuk Anda. masa depan.

Salah satu perubahan besarnya adalah banyaknya persaingan jabatan di luar sana saat ini. Spesifikasi pekerjaan posisi data science masih sangat bervariasi dari satu perusahaan ke perusahaan lainnya.

Beberapa dari jabatan baru tersebut merupakan posisi yang lebih teknis:

  • Insinyur Perangkat Lunak dengan keterampilan pembelajaran mesin
  • Insinyur Pembelajaran Mesin
  • Operasi ML

Beberapa lainnya menempatkan pekerjaan ilmu data pada posisi yang sudah ada seperti:

  • Analis Data dengan keterampilan Pembelajaran Mesin

Dan beberapa perusahaan hanya ingin merekrut kandidat multi-kompeten yang juga menguasai Data Engineering dengan sempurna agar dapat dipertimbangkan untuk posisi ilmu data.

Haruskah kamu mengetahui segalanya?

Jarang ditemukan orang yang menguasai semua topik tersebut secara mendalam. Jadi, tidak, Anda tidak perlu mengetahui semua ini untuk mendapatkan pekerjaan. Namun, jika Anda punya waktu, peningkatan keterampilan dapat meningkatkan peluang Anda untuk menemukan pasangan yang cocok di pasar kerja.

Pada artikel ini, saya akan menyajikan daftar keterampilan tambahan yang dapat Anda latih sendiri jika Anda belum memilikinya. Saya harap ini memberi Anda pemahaman yang baik tentang apa yang perlu Anda lakukan jika ingin memaksimalkan peluang untuk mendapatkan pekerjaan ilmu data pada tahun 2022.

Saya tidak menyertakan keterampilan yang lebih standar seperti statistik, pembelajaran mesin, dan Python karena saya menganggapnya mendasar, dan Anda dapat menemukannya di hampir semua pelatihan ilmu data.

1. Keterampilan rekayasa perangkat lunak

Banyak insinyur perangkat lunak telah beralih ke spesialisasi ilmu data. Hal ini meningkatkan kebutuhan untuk menguasai keterampilan rekayasa perangkat lunak bagi ilmuwan data, meskipun Anda awalnya bukan berasal dari latar belakang perangkat lunak.

Berikut adalah sejumlah keterampilan yang dapat Anda uji atau pertanyakan saat melamar pekerjaan ilmu data.

Struktur data dan algoritma

Struktur data dan algoritme berada dasar gelar rekayasa perangkat lunak. Namun, dalam ilmu data, hal ini belum tentu ada, atau mungkin akan sedikit menyimpang.

Struktur data dan algoritme semakin menjadi bagian dari pengujian teknis untuk wawancara data scientist. Alasannya adalah semakin banyak posisi ilmu data yang memerlukan penulisan kode produksi dan pengiriman model Anda sendiri ke lingkungan produksi.

Ada banyak sumber pelatihan untuk struktur data dan algoritma di internet.

Tes Unit Pengujian dan Penulisan

Tes penulisan dan pengujian unit dulunya merupakan bidang pengembang dan insinyur perangkat lunak. Pada tahun 2022, banyak peran ilmu data yang mengharuskan kandidatnya mampu menulis tes untuk kode mereka sendiri.

Jika Anda belum menguasainya, Anda dapat memulai dengan mempelajari PyTest, yang cukup mudah diakses.

Anda juga dapat melihat "Pengembangan Berbasis Pengujian"dan menggunakannya mulai sekarang untuk meningkatkan keterampilan Anda dalam hal ini.

Kesempurnaan Git

Untuk bekerja sebagai ilmuwan data, banyak perusahaan juga mengharuskan Anda untuk menggunakan git dengan sempurna. Alat ini dulunya ditujukan terutama untuk pengembang, namun kini menjadi alat yang wajib dimiliki oleh banyak peran ilmuwan data juga.

Anda dapat memeriksa beberapa sumber daya untuk memulai dengan git ("pengantar git" dan "panduan langkah demi langkah dasar-dasar git"), atau langsung beralih ke penggunaan "git lanjutan".

Docker dan Kontainer

Docker adalah salah satu teknologi yang dulunya dianggap sebagai nilai tambah bagi ilmuwan data, namun dengan cepat menjadi sangat penting. Kontainer Docker memungkinkan Anda memecahkan banyak masalah pengaturan lingkungan, dan ini adalah alat yang hebat bagi ilmuwan data mana pun yang mengharapkan kodenya digunakan di mana pun selain mesin lokalnya.

Anda dapat “memulai Docker di sini”.

Keluar dari lingkungan Notebook

Banyak data scientist yang saat ini mengerjakan lingkungan notebook. Banyak hal yang bisa dilakukan di buku catatan dan dari buku catatan saat ini. Namun, pewawancara mungkin bersikap kritis jika Anda tidak memiliki lingkungan yang solid di lingkungan lain. Mampu mendemonstrasikan pengalaman menulis perangkat lunak yang berdiri sendiri atau membuat paket Python adalah nilai tambah yang besar untuk lamaran pekerjaan Anda.

2. Rekayasa Pembelajaran Mesin dan Keterampilan MLOps

Peran Machine Learning Engineer adalah kombinasi dari Data Scientist dan Software Engineer. MLOps adalah Pembelajaran Mesin yang setara dengan DevOps.

Kemampuan untuk menempatkan model Anda sendiri ke dalam produksi menggunakan CI/CD otomatis dan arsitektur cloud yang dirancang dengan baik adalah nilai tambah yang nyata untuk menemukan pekerjaan ilmu data pada tahun 2022.

Penyebaran

Menerapkan model tidak selalu sulit, tetapi ini adalah sesuatu yang belum banyak diketahui oleh data scientist. Entah pekerjaan mereka lebih banyak bertahan di bidang analitik, atau mungkin ada peran khusus di perusahaan mereka yang melakukan bagian pekerjaan ini.

Saya sangat menyarankan untuk melatih diri Anda sendiri dalam keterampilan yang diperlukan untuk menerapkan model, yang mencakup pengetahuan arsitektur, pengetahuan CI/CD, masalah keamanan, masalah kecepatan/kinerja model, pemantauan, dll.

API, layanan mikro, dan arsitektur

Memahami cara kerja API dan layanan mikro adalah langkah awal yang bagus dalam hal ini. Setelah Anda memahami bagaimana Anda dapat mengubah artefak model menjadi layanan, Anda sudah mulai memahami penerapan.

Penyedia cloud seperti AWS memberikan pelatihan dan sertifikasi hebat yang dapat membantu Anda menguasai bidang ini.

CI/CD

Langkah kedua yang saya rekomendasikan adalah mempelajari CI/CD. Setelah Anda memahami cara menyiapkan API dan menyampaikan prediksi model Anda dengan cara ini, akan ada banyak pekerjaan tambahan yang diperlukan untuk menjadikannya lebih tangguh.

Mengotomatiskan alur CI/CD membantu Anda mengelola alur penerapan dengan lebih baik. Lagi pula, jika Anda mengirimkan model Anda ke lingkungan produksi, Anda menciptakan risiko bagi aplikasi yang bergantung padanya. Anda harus memastikan semuanya dilakukan secara menyeluruh.

3. Keterampilan Rekayasa Data

Data Engineering merupakan salah satu pekerjaan yang paling banyak diminati saat ini. Jika Anda ingin memaksimalkan kemampuan kerja Anda, memiliki keahlian teknik data adalah pilihan terbaik Anda.

Dengan banyaknya perusahaan yang kini memiliki tim ilmu data, masalah kualitas dan aksesibilitas data menjadi topik hangat baru dan pembangunan data lake serta proyek migrasi cloud sedang terjadi di mana-mana.

Ada banyak sekali artikel yang mencantumkan keterampilan teknik data, jadi saya tidak akan membahasnya terlalu jauh di sini. Saya rasa artikel ini memberikan daftar yang cukup bagus, namun masih banyak daftar lainnya di luar sana.

4. Menjadi bahasa pemrograman multibahasa

Semakin banyak bahasa pemrograman yang Anda kuasai, semakin kecil kemungkinan Anda gagal dalam persyaratan suatu perusahaan. Banyak perekrut yang hanya memiliki daftar periksa, dan tidak memiliki pengalaman dalam salah satu kotak centang tersebut akan menghentikan lamaran Anda secara langsung.

Beberapa bahasa pemrograman yang mungkin wajib Anda ketahui (selain tentunya Python) adalah:

  • Percikan
  • Skala
  • Julia
  • Karat
  • Golang
  • R
  • SAS
  • dan banyak lagi

Bahasa yang berbeda umumnya ditanyakan untuk jenis posisi yang berbeda. Misalnya, Spark dan Scala sering kali lebih banyak diminta untuk posisi di lingkungan Big Data, sedangkan R dan SAS dapat diminta untuk peran yang lebih analitis, dan Rust atau Golang untuk pekerjaan di mana Anda akan menulis kode produksi.

5. Keahlian Pembelajaran Mendalam

Di masa-masa yang lebih mudah, seseorang bisa mendapatkan pekerjaan hanya dengan mengetahui cara menyatukan scikit learn pipeline. Saat ini, ini masih jauh dari cukup, karena perekrut akan memindai CV Anda untuk Deep Learning dan kata kunci seperti Computer Vision, NLP, sound analysis, dan banyak lagi.

Untuk melamar banyak deskripsi pekerjaan ilmu data, Anda harus menguasai Tensorflow dan Pytorch. Harapkan untuk menerima pengujian teknis mengenai hal ini, karena computer vision dan NLP telah menjadi kasus penggunaan yang penting di banyak domain, padahal sebelumnya hanya merupakan nilai tambah kecil dalam beberapa resume. tahun yang lalu.

Tentu saja, ini juga sangat bergantung pada domain yang Anda lamar.

Jika Anda mencari tutorial pengenalan pembelajaran mendalam lainnya, Anda juga dapat melihat artikel di sini atau di sini.

6. Ingat kelas matematika Anda

Ilmu Data sangat didasarkan pada matematika. Memiliki latar belakang matematika yang kuat adalah suatu keharusan untuk berhasil dalam ilmu data.

Selama wawancara kerja dan tes teknis, jangan kaget dengan penghitungan probabilitas sesekali dengan tangan, atau mengerjakan aljabar, pengoptimalan, dan bahkan tugas yang lebih kompleks dalam waktu yang relatif singkat sementara perekrut mengawasi apa yang Anda lakukan.

Jika menyelesaikan soal matematika bukanlah sesuatu yang Anda lakukan setiap hari (hal ini sering terjadi pada banyak orang), sebaiknya Anda melatih banyak contoh soal sebelum melakukan wawancara teknis ilmu data.

7. Jadilah ahli domain

Keahlian domain masih menjadi nilai tambah yang besar untuk lamaran pekerjaan. Jika Anda melamar pekerjaan ilmu data di domain yang sangat Anda kenal, kemungkinan besar Anda akan berhasil akan lebih besar.

Menggunakan ini sebagai batu loncatan dalam karier Anda sebagai ilmuwan data adalah ide yang bagus.

Kesimpulan

Kesimpulannya, ya, Anda dapat menemukan pekerjaan data scientist pada tahun 2022. Jika Anda memulai dari awal atau mengerjakan konversi yang berkelanjutan, hal itu mungkin memerlukan usaha.

Jika Anda masih ragu, saya sarankan meluangkan waktu untuk mencari tahu pekerjaan mana yang terbaik untuk Anda. Ilmu data bukanlah sumber peluang kerja yang bagus: Saya sarankan Anda mempelajarinya hanya jika Anda benar-benar menyukainya. Anda juga dapat melihat deskripsi pekerjaan dari banyak pekerjaan TI lainnya yang ada dan berkembang saat ini.

Saya harap artikel ini memberi Anda beberapa wawasan tentang cara menghabiskan waktu Anda saat berlatih untuk pekerjaan ilmu data pada tahun 2022. Terima kasih telah membaca, dan jangan ragu untuk terus mengikuti perkembangan matematika, statistik, dan ilmu data lainnya konten!