5 Kualifikasi menjadi Data Science

By | January 21, 2021
1,260 Views

Apa kualifikasi yang paling banyak diminta untuk posisi data science? itu adalah pertanyaan yang sangat penting bagi kalian yang akan memilih karir di bidang data data science. Kualifikasi ini diharapkan tidak hanya diperlukan pada saat wawancara, tetapi juga hanya kualifikasi penting yang harus diingat dalam pekerjaan kalian saat ini!

Data Science selalu berkembang sehingga sangat penting untuk menyadari teknologi baru di lapangan. Persyaratan ini mungkin berbeda dari pengalaman pribadi kalian masing-masing, jadi harap diingat bahwa artikel ini berasal dari pendapat kami pribadi.

1. Programming

Sebagai seorang data science, ketika saya pertama kali belajar,  hal yang penting adalah untuk memiliki semacam kemahiran dalam bahasa pemrograman. Kalian dapat mempelajari matematika tingkat lanjut, statistik, machine learning, teori umum, dan proses data science terlebih dahulu sebelum mempelajari cara membuat kode. Bagaimanapun juga data science banyak melibatkan dataset yang cukup besar sehingga akan sangat merepotkan bila kalian kerjakan secara manual dengan hanya mengandalkan excel saja!

Dalam pengalaman pemrograman saya, kuasai bahasa R lalu akhirnya ke Python. Saya pikir perkembangan ini adalah cara yang bagus untuk perlahan-lahan masuk ke dalam pemrograman. Kedua bahasa tersebut menyediakan banyak package/library dengan jumlah komunitas yang aktif berkembang. Namun demikian kalian bisa juga mencoba seperti Octave dan Julia.

2. Business Savvy and Intelligence

Kualifikasi berikutnya sering kali dilewati dengan sertifikasi dan pengalaman pendidikan umum. Menjadi paham bisnis dan cerdas bisnis berarti memahami bisnis dengan baik dan mengetahui mengapa kalian membutuhkan data science sejak awal. Mudah untuk mulai menerapkan algoritma machine learning tingkat lanjut langsung ke data perusahaan, tetapi kasus penggunaan bisnis perlu ditetapkan dan diperiksa secara menyeluruh untuk memberikan laba atas investasi terbesar.

See also  Pelajaran prinsip desain revolusi industri

Misalnya, jika kalian dapat mengklasifikasikan jenis kopi dengan beberapa algoritma computer vision, maka kalian harus memahami mengapa mengklasifikasikan jenis kopi itu berguna. Apakah karena akan lebih efisien? Apakah karena manual, klasifikasi manusia tidak akurat? Selain memahami masalah bisnis

Disinilah letak pemahaman mengenai “paham bisnis”, kalian biasanya perlu bekerja sama dengan Manajer Produk untuk menentukan berapa banyak uang dan waktu proyek data science akan memberikan add value terhadap perusahaan.

Setelah kalian memiliki pemahaman tentang kebutuhan bisnis, dan terbiasa menemukan kebutuhan bisnis dengan lebih cepat, kalian akan memiliki kualifikasi yang baik dalam aspek bisnis data science. Selanjutnya mungkin perlu memberikan bukti mengapa algoritme yang kamu pilih berguna dalam memecahkan masalah ini. Setelah kalian mendapatkan dukungan dari perusahaan,  maka kalian dapat bekerja dan meningkatkan proses saat ini dan mulai memamerkan hasil algoritma yang terbaik.

Berikut adalah beberapa cara untuk memastikan kalian memiliki pengetahuan bisnis dan kualifikasi intelijen dalam perusahaan

  • mempelajari produk, kesulitan umum, dan solusi produk populer
  • berlatih atau mempelajari manajemen produk
  • memiliki pengetahuan yang kuat tentang analisis data memahami metrik utama untuk bisnis apa pun (seperti jumlah kunjungan, frekuensi pembelian) Kalian bisa pelajari mengenai RFM

Secara keseluruhan, menggunakan dan mempelajari analisis bisnis dalam kaitannya dengan data science, adalah kualifikasi yang sangat penting untuk dimiliki dalam resume dan pekerjaan kalian saat ini!

3. Statistics and Mathematics

Dengan asumsi kalian sudah mahir menggunakan pustaka atau paket Machine Learning, dan jika sudah memiliki setidaknya pemahaman umum tentang penghitungan statistik, kalian akan memenuhi syarat. Matematika dan statistik tertentu dapat sangat berguna untuk diketahui saat melakukan eksperimen yang berhubungan dengan signifikansi. Beberapa statistik data science penting yang dapat membantu memenuhi syarat meliputi yang berikut ini.

  • hypothesis-testing
  • probability distributions
  • Bayesian thinking
  • oversampling

4. Machine Learning

Kualifikasi ini lebih merupakan pengingat bahwa hampir ada algoritma Pembelajaran Mesin baru dan terbaik setiap tahun yang harus kalian pelajari dan latih (seperti layaknya kompetisi imagenet dari google). Misalnya, banyak Data Science menggunakan algoritme Random Forest Machine Learning, dan kemudian menyadari bahwa semua kompetisi Data Science telah menggunakan XGBoost sebagai gantinya. Oleh karena itu, sangat bermanfaat untuk selalu mengikuti perkembangan dalam komunitas Data Science. Artinya kalian harus selalu update perkembangan terbaru.

Saya sarankan untuk mengunjungi yaitu www.kaggle.com. Situs ini berfungsi sebagai komunitas Data Science tempat yang dapat berkolaborasi, berbagi kode, mempelajari, dan mengajukan pertanyaan tentang Data Science.

5. Visualization

Terakhir, adalah kualifikasi visualisasi. Sebagai Data scientist, penting untuk mengetahui cara membuat kode, menggunakan algoritme Machine Learning, dan memiliki pemahaman bisnis yang baik, jadi salah satu cara untuk menyatukan semua aspek ini adalah dengan melakukan visualisasi. Berikut adalah beberapa alat visualisasi yang populer dan berguna:

  • Tableau
  • Google Data Studio
  • Looker
  • MatPlotLib
  • Seaborn
  • Pandas Profiling

Beberapa cara yang kalian dapat lakukan yaitu dengan memvisualisasikan proses data science adalah dengan analisis data eksplorasi, masalah bisnis dan datanya masing-masing, metrik kesalahan atau keakuratan, dan bagaimana hasil model data science telah meningkatkan bisnis sehingga meningkatkan add value perusahaan.

 

See also  Mengapa Python adalah bahasa paling populer untuk Data Science