Apa Peran Data scientist bagi perusahaan
Sebagian besar alur kerja/cara kerja yang dilakukan oleh data scientist di organisasi/perusahaan sangat mirip. Banyak perusahaan mempekerjakan data scientist untuk memecahkan masalah bisnis serupa. Sebagian besar model yang dibuat tidak mengharuskan untuk menemukan solusi baru koq, tapi menggunakan model lama dengan dataset yang baru. Nantinya model/pendekatan yang akan kita ambil untuk memecahkan masalah berbasis data di organisasi-organisasi ini kemungkinan besar telah digunakan sebelumnya. Selain hal tersebut banyak tersedianya tools Machine Learning menjadikan urusan model berbasis prediktif menjadi lebih mudah.
Jadi, jika pemodelan prediktif menjadi lebih mudah dari waktu ke waktu, mengapa perusahaan/organisasi masih membutuhkan data scientist? Mengapa perusahaan tidak menggunakan kombinasi tools otomatis dan enginer machine learning untuk mengelola seluruh kasus-kasus di perusahaan mereka?
Jawabannya sederhana:
- Pertama, data scientist tidak pernah tentang menemukan kembali atau membangun algoritma yang sangat kompleks. Tapi peran tersebut bagi seorang data scientist yaitu untuk menambah nilai bagi organisasi dengan data. Dan di sebagian besar perusahaan, hanya sebagian kecil yang melibatkan pembuatan algoritma Machine learning (ini tugas seorang akademik yang ngurusin penemuan algoritma baru)
- Kedua, akan selalu ada masalah yang tidak dapat diselesaikan dengan tools otomatis. Banyak data yang bersifat mentah harus dibersihkan dan di aggregasi terlebih dahulu sebelum digunakan. Sebagai contoh, mengapa saya lebih suka menggunakan R/RStudio daripada SPSS? yup karena input data di SPSS harus dalam kondisi siap pakai, kalian butuh tools tambahan seperti excel untuk merapikan data. Hal ini berbeda dengan R/RStudio yang bisa kita koding untuk merapikan data seperti Pivot tabel/aggregasi data. Tools otomatis ini memiliki serangkaian algoritma tetap yang dapat kalian pilih, dan tentu bila masalah yang memerlukan kombinasi pendekatan untuk dipecahkan, maka kalian harus melakukannya secara manual. Meskipun ini tidak sering terjadi, maka Perusahaan perlu mempekerjakan orang yang cukup terampil untuk melakukan ini. Selain itu, tools otomatis tersebut tidak dapat melakukan pra-pemrosesan data atau pekerjaan berat apa pun yang dilakukan sebelum pembuatan model.
Sentuhan Manusia
Sebagai seseorang yang telah menciptakan solusi berbasis data untuk perusahaan rintisan dan perusahaan besar, situasinya sangat berbeda dengan berurusan dengan kumpulan data Kaggle/dummy. Tidak ada masalah yang tetap. Biasanya, kalian memiliki dataset dan diberi masalah bisnis. Terserah kalian untuk mencari tahu apa yang harus dilakukan dengan data pelanggan untuk memaksimalkan penjualan bagi perusahaan.
Ini berarti bahwa bukan hanya keterampilan teknis atau pemodelan yang diperlukan dari seorang data science. Kalian perlu menghubungkan data dengan masalah yang dihadapi. Serta perlu memutuskan sumber data eksternal yang dapat mengoptimalkan solusi yang kalian tawarkan nantinya.
Pra-pemrosesan data sangatlah panjang dan melelahkan, dan bukan hanya karena memerlukan keterampilan pemrograman yang kuat, tetapi karena kalian perlu bereksperimen dengan variabel yang berbeda dan relevansinya dengan masalah yang dihadapi.
Seperti perlunya mengaitkan akurasi model dengan metrik seperti rasio konversi.
Pembuatan model tidak selalu menjadi bagian dari proses ini. Terkadang, perhitungan sederhana mungkin cukup untuk melakukan tugas seperti peringkat pelanggan. Kecuali beberapa masalah yang mengharuskan kalian untuk benar-benar membuat model prediktif.
Pada akhirnya, nilai yang diberikan data science kepada organisasi terletak pada kemampuan mereka untuk menerapkan data ke kasus penggunaan di dunia nyata. Baik itu membangun model segmentasi, sistem rekomendasi, atau mengevaluasi potensi pelanggan, tidak ada manfaat nyata bagi organisasi kecuali hasilnya dapat ditafsirkan.
Selama seorang data science mampu memecahkan masalah dengan bantuan data dan menjembatani kesenjangan antara keterampilan teknis dan bisnis, peran tersebut akan terus berlanjut.