Teknik Segmentasi Pelanggan

2,233 Views

Average customer adalah konsep masa lalu, karena  bisnis jaman now harus dapat menyegmentasikan basis pelanggan mereka ke dalam kelompok dan menyesuaikan pengalaman untuk setiap segmen pelanggan. Topik ini merupakan salah satu contoh di mana kita akan menggunakan machine learning dan data science yang umumnya digunakan di industri, dan memahami cara melakukannya serta melakukan analisis di dalamnya sangatlah berharga. Mari pelajari bagaimana bisnis jaman now dapat mempersonalisasi pengalaman dengan segmentasi pelanggan.

Teknik segmentasi sebenarnya sudah saya pernah bahasa, sesuai dengan pengalaman yang sudah saya kerjakan ditempat kerja saya sendiri, bisa kalian baca disini, untuk memahami cara teknis kerja tersebut, kalian bisa pelajari teknik merging dan clustering data

Perbedaan yang saya akan bahas disini berupa cara melakukan cleansing data serta melibatkan banyak produk dan bersifat customers-centric.

Tulisan ini lumayan panjang, jadi simak saja baik-baik dan sambil ngopi juga boleh!

Read more

Library Machine Learning di Octave

1,987 Views

Kabar gembira buat kalian yang menggunakan Octave dalam project machine learning dan tidak perlu library pihak ketiga karena pure/murni ditulis menggunakan Octave serta menarik lainnya adalah opensource.

Tujuan dari repositori ini bukanlah untuk mengimplementasikan algoritma machine learning menggunakan pustaka pihak ketiga melainkan untuk berlatih dan untuk lebih memahami matematika di balik setiap algoritma. Ini adalah upaya untuk mempelajari beberapa topik pembelajaran mesin (yang dijelaskan di mind mapping di bawah)

Read more

Python Pandas Merging DataFrames

6,538 Views

Sebagai Data Scientist, kita akan sering menemukan bahwa kita diharuskan untuk menganalisis data dari berbagai sumber data dalam satu waktu. Agar berhasil mencapai ini, kita harus dapat menggabungkan sumber data yang berbeda menggunakan berbagai metode secara efisien. Hari ini kita akan melihat penggunaan fungsi Pandas built-in .merge() untuk menggabungkan dua sumber data menggunakan beberapa metode penggabungan yang berbeda.

Bagi kalian yang baru mengenal data science atau belum pernah menggunakan Python Pandas, sebaiknya mulai terlebih dahulu membaca buku yang saya tulis disini.  Buku tersebut akan memberi kalian petunjuk penginstalan dan pengetahuan latar belakang untuk postingan hari ini.

Read more

Pelajari Dasar-Dasar HTML untuk Pemula Hanya dalam 15 Menit

3,711 Views

Jika kalian ingin membangun website, bahasa pertama yang perlu pelajari adalah HTML.Pada artikel ini, kita akan membahas dasar-dasar HTML. Pada akhirnya, kita akan membuat situs web dasar hanya dengan menggunakan HTML.

Apa Itu HTML?

HTML, singkatan dari Hypertext Markup Language, adalah bahasa yang cukup sederhana. Ini terdiri dari elemen berbeda yang kami gunakan untuk menyusun halaman web. Kalian bisa melihat struktur HTML melalui ilustrasi berikut

Read more

Seberapa Cepat C++ Dibandingkan dengan Python?

2,071 Views

Ada jutaan alasan untuk menyukai Python (terutama untuk data scientist). Tetapi bagaimana Python berbeda dari bahasa pemrograman tingkat rendah yang lebih profesional seperti C atau C ++? Saya kira ini adalah pertanyaan yang banyak data scientist atau pengguna Python tanyakan atau tanyakan pada diri mereka sendiri suatu hari nanti. Ada banyak perbedaan antara Python dan bahasa seperti C ++. Untuk artikel ini, saya akan menunjukkan kepada kalian seberapa cepat C ++ dibandingkan dengan Python dengan contoh yang sangat sederhana.

Untuk menunjukkan perbedaannya yaitu saya menggunakan kasus permutasi DNA yang melibatkan proses looping. Permutasi DNA untuk menghasilkan semua kemungkinan k-mers DNA untuk nilai tetap “k”. Saya memilih contoh ini karena banyak tugas pemrosesan dan analisis data terkait genomik (misalnya, generasi k-mers) dianggap intensif secara komputasi. Itulah alasan mengapa banyak data scientist di bidang bioinformatika tertarik dengan C ++ (selain Python).

Read more

Menjadikan Python lebih cepat

2,765 Views

Python adalah salah satu bahasa pemrograman paling populer di kalangan developer namun karena kecepatannya yang rendah maka banyak perusahaan menulis ulang aplikasi mereka dalam bahasa lain setelah kecepatan Python menjadi hambatan bagi pengguna. Tetapi bagaimana jika ada cara untuk mempertahankan fitur-fitur mengagumkan Python dan meningkatkan kecepatannya? Solusinya pada menggunakan pypy

Read more

Decompose Citra dalam bit-planes

1,809 Views

Suatu citra digital yang mengandung kedalaman 256 warna atau 2^8 kombinasi warna pada format abu-abu dapat kita representasikan dalam multi level yang terdiri dari n-bit. Misalkan saja kita mempunyai nilai pixel 190 yang bisa konversikan kedalam 8bit menghasilkan 10111110 dengan urutan bit 8-7-6-5-4-3-2-1

  • Nilai bit ke 8 disebut dengan the most significant bit-planes (MSB) yaitu bernilai 1 pada contoh diatas
  • Nilai bit ke 1 disebut dengan the least significant planes (LSB) yaitu bernilai 0 pada contoh diatas

Read more

Package Pandas dan Dplyr

2,010 Views

Python dan R adalah bahasa pemrograman yang mendominasi dalam ekosistem data science. Keduanya menyediakan banyak paket dan kerangka kerja untuk melakukan analisis dan manipulasi data yang efisien. Pada artikel ini, kami akan membandingkan dua perpustakaan yang sangat populer dalam hal manipulasi data dan tugas transformasi / berbasis data frame tabel.

  • Pandas: Analisis data dan pustaka manipulasi untuk Python
  • Dplyr: Paket manipulasi data untuk R

Contoh berikut terdiri dari beberapa tugas sederhana yang diselesaikan oleh panda dan dplyr. Ada banyak pilihan untuk menggunakan paket ini. Saya menggunakan R-studio IDE untuk R dan Spyder untuk Python.

Read more

Menambahkan modul TL SSL

2,065 Views

Apa itu modul SSL: SSL (Secure Socket Layer) adalah lapisan keamanan untuk melindungi transaksi di website Anda dengan teknologi enkripsi data yang canggih. Pada website dengan SSL maka alamatnya berubah menjadi https dan muncul tanda padlock (gembok) di address bar browser yang bisa di-klik untuk melihat jenis SSL, teknologi enkripsi yang dipakai dan siapa identitas pemilik website. Kayak di web ini menggunakan https://softscients.com bukan https://softscients.com. Biasanya SSL digunakan pada payment gateway agar pertukaran antar data terutama login password diwebsite tidak bersifat plain karena sudah di enkripsi. Kalian bisa koq melihat POST dan GET sebuah pertukaran data yang terjadi antara sisi client dan server menggunakan aplikasi wireshark. Berikut kegunaan SSL utama menggunakan SSL:

Read more

Percepat Algoritma K-Means Clustering

2,260 Views

Pengelompokan Data K-means adalah algoritma yang kuat untuk pencarian kemiripan. Ada banyak library yang cukup cepat dalam menerapkan K-Means Clustering  salah satunya yaitu faiss Facebook AI Research menjadi juara yang terbaik. Melalui beberapa baris kode yang dibagikan dalam demonstrasi ini, faiss mengungguli implementasinya dalam kecepatan dan akurasi scikit-learn. #matlab

K-Means adalah algoritma iteratif, yang mengelompokkan titik data menjadi k cluster, masing-masing diwakili dengan mean / titik pusat (centroid). Pelatihan dimulai dengan beberapa tebakan awal dan kemudian berganti-ganti antara dua langkah: tugas dan pembaruan/update.

Read more