Merge File CSV di Pandas: Panduan Lengkap dan Praktis

2,218 Views  Urusan Merge file memang sering kita jumpai, biasanya dikarena file tersebut time series karena mempunyai waktu yang berbeda-beda, misalkan saja pada file logger. Keuntungan file berbasis CSV yaitu readable alias dapat dibaca secara mudah menggunakan notepad sekalipun. Namun demikian dengan banyaknya file satu-persatu tentu akan sulit dianalisis. Merge File CSV merupakan salah satu … Read more

Install Python 2.7 dan 3.8

1,824 ViewsTerkadang kita masih saja membutuhkan python 2.7  padahal python yang terinstall di komputer sudah python 3.8. Hal ini wajar saja sih karena versi 2 ke 3 banyak sekali perubahan yang terjadi. Namun sayang nya masih banyak source code script yang masih ditulis untuk python 2.7 salah satunya adalah script buat web scanner WASCan. Bagi … Read more

Teori Normal Distribution

5,391 ViewsNormal Distribution adalah salah satu hal paling mendasar di alam semesta kita. Itu muncul hampir di mana-mana, di alam, sains, matematika. Bahkan fenomena paling gila seperti proton yang saling bertabrakan, aksi kerumunan orang, dll. Dapat dimodelkan menggunakan distribusi normal. Rumus umum mengenai teori normal distribution yaitu     dengan bilangan natural dan adalah standar … Read more

Teknik Segmentasi Pelanggan

2,230 Views

Average customer adalah konsep masa lalu, karena  bisnis jaman now harus dapat menyegmentasikan basis pelanggan mereka ke dalam kelompok dan menyesuaikan pengalaman untuk setiap segmen pelanggan. Topik ini merupakan salah satu contoh di mana kita akan menggunakan machine learning dan data science yang umumnya digunakan di industri, dan memahami cara melakukannya serta melakukan analisis di dalamnya sangatlah berharga. Mari pelajari bagaimana bisnis jaman now dapat mempersonalisasi pengalaman dengan segmentasi pelanggan.

Teknik segmentasi sebenarnya sudah saya pernah bahasa, sesuai dengan pengalaman yang sudah saya kerjakan ditempat kerja saya sendiri, bisa kalian baca disini, untuk memahami cara teknis kerja tersebut, kalian bisa pelajari teknik merging dan clustering data

Perbedaan yang saya akan bahas disini berupa cara melakukan cleansing data serta melibatkan banyak produk dan bersifat customers-centric.

Tulisan ini lumayan panjang, jadi simak saja baik-baik dan sambil ngopi juga boleh!

Read more

prython Lingkungan terintegrasi R dan Python

1,730 Views

prython adalah IDE baru yang memungkinkan kamu membuat kode dalam R atau Python (bahkan dapat menggunakan keduanya dalam proyek yang sama) dengan menghubungkan panel di kanvas. Ini memungkinkan untuk mengatur kode, melakukan eksperimen yang berjalan dengan satu klik, dan memvisualisasikan plot + kerangka data di sebelah panel. Bosan mengingat baris mana yang perlu dikomentari untuk menguji sesuatu? Atau apakah kamu hanya ingin mengatur kode mu dengan lebih baik? Saat ini tersedia untuk Windows, dan dijalankan dengan kernel R / Python lokal. Mengapa menggunakan prython?

Read more

Percepat Algoritma K-Means Clustering

2,255 Views

Pengelompokan Data K-means adalah algoritma yang kuat untuk pencarian kemiripan. Ada banyak library yang cukup cepat dalam menerapkan K-Means Clustering  salah satunya yaitu faiss Facebook AI Research menjadi juara yang terbaik. Melalui beberapa baris kode yang dibagikan dalam demonstrasi ini, faiss mengungguli implementasinya dalam kecepatan dan akurasi scikit-learn. #matlab

K-Means adalah algoritma iteratif, yang mengelompokkan titik data menjadi k cluster, masing-masing diwakili dengan mean / titik pusat (centroid). Pelatihan dimulai dengan beberapa tebakan awal dan kemudian berganti-ganti antara dua langkah: tugas dan pembaruan/update.

Read more

Pengenalan Angka Tulisan Tangan

5,153 Views

Ada banyak sekali penerapan machine learning dalam dunia nyata. Salah satunya yaitu teknologi pengenalan tulisan tangan. Ada sejumlah tantangan tersendiri dalam kasus ini yaitu banyaknya variasi tulisan tangan. Mengingat setiap tangan manusia bersifat unik sehingga hampir setiap orang mempunyai karakter/goresan pena yang berbeda untuk menulis.

Namun demikian sangat menarik sekali topik pembahasan machine learning menggunakan teknik deep machine learning dengan convolutional network, yups.

Read more

Belajar Algoritma Greedy

8,053 Views

Algoritma greedy merupakan jenis algoritma yang menggunakan pendekatan penyelesaian masalah dengan mencari nilai maksimum sementara pada setiap langkahnya. Nilai maksimum sementara ini dikenal dengan istilah local maximum. Pada kebanyakan kasus, algoritma greedy tidak akan menghasilkan solusi paling optimal, begitupun algoritma greedy biasanya memberikan solusi yang mendekati nilai optimum dalam waktu yang cukup cepat.

Sebagai contoh dari penyelesaian masalah dengan algoritma greedy, mari kita lihat sebuah masalah klasik yang sering dijumpai dalam kehidupan sehari-hari: mencari jarak terpendek dari peta. Misalkan kita ingin bergerak dari titik A ke titik B, dan kita telah menemukan beberapa jalur dari peta:

Read more