k-nearest neighbors Distance – kNNDist

2,006 Views— k-nearest neighbors Distance – kNNDist  adalah salah satu function yang digunakan menghitung nilai eucleid distance antara i dengan i+1 … n pada sebuah dataset. Function KnnDist seringkali digunakan untuk menghitung jumlah K / kelas pada algoritma dbscan. Algoritma Clustering DBScan berbeda dengan KMeans Clustering, dimana untuk KMeans Clustering terlebih dahulu ditentukan jumlah K/kelas … Read more

Daftar Library Machine Learning

1,448 ViewsDaftar Library Machine Learning – Urusan machine learning saat ini terasa lebih mudah dibandingkan 1o tahun yang lalu karena perkembangan teknologi open source sehingga banyak developer yang membuat tools/library yang bisa diakses oleh para komunitas. Library machine learning saat ini ada banyak sekali tapi yang lagi ngetrend yaitu menggunakan bahasa R dan Python. Namun … Read more

Deep Learning Machine

1,589 Views— Deep Learning Machine — Library Deep Learning saat ini banyak dikembangkan dengan menggunakan bahasa python, adapun beberapa bahasa seperti C++ yaitu caffe2 dan banyak lainnya tidak begitu berkembang. Setiap bahasa dan library berkembang dengan adanya komunitas penggunanya. Hemm… bagaimana dengan bahasa seperti java?! Apakah ada library yang mempermudah deep learning dengan java? Deep … Read more

Yuk Belajar Tuning Model

3,146 Views

Tuning Model adalah salah satu kerjaan dari data science lho setelah mendapatkan dataset dari data engineer. Tuning model bisa dimulai dari goal yang ingin dicapai dengan cara memilih algoritma yang tepat! ada banyak sekali algoritma yang bisa kita gunakan seperti klasifikasi, clustering, segmentation bisa menggunakan statistik biasa bahkan deep machine learning! Saya ambil contoh pada kasus sebelumnya yaitu klasifikasi fruit berdasarkan mean RGB.

Read more

Integrasi Machine Learning API WEKA dengan Java

1,975 Views

WEKA – merupakan tools yang dibuat oleh universitas wakaito yang berbasis java sebagai implementasi java di ranah machine learning. Tampilan WEKA juga sangat sederhana dan fokus pada fungsionalitas. Berbasis Open Source memudahkan penggunaan API WEKA bila para developer ingin menggunakan kemampuan WEKA  seutuhnya.

Machine learning sudah sangat luas digunakan oleh dunia industri, seperti hitachi – https://community.hitachivantara.com/s/global-search/weka

Dibanding dengan bahasa Python /R maka untuk membuat library machine learning di java agak lebih susah karena termasuk bahasa imperatif serta untuk run nya pun harus di compile sama seperti bahasa C/C++/C# ataupun bahasa Pascal/Basic. Sehingga alangkah baiknya untuk para developer lebih baik menggunakan library yang sudah ada. API WEKA bisa kalian temui dokumentasinya disini https://waikato.github.io/weka-wiki/.

Read more

Apa itu format TFRecordDataset

2,937 Views

apa itu format TFRecordDataset – merupakan format binary khusus untuk tensorflow, didalam TF Record Dataset akan terdiri dari description (biasanya untuk sharing antar bahasa menggunakan format protobuffer)

Sesuai penjelasan dari https://www.tensorflow.org/api_docs/python/tf/data/TFRecordDataset (kalian gunakan Tensorflow 2.0 keatas ya!)

TF Record Dataset menggunakan parsing dan decoding yang dimiliknya sendiri! Itu artinya kalian wajib melakukan deklarasi untuk melakukan encoding/decoding. Dalam kasus tertentu yang mellibatkan banyak binary file seperti format gambar, serta array dalam bentuk numpy perlu mekanisme tertentu agar bisa dimasukan kedalam TF Record Dataset.

Read more