Format Anotasi Gambar pada Deep Machine Learning

3,547 Views

Kompetisi dalam deep machine learning membutuhkan jutaan dataset dan membutuhkan waktu belasan dan bahkan puluhan jam dalam sesi training. Pengalaman saya sendiri membutuhkan waktu 18 jam karena butuh 5000 dataset dengan ukuran 128×128.

Read more

Optimalkan hasil Deteksi Objek dengan Non max suppression

3,816 Views

Optimalkan hasil Deteksi Objek dengan Non max suppression –  merupakan algoritma yang dikembangkan untuk menghasilkan solusi ketika hasil object detection yang overlapping. Cerita ini dimulai ketika saya bekerja untuk sebuah project yang melibatkan proses object detection menggunakan deep learning yaitu untuk menentukan lokasi plate number pada sebuah vendor parking management. Setelah melakukan urusan data enginer yang bertugas melakukan labeling satu-persatu menggunakan format PASCALVOC

Read more

Machine Learning dengan PlaidML

1,532 Views

Machine Learning dengan PlaidML – PlaidML adalah kompiler tensor canggih dan portabel untuk memungkinkan kalian melakukan deep machine learning keberagam device pada laptop, perangkat tertanam-embedded, atau perangkat lain

Plaid ML merupakan favorit saya saat ini, karena sangat menjengkelkan sekali ketika menggunakan tensorflow! Tensorflow dari versi 1 loncat ke versi 2 banyak sekali perubahan! Sehingga beberapa project saya tidak bisa digunakan lagi (kecuali coding ulang bila perlu) Bayangin saja hal tersebut! Machine Learning pool banyak depencies nya, pusing kalau banyak versi.

Read more

Manajemen File dan Folder di R

2,095 Views

Manajemen File dan Folder di R seringkali kita temui pada saat membuat aplikasi – algoritma, misalkan saja untuk menyimpan file pada suatu folder khusus sehingga diperlukannya operasi untuk cek exists suatu folder terlebih dahulu atau langsung create sehingga aplikasi tidak mengalami error.

Perkembangan R saat ini sangat luas digunakan oleh hal tersebut untuk mempermudah saya akan bahas beberapa perintah pada R yang berkaitan dengan manajemen File dan Folder di R.

Read more

Manajemen File menggunakan Python

6,210 Views

Manajemen File menggunakan Python sangat penting untuk memudahkan kita dalam melakukan otomatisasi file seperti pengecekan direktori kerja, membuat direktori/folder, cek keberadaan file. Bahkan saya sering menggunakan python untuk melakukan tersebut jauh lebih baik daripada menggunakan file explorer bawaan windows, pernah suatu kali saya menghapus ratusan ribu file lebih cepat menggunakan python lho! hal ini dikarenakan bila menggunakan file explorer diperlukan mekanisme recycle bin jadi agak lama prosesnya. OK langsung saja, saya akan bahas beberapa perintah manajemen file menggunakan Python yang sering digunakan dalam kegiatan sehari-hari.

Read more

Model Simulasi Monte Carlo

3,973 Views

Jika suatu sistem mengandung elemen yang mengikut sertakan faktor kemungkinan,
model yang digunakan adalah model Monte Carlo. Dasar dari simulasi Monte Carlo adalah percobaan elemen kemungkinan dengan menggunakan sampel random (acak). Metode ini terbagi dalam 5 tahapan:

Read more

Text Preprocessing dan text minning

5,882 Views

Text Minning – atau dialih bahasakan menjadi penambangan teks yaitu proses ekstraksi informasi dan pengetahuan yang berguna dari sejumlah besar sumber data teks, seperti dokumen Word, PDF, kutipan teks, dll

Tujuan dari text minning yaitu untuk mendapatkan  konten inti dari sebuah dokumen teks menjadi sebuah data kuantitatif secara cepat. Misalkan saja ketika kita membaca sebuah artikel/koran yang berisi teks yang panjang maka dengan text minning akan menghasilkan kesimpulannya berupa hightlight – text summarization nya. Saya rangkum dari beberapa sumber mengenai tujuan dari text minning yaitu (Milkha Harlian Ch. Referensi: Raymond J. Mooney. CS 391L: Machine Learning Text Categorization. Univerisity of Texas as Austin, 2006)

Read more

Membuat Document Term Matrix

5,649 Views

Document Term Matrix merupakan algoritma – Metode perhitungan yang sering kita temui dalam text minning. Document Term Matrix merupakan sebuah representasi numerik dari dokumen dalam corpus. Corpus hanyalah kumpulan dokumen. Dengan kumpulan kata yang “lebih besar” ini,

Melalui Document Term Matrix, kita dapat melakukan analisis yang lebih menarik. Mudah untuk menentukan jumlah kata individual untuk setiap dokumen atau untuk semua dokumen. Misalkan untuk menghitung agregat dan statistik dasar seperti jumlah istilah rata-rata, mean, median, mode, varians, dan deviasi standar dari panjang dokumen, serta dapat mengetahui istilah mana yang lebih sering dalam kumpulan dokumen dan dapat menggunakan informasi tersebut untuk menentukan istilah mana yang lebih mungkin “mewakili” dokumen tersebut.

Penggunaan Document Term Matri adalah cara yang cukup sederhana untuk merepresentasikan dokumen sebagai struktur numerik. Merepresentasikan teks sebagai struktur numerik adalah titik awal umum untuk penambangan teks dan analitik seperti pencarian dan peringkat, membuat taksonomi, kategorisasi, kesamaan dokumen, dan pembelajaran mesin berbasis teks. Misalkan

Read more

Function apply(), lapply(), sapply(), tapply()

5,650 Views

Function apply(), lapply(), sapply(), tapply() – Merupakan function yang sangat berguna sekali ketika kita bekerja dengan operasi yang bersifat looping.

Tulisan ini bertujuan untuk memperkenalkan kumpulan fungsi apply() yang merupakan fungsi yang paling dasar dari semua kumpulan fungsi pengganti looping. Selain itu ada fungsi: sapply(), lapply() dan tapply().

Read more