Category Archives: Belajar Coding

Text Cleaning dengan Spelling Bahasa Indonesia

By | July 30, 2024

3,258 ViewsText Cleaning dengan Spelling Bahasa Indonesia – Text cleaning menggunakan library TM yang telah dibahas sebelumnya mengingatkan bahwa urutan cleaning menjadi sangat penting. Hal ini menjadi maklum kerja bahasa itu berkembang sesuai penutur, terdapat banyak istilah-istilah baru sehingga perbaikan kamus mutlak perlu dilakukan. Namun urusan stopword dan stemming tidaklah cukup! karena untuk urusan typo/salah… Read More »

Text cleaning menggunakan library TM

By | July 30, 2024

3,749 ViewsText cleaning menggunakan library TM – Artikel ini kelanjutan dari https://softscients.com/2021/02/21/text-preprocessing/ yang memisahkan function pre procesing tersendiri telah dibahas juga cara membuat Term Document Matrix – https://softscients.com/2021/02/16/membuat-document-term-matrix/ serta cara menghitung Term Frequency – Inverse Document Frequency – https://softscients.com/2021/06/05/cara-menghitung-term-frequency-dan-inverse-document-frequency/ Kesemuanya menggunakan library RtextTools yang merupakan turunan dari library TM, nah artikel yang ini akan lebih… Read More »

Cara menghitung term frequency dan inverse document frequency

By | July 30, 2024

12,602 ViewsCara menghitung term frequency dan inverse document frequency atau sering disingkat menjadi TF – IDF merupakan nilai yang penting dalam text minning. Nah dalam postingan kali ini, saya akan bahas cara mendapatkan nilai tersebut serta cara menghitung manualnya, tentunya saya anggap kalian sudah baca mengenai document term matrix membuat document term matrix Belajar Statistik… Read More »

Masalah RStudio pada Plots dan Graphics Device

By | April 4, 2022

4,939 ViewsMenggunakan R dengan RStudio untuk melakukan analisis data menjadi bagian yang kesatuan apalagi ditambah dengan ggplot sebagai plot grafiknya. Namun terkadang terjadi sedikit masalah, hal ini biasa terjadi mengingat ketika memanggil plot grafik di R kurang lengkap sehingga grafik R akan keluar terdistorsi atau bagian-bagian tertentu akan hilang (legenda, garis, dll.). Ini umumnya karena… Read More »

Apa itu format TFRecordDataset

By | July 30, 2024

2,905 Viewsapa itu format TFRecordDataset – merupakan format binary khusus untuk tensorflow, didalam TF Record Dataset akan terdiri dari description (biasanya untuk sharing antar bahasa menggunakan format protobuffer) Sesuai penjelasan dari https://www.tensorflow.org/api_docs/python/tf/data/TFRecordDataset (kalian gunakan Tensorflow 2.0 keatas ya!) TF Record Dataset menggunakan parsing dan decoding yang dimiliknya sendiri! Itu artinya kalian wajib melakukan deklarasi untuk… Read More »

Protocol Buffers

By | June 2, 2021

2,061 ViewsProtocol Buffers – Apakah kalian sering menggunakan beragam bahasa dalam membuat aplikasi? Kalau iya, berarti perlunya sebuah standar format serialisasi data sebagai wadah dalam melakukan sharing. Kalau dalam protokol HTTP, kita terbiasa menggunakan format JSON, XML. Bila kalian menggunakan python yaitu pickle. Namun format pickle hanya bisa dibaca untuk python! Bagaimana bila data tersebut… Read More »

Segmentation with Mobile Device

By | April 4, 2022

1,655 ViewsSegmentation with Mobile Device – Baru-baru ini, tim kami bekerja untuk membuat aplikasi di ponsel pintar dengan sistem android. Aplikasi ini berguna untuk melakukan capture image dan melakukan classification secara onsite sehingga dibutuhkan portable device. Tentu pilihan jatuh terhadap SDK yang sudah teruji, tim kami menggunakan firebase ML sebagai core nya.  Didalam contoh SDK… Read More »