Tag Archives: Belajar Text Minning

Cleaning Text Bahasa Indonesia

By | November 21, 2021

563 Views— Cleaning Text Bahasa Indonesia- Menggunakan library yang telah dibahas sebelumnya, saya sudah membuat aplikasi kecil yang telah diupload di https://mulkan.shinyapps.io/Text_Cleaning. Aplikasi sudah menggunakan spelling dan stemming menggunakan bahasa indonesia. Caranya cukup mudah digunakan, kalian buat terlebih dahulu file excel dan didalamnya harus ada nama kolom Text atau menggunakan dataset https://github.com/rizalespe/Dataset-Sentimen-Analisis-Bahasa-Indonesia/blob/master/dataset_tweet_sentiment_opini_film.csv kemudian simpan dalam bentuk… Read More »

Text Cleaning dengan Spelling Bahasa Indonesia

By | November 21, 2021

757 ViewsText Cleaning dengan Spelling Bahasa Indonesia – Text cleaning menggunakan library TM yang telah dibahas sebelumnya mengingatkan bahwa urutan cleaning menjadi sangat penting. Hal ini menjadi maklum kerja bahasa itu berkembang sesuai penutur, terdapat banyak istilah-istilah baru sehingga perbaikan kamus mutlak perlu dilakukan. Namun urusan stopword dan stemming tidaklah cukup! karena untuk urusan typo/salah… Read More »

Text cleaning menggunakan library TM

By | October 23, 2021

760 ViewsText cleaning menggunakan library TM – Artikel ini kelanjutan dari https://softscients.com/2021/02/21/text-preprocessing/ yang memisahkan function pre procesing tersendiri telah dibahas juga cara membuat Term Document Matrix – https://softscients.com/2021/02/16/membuat-document-term-matrix/ serta cara menghitung Term Frequency – Inverse Document Frequency – https://softscients.com/2021/06/05/cara-menghitung-term-frequency-dan-inverse-document-frequency/ Kesemuanya menggunakan library RtextTools yang merupakan turunan dari library TM, nah artikel yang ini akan lebih… Read More »

Cara menghitung term frequency dan inverse document frequency

By | January 14, 2022

2,513 ViewsCara menghitung term frequency dan inverse document frequency atau sering disingkat menjadi TF – IDF merupakan nilai yang penting dalam text minning. Nah dalam postingan kali ini, saya akan bahas cara mendapatkan nilai tersebut serta cara menghitung manualnya, tentunya saya anggap kalian sudah baca mengenai document term matrix membuat document term matrix Belajar Statistik… Read More »

Text Preprocessing dan text minning

By | October 23, 2021

1,566 ViewsText Minning – atau dialih bahasakan menjadi penambangan teks yaitu proses ekstraksi informasi dan pengetahuan yang berguna dari sejumlah besar sumber data teks, seperti dokumen Word, PDF, kutipan teks, dll Tujuan dari text minning yaitu untuk mendapatkan  konten inti dari sebuah dokumen teks menjadi sebuah data kuantitatif secara cepat. Misalkan saja ketika kita membaca… Read More »

Membuat Document Term Matrix

By | October 23, 2021

1,299 ViewsDocument Term Matrix merupakan algoritma – Metode perhitungan yang sering kita temui dalam text minning. Document Term Matrix merupakan sebuah representasi numerik dari dokumen dalam corpus. Corpus hanyalah kumpulan dokumen. Dengan kumpulan kata yang “lebih besar” ini, Melalui Document Term Matrix, kita dapat melakukan analisis yang lebih menarik. Mudah untuk menentukan jumlah kata individual… Read More »