Perbandingan Clustering KMeans dengan DBSCAN

5,049 Views

Perbandingan Clustering KMeans dengan DBSCAN – Postingan ini akan memberikan kalian perbandingan kinerja mengenai algoritma Clustering KMeans dengan DBSCAN. Untuk menilai berapa jumlah cluster yang terbaik, bisa kalian baca disini atau disini.

Algoritma KMeans telah banyak dibahas dan banyak digunakan secara umum karena sangat mudah, namun demikian algoritma ini kurang begitu tahan ketika terjadi overlapping data. Kalian bisa melihat plot dataset berikut

Read more

Share Aplikasi R di ShinyApps

2,681 Views

ShinyApps – Share Aplikasi R di ShinyApps dengan mudah agar bisa diakses via web secara online – Share Aplikasi mu di R ShinyApps ketika saya bekerja dengan project yang ditulis menggunakan R maka sesi demo untuk menunjukan progress project perlu dilakukan. Klien menginginkan sebuah aplikasi berbasis GUI di R, tentu hal yang mudah dilakukan yaitu mengubah aplikasi tersebut di RShiny.

Read more

Cara Mudah Split Dataset

5,094 Views

Split Dataset termasuk dalam tahapan pre prosesing untuk mendapatkan dataset yang proporsional. Secara umum split dataset harus memasukan sebuah porsi, misalkan disebut porsi 0.75 artinya 75% dimasukan dataset training serta sisanya dimasukan kedalam testing.

Artikel split dataset sudah saya bahas disini, namun demikian agak terlalu ribet karena banyak kode yang harus dibuat. Nah pada postingan ini, saya akan bahasa cara mudah split dataset di R menggunakan library caTools

Read more

Manajemen File dan Folder di R

2,108 Views

Manajemen File dan Folder di R seringkali kita temui pada saat membuat aplikasi – algoritma, misalkan saja untuk menyimpan file pada suatu folder khusus sehingga diperlukannya operasi untuk cek exists suatu folder terlebih dahulu atau langsung create sehingga aplikasi tidak mengalami error.

Perkembangan R saat ini sangat luas digunakan oleh hal tersebut untuk mempermudah saya akan bahas beberapa perintah pada R yang berkaitan dengan manajemen File dan Folder di R.

Read more

Model Simulasi Monte Carlo

3,977 Views

Jika suatu sistem mengandung elemen yang mengikut sertakan faktor kemungkinan,
model yang digunakan adalah model Monte Carlo. Dasar dari simulasi Monte Carlo adalah percobaan elemen kemungkinan dengan menggunakan sampel random (acak). Metode ini terbagi dalam 5 tahapan:

Read more

Text Preprocessing dan text minning

5,893 Views

Text Minning – atau dialih bahasakan menjadi penambangan teks yaitu proses ekstraksi informasi dan pengetahuan yang berguna dari sejumlah besar sumber data teks, seperti dokumen Word, PDF, kutipan teks, dll

Tujuan dari text minning yaitu untuk mendapatkan  konten inti dari sebuah dokumen teks menjadi sebuah data kuantitatif secara cepat. Misalkan saja ketika kita membaca sebuah artikel/koran yang berisi teks yang panjang maka dengan text minning akan menghasilkan kesimpulannya berupa hightlight – text summarization nya. Saya rangkum dari beberapa sumber mengenai tujuan dari text minning yaitu (Milkha Harlian Ch. Referensi: Raymond J. Mooney. CS 391L: Machine Learning Text Categorization. Univerisity of Texas as Austin, 2006)

Read more

Membuat Document Term Matrix

5,659 Views

Document Term Matrix merupakan algoritma – Metode perhitungan yang sering kita temui dalam text minning. Document Term Matrix merupakan sebuah representasi numerik dari dokumen dalam corpus. Corpus hanyalah kumpulan dokumen. Dengan kumpulan kata yang “lebih besar” ini,

Melalui Document Term Matrix, kita dapat melakukan analisis yang lebih menarik. Mudah untuk menentukan jumlah kata individual untuk setiap dokumen atau untuk semua dokumen. Misalkan untuk menghitung agregat dan statistik dasar seperti jumlah istilah rata-rata, mean, median, mode, varians, dan deviasi standar dari panjang dokumen, serta dapat mengetahui istilah mana yang lebih sering dalam kumpulan dokumen dan dapat menggunakan informasi tersebut untuk menentukan istilah mana yang lebih mungkin “mewakili” dokumen tersebut.

Penggunaan Document Term Matri adalah cara yang cukup sederhana untuk merepresentasikan dokumen sebagai struktur numerik. Merepresentasikan teks sebagai struktur numerik adalah titik awal umum untuk penambangan teks dan analitik seperti pencarian dan peringkat, membuat taksonomi, kategorisasi, kesamaan dokumen, dan pembelajaran mesin berbasis teks. Misalkan

Read more

Function apply(), lapply(), sapply(), tapply()

5,662 Views

Function apply(), lapply(), sapply(), tapply() – Merupakan function yang sangat berguna sekali ketika kita bekerja dengan operasi yang bersifat looping.

Tulisan ini bertujuan untuk memperkenalkan kumpulan fungsi apply() yang merupakan fungsi yang paling dasar dari semua kumpulan fungsi pengganti looping. Selain itu ada fungsi: sapply(), lapply() dan tapply().

Read more

Shiny-Aplikasi R berbasis Web

6,460 ViewsShiny-Aplikasi R berbasis Web – Shiny adalah kerangka kerja /framework untuk membuat aplikasi web menggunakan kode R yang dirancang untuk pada data science tanpa pengetahuan HTML, CSS, atau JavaScript. Di sisi lain, Shiny tidak membatasi kita untuk membuat aplikasi sederhana namun Shiny telah dilengkapi dengan komponen antarmuka penggunanya dapat dengan mudah disesuaikan atau diperluas, … Read more

prython Lingkungan terintegrasi R dan Python

1,731 Views

prython adalah IDE baru yang memungkinkan kamu membuat kode dalam R atau Python (bahkan dapat menggunakan keduanya dalam proyek yang sama) dengan menghubungkan panel di kanvas. Ini memungkinkan untuk mengatur kode, melakukan eksperimen yang berjalan dengan satu klik, dan memvisualisasikan plot + kerangka data di sebelah panel. Bosan mengingat baris mana yang perlu dikomentari untuk menguji sesuatu? Atau apakah kamu hanya ingin mengatur kode mu dengan lebih baik? Saat ini tersedia untuk Windows, dan dijalankan dengan kernel R / Python lokal. Mengapa menggunakan prython?

Read more