Definisi lain mengatakan Naïve Bayes merupakan pengklasifikasian dengan metode probabilitas dan statistik yang dikemukan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi peluang di masa depan berdasarkan pengalaman di masa sebelumnya.
Naïve Bayes didasarkan pada asumsi penyederhanaan bahwa nilai atribut secara kondisional saling bebas jika diberikan nilai output. Dengan kata lain, diberikan nilai output, probabilitas mengamati secara bersama adalah produk dari probabilitas individu. Keuntungan penggunaan Naive Bayes adalah bahwa metode ini hanya membutuhkan jumlah data pelatihan (Training Data) yang kecil untuk menentukan estimasi paremeter yang diperlukan dalam proses pengklasifikasian. Naive Bayes sering bekerja jauh lebih baik dalam kebanyakan situasi dunia nyata yang kompleks dari pada yang diharapkan
Naive Bayes merupakan algoritma yang dapat digunakan untuk binary clasifier yang sederhana menggunakan konsep probabilitas. Berikut Perhitungan Manual Naives Bayes yang dapat kalian pelajari secara mudah.
Berikut adalah dataset riwayat nasabah yang mengajukan kredit di BANK. Penilaian kredit didasarkan pada 2 fitur yaitu penghasilan dan luas rumah sebagai agunan. Data kredit di BANK dengan informasi sebagai berikut
No | penghasilan | luas rumah | kredit |
1 | rendah | kecil | tidak |
2 | rendah | sedang | ya |
3 | rendah | besar | ya |
4 | sedang | kecil | tidak |
5 | sedang | sedang | ya |
6 | sedang | besar | ya |
7 | tinggi | kecil | tidak |
8 | tinggi | sedang | tidak |
9 | tinggi | besar | ya |
Dari tabel diatas didapatkan informasi sebagai berikut
- Fitur yaitu
- penghasilan dengan anggota {rendah, sedang, tinggi}
- luas rumah dengan anggota {kecil, sedang, besar}
- Target yaitu kredit dengan anggota {ya, tidak}
Perhitungan probabilitas dibagi menjadi 2 yaitu
- probabilitas prior/class dan
- probabilitas kondisi
Secara umum untuk menghitung probabilitas dengan rumus
Probabilitas Prior
Perhitungan Manual Naives Bayes untuk Probabilitas Prior kredit sebagai berikut
Anggota Kredit | Frekuensi | Probabilitas |
ya | 5 | 0.56 |
tidak | 4 | 0.44 |
Total | 9 | 1 |
Sehingga didapatkan probabilitas prior untuk masing-masing anggota kredit yaitu
Probabilitas Kondisi
Perhitungan Manual Naives Bayes untuk Probabilitas Kondisi ada 2 yang akan dihitung yaitu
- penghasilan dan
- luas rumah
Perhitungan probabilitas kondisi sama seperti probabilitas prior. Perbedaannya yaitu melibatkan Anggota/kelas target. Berikut perhitungan probabilitas kondisi
Probabilitas Kondisi Penghasilan
Anggota penghasilkan\kredit | frekuensi | Probabilitas | ||
ya | tidak | ya | tidak | |
rendah | 2 | 1 | 0.4 | 0.25 |
sedang | 2 | 1 | 0.4 | 0.25 |
tinggi | 1 | 2 | 0.2 | 0.5 |
total | 5 | 4 | 1 | 1 |
Didapatkan probabilitas sebagai berikut
- penghasilan rendah
- penghasilan sedang
- penghasilan tinggi
Probabilitas Kondisi Luas Rumah
Anggota luas rumah\kredit | frekuensi | Probabilitas | ||
ya | tidak | ya | tidak | |
kecil | – | 3 | – | 0.75 |
sedang | 2 | 1 | 0.4 | 0.25 |
besar | 3 | – | 0.6 | – |
total | 5 | 4 | 1 | 1 |
karena mengandung NOL sehingga perlu diubah dengan cara setiap anggota luas rumah ditambah 1 untuk kategori YA dan TIDAK sehingga menjadi seperti berikut
Anggota luas rumah\kredit | frekuensi | Probabilitas | ||
ya | tidak | ya | tidak | |
kecil | 1 | 4 | 0.125 | 0.571 |
sedang | 3 | 2 | 0.375 | 0.286 |
besar | 4 | 1 | 0.5 | 0.143 |
total | 8 | 7 | 1 | 1 |
Didapatkan probabilitas nya yaitu
- luas rumah kecil
- luas rumah sedang
- luas rumah besar
Perhitungan Klasifikasi
Setelah didapatkan nilai untuk probabilitas prior dan kondisi maka untuk klasifikasi pada Perhitungan Manual Naives Bayes sebagai berikut, misalkan saja untuk record no 1 akan diklasifikasikan sebagai kredit apa? YA atau TIDAK?
no | penghasilan | luas rumah |
1 | rendah | kecil |
Mari kita hitung dengan rumus
Didapatkan hasil sebagai berikut
Kategori | Probabilitas Kondisi | prob prior | perkalian | |
penghasilan | luas rumah | |||
rendah | kecil | |||
a | b | c | =a*b*c | |
ya | 0.400 | 0.125 | 0.56 | 0.03 |
tidak | 0.250 | 0.571 | 0.44 | 0.06 |
Kalian bisa melihat nilai tertinggi yaitu 0.06 sehingga record no 1 dengan informasi nasabah
- berpenghasilan rendah dan
- luas rumah kecil
akan ditolak pengajuan kredit nya / TIDAK
Demikian pembahasan mengenai Perhitungan Manual Naives Bayes, perhitungan diatas sangat mudah dilakukan menggunakan excel yang bisa kalian download disini (dengan menyertakan email) atau bila fitur nya banyak tentu penggunaan excel kurang bagus, kalian bisa menggunakan R /Python