Klasifikasi KNN

By | January 15, 2021
2,213 Views

Sinopsis

Menurut wikipedia diterangkan sebagai berikut: Algoritma k-nearest neighbor (k-NN atau KNN) adalah sebuah metode untuk melakukan klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat dengan objek tersebut.Data pembelajaran diproyeksikan ke ruang berdimensi banyak, dimana masing-masing dimensi merepresentasikan fitur dari data. Ruang ini dibagi menjadi bagian-bagian berdasarkan klasifikasi data pembelajaran. Sebuah titik pada ruang ini ditandai kelas c jika kelas c merupakan klasifikasi yang paling banyak ditemui pada k buah tetangga terdekat titk tersebut. Dekat atau jauhnya tetangga biasanya dihitung berdasarkan jarak Euclidean. Ref: https://id.wikipedia.org/wiki/KNN,  Kalian bisa mengunjungi link berikut mengenai perhitungan dan langkah-langkahnya

 

  1. http://www.scholarpedia.org/article/K-nearest_neighbor
  2. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2243774/?page=1
  3. https://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+(Original)
  4. http://me.seekingqed.com/files/intro_KNN.pdf
  5. http://dataaspirant.com/2016/12/23/k-nearest-neighbor-classifier-intro/
  6. untuk lebih jelasnya di http://people.revoledu.com/kardi/tutorial/KNN/KNN_Numerical-example.html

Persiapan Data

Agar lebih mudah memahami, saya sediakan contoh. Didapatkan sebuah hasil mengenai sebuah survey mengenai kualitas jenis tisu yaitu bagus dan jelek yang didasarkan pada 2 paramater yaitu tingkat keasamaan dan kekuatan mudah robek.

Perusahaan ingin membuat tisu dengan karakteristik X1= 3, dan X2 = 7, termasuk manakah jenis tersebut? Berdasarkan informasi mengenai table diatas?

Normalisasi Data

Tentu kita harus mengubah data diatas untuk bisa dipahami oleh komputer dengan mengubah good menjadi bernilai 1 dan bad menjadi 0.

Lebih mudah jika kita simpan dalam bentuk excel seperti berikut disimpan dengan nama data latih.xlsx

Code Matlab

Berikut kode dan function yang digunakan didalam matlab yaitu classify

clc;clear all;close all;
[data,header] = xlsread('data latih.xlsx');
X1 = 3;
X2 = 7;
test = [X1 X2];
hasil =classify(test,[data(:,1),data(:,2)],data(:,3));
if hasil==1
    disp(['good']);
else 
    disp(['bad']);
end

hasil

good

Cukup mudah bukan? Bila kita membuat dalam versi GUI akan menjadi mudah seperti berikut