Cara Hitung Manual Uji Normalitas dengan Uji Kolmogorov-Smirnov
Uji Kolmogorov-Smirnov dapat digunakan untuk menguji suatu asumsi apakah suatu data sampel berasal dari populasi yang berdistribusi normal atau tidak. Asumsi normalitas memiliki peranan penting dalam uji-uji parametrik, seperti uji beda rata-rata dari dua populasi dengan uji 𝑡 dan analisis varians. Hal ini karena uji-uji parametrik akan bekerja dengan baik ketika asumsi normalitas dipenuhi terlebih dahulu.
Apabila data sampel berasal dari populasi yang berdistribusi normal, maka distribusi sampling dari rata-rata 𝑋̅ juga mengikuti distribusi normal itu merupakan dasar perhitungan Uji Kolmogorov-Smirnov. Lebih lanjut mengenai Teori Normal Distribution
Apa itu distribusi normal?
Contents
- 1 Apa itu distribusi normal?
- 2 Apa itu Distribusi Sampling Rata-Rata Sampel (Sampling Distribution of )?
- 3 Uji Normalitas dengan Uji Kolmogorov-Smirnov
- 4 Pengambilan keputusan terhadap hipotesis
- 5 Contoh Kasus Uji Normalitas Populasi dengan Uji Kolmogorov-Smirnov
- 5.1 Perhitungan Rerata dan Standar Deviasi
- 5.2 Menghitung probabilitas dari atau
- 5.3 Menghitung probabilitas kumulatif dari atau
- 5.4 Mentransformasi nilai menjadi nilai normal terstandarisasi
- 5.5 Menghitung probabilitas kumulatif dari atau = .
- 5.6 Menghitung nilai mutlak dari selisih antara dan
- 5.7 Menghitung nilai statistik dari uji Kolmogorov-Smirnov
- 5.8 Menghitung nilai kritis Kolmogorov-Smirnov.
- 5.9 Pengambilan keputusan terhadap hipotesis.
- 6 Cara Hitung Kolomogorov-Smirnov di Excel
- 7 Uji Normalitas Kolmogorov-Smirnov dengan SPSS
- 8 Uji Normalitas Kolmogorov-Smirnov dengan R/RStudio – package nortest
- 9 Mengapa nilai p-value di SPSS dan R itu beda?
- 10 Uji Normalitas yang lain
- 11 Mengapa Output di SPSS dan R kadang berbeda
Distribusi normal adalah fungsi yang mendefinisikan bagaimana satu set pengukuran didistribusikan di sekitar pusat pengukuran ini (yaitu, mean). Banyak fenomena alam dalam kehidupan nyata dapat didekati dengan distribusi frekuensi berbentuk lonceng yang dikenal sebagai distribusi normal atau distribusi Gaussian.
Distribusi normal adalah distribusi berbentuk gunung, unimodal dan simetris di mana sebagian besar pengukuran berkumpul di sekitar rata-rata. Selain itu, semakin jauh suatu ukuran menyimpang dari rata-rata, semakin rendah kemungkinan terjadinya. Dalam pengertian ini, untuk variabel tertentu, adalah umum untuk menemukan nilai yang dekat dengan mean, tetapi semakin kecil kemungkinannya untuk menemukan nilai saat kita menjauh dari mean. Last but not least, karena distribusi normal simetris di sekitar rata-ratanya, nilai ekstrim di kedua ekor distribusi tidak mungkin secara ekuivalen. Misalnya, karena tinggi badan orang dewasa mengikuti distribusi normal, kebanyakan orang dewasa mendekati tinggi rata-rata dan orang dewasa yang sangat pendek jarang terjadi seperti orang dewasa yang sangat tinggi.
Karena merupakan persyaratan dalam beberapa uji statistik, kita akan bahas cara menguji asumsi normalitas. Data yang memiliki distribusi kira-kira normal memiliki variasi yang pasti, seperti yang dinyatakan oleh aturan empiris berikut:
- mencakup sekitar 68% dari pengamatan
- mencakup sekitar 95% dari pengamatan
- mencakup sekitar 99.7% dari pengamatan
Apa itu Distribusi Sampling Rata-Rata Sampel (Sampling Distribution of )?
Kita bahas dulu Sampling distribution adalah distribusi probabilitas dari suatu statistik. Sampling distribution tergantung dari ukuran populasi, ukuran sampel, metode memilih sampel. Distribusi sampling dari dengan dengan ukuran sampel n adalah suatu distribusi yang bila percobaan dilakukan secara berulang (selalu dengan jumlah sampel n) akan menghasilkan banyak nilai sampel dengan rata-rata . Distribusi sampling ini menggambarkan variabilitas (perubahan) rata-rata sampel terhadap rata-rata populasi .
Rata-rata distribusi sampling: Bila suatu sampel acak dari suatu n pengamatan diambil dari suatu populasi normal dengan rata-rata dan varians . Maka, setiap pengamatan , i =1,2,3, …, n dari sampel acak tersebut akan mempunyai distribusi normal yang sama seperti popolasi yang bersangkutan. Sehingga dapat disimpulkan bahwa:
memiliki distribusi normal,
dengan rerata
dan varians
Bila sampel yang diambil dari suatu populasi yang tidak diketahui distribuisnya, distribusi sampling dari akan tetap mendekati nomal dengan rata-rata dan varians asalkan sampel yang diambil dalam jumlah yang besar. Hasil ini merupakan konsekeuesi dari suatu teorema batas tengah (central limit theorem)
Central Limit Theorem. Bila adalah rata-rata suatu sampel acak yang diambil dari suatu populasi dengan ukuran n, rata-rata dan varians , maka bentuk batas distribusi berikut:
bila distribusinya adalah distribusi normal standar n(z;0,1). Cukup sekian saja ya, penjelasannya panjang ntar nantinya kalau dibahas detail.
Uji Normalitas dengan Uji Kolmogorov-Smirnov
Kita jabarkan, jika sebuah populasi mempunyai informasi sebagai berikut
- merupakan nilai-nilai pada sampel acak (random sample).
- Misalkan menyatakan probabilitas dari nilai ,
- sedangkan menyatakan probabilitas kumulatif dari nilai , di mana i = 1,2,3, … , k
- merupakan nilai normal (sampel) terstandarisasi dari hasil transformasi nilai , dan
- menyatakan probabilitas kumulatif dari nilai normal terstandarisasi.
- Nilai normal terstandarisasi merupakan hasil transformasi dari nilai yang dihitung dengan rumus sebagai berikut.
- Perhatikan bahwa merupakan rata-rata sampel sebagai estimasi dari rata-rata populasi , sedangkan 𝑠 merupakan standar deviasi sampel sebagai estimasi dari standar deviasi populasi . Misalkan menyatakan nilai mutlak dari selisih antara dan , yakni
jika nilai kritis, maka diterima dan ditolak
jika nilai kritis, maka ditolak dan diterima
Tabel Nilai Kritis Uji Kolmogorov-Smirnov
tabel diatas distribusi Kolmogorov-Smirnov.
Pengambilan keputusan terhadap hipotesis
Pengambilan keputusan terhadap hipotesis juga dapat dilakukan dengan membandingkan nilai probabilitas (p-value) dari uji Kolmogorov-Smirnov terhadap tingkat signifikansi 𝛼 (significance level). Berikut aturan pengambilan keputusan berdasarkan pendekatan nilai probabilitas.
jika nilai probabilitas tingkat signifikansi, maka diterima dan ditolak
jika nilai probabilitas tingkat signifikansi, maka ditolak dan diterima
Contoh Kasus Uji Normalitas Populasi dengan Uji Kolmogorov-Smirnov
Berikut data nilai dari kelas mata kuliah riset operasi
Nomor Nama Nilai 1 A 40 2 B 50 3 C 50 4 D 60 5 F 60 6 G 60 7 H 70 8 I 70 9 J 70 10 K 70 11 L 80 12 M 80 13 N 80 14 O 90 15 P 90 16 Q 100
Berikut akan digunakan pendekatan uji Kolmogorov-Smirnov untuk menguji hipotesis apakah data tersebut ditarik dari populasi yang berdistribusi normal atau tidak (misalkan tingkat signifikansi yang digunakan 𝛼 = 5%). Perhitungan akan dilakukan secara manual.
Penjelasannya sebagai berikut
Perhitungan Rerata dan Standar Deviasi
dari tabel diatas, kita akan hitung nilai
- rerata
- standar deviasi
Menghitung probabilitas dari atau
Setelah diperoleh dan , selanjutnya akan dihitung probabilitas dari atau .
- Probabilitas untuk nilai atau adalah dan
- seterusnya (lihat tabel diatas)
Menghitung probabilitas kumulatif dari atau
- Nilai dari
- nilai dari dan
- seterusnya.
Mentransformasi nilai menjadi nilai normal terstandarisasi
Selanjutnya mentransformasi nilai ke dalam nilai normal terstandarisasi yang dihitung dengan rumus
- untuk maka
- untuk maka
Menghitung probabilitas kumulatif dari atau = .
Setelah diperoleh nilai-nilai normal terstandarisasi, maka akan dihitung probabilitas kumulatif dari nilai-nilai normal terstandarisasi tersebut.
- Probabilitas kumulatif dari atau berdasarkan tabel distribusi normal kumulatif adalah 0,033,
- probabilitas kumulatif dari atau berdasarkan tabel distribusi normal kumulatif adalah 0,729, dan seterusnya.
nanti pakai excel saja untuk hitung tabel Z, download saja excel di akhir postingan ini (harus register ya!)
Menghitung nilai mutlak dari selisih antara dan
Selanjutnya menghitung nilai mutlak dari selisih antara dan .
- Nilai untuk adalah
- nilai untuk adalah ,
- dan seterusnya.
Menghitung nilai statistik dari uji Kolmogorov-Smirnov
Nilai statistik dari uji Kolmogorov-Smirnov merupakan nilai D yang paling besar atau maksimum. Berdasarkan diatas nilai D terbesar adalah 0.125, sehingga nilai statistik dari uji Kolmogorov-Smirnov adalah 0.125 atau = 0.125
Menghitung nilai kritis Kolmogorov-Smirnov.
Nilai kritis Kolmogorov-Smirnov pada tingkat signifikansi 5% dan jumlah elemen sampel 16 berdasarkan tabel distribusi Kolmogorov-Smirnov adalah 0,327
Pengambilan keputusan terhadap hipotesis.
Perhatikan bahwa karena nilai statistik dari uji Kolmogorov-Smirnov (0,125) lebih kecil dibandingkan nilai kritis Kolmogorov-Smirnov (0,327), maka hipotesis nol diterima dan hipotesis alternatif ditolak, sehingga asumsi mengenai data nilai ujian mata kuliah RO diatas ditarik dari populasi yang berdistribusi normal dapat diterima pada tingkat signifikansi 5%
Cara Hitung Kolomogorov-Smirnov di Excel
Cara Hitung Manual Uji Normalitas dengan Uji Kolmogorov-Smirnov akan sangat mudah di excel, silahkan kalian bisa download Download Contoh Uji Kolmogorov-Smirnov
Uji Normalitas Kolmogorov-Smirnov dengan SPSS
Kalian download terlebih dahulu datasetnya Contoh Uji Normalitas Populasi dengan Uji KolmogorovSmirnov,csv
- Dari menu bar, kita pilih Analyze -> Nonparametric Test -> Legacy Dialogs -> 1- Sample K-S
- Nanti pilih Test Distribution Normal
- hasil uji normalitas kolmogorov-smirnov. berdasarkan tabel output SPSS dibawah ini,
- nilai p -value / signifikansi Asymp. Sig (2-tailed) sebesar 0.964 lebih besar dari 5%, maka sesuai dasar pengambilan keputusan dalam uji normalitas kolmogorov-smirnov diatas, dapat disimpulkan bahwa data berdistribusi normal
- nilai D / absolute Difference sebesar 0.125
Uji Normalitas Kolmogorov-Smirnov dengan R/RStudio – package nortest
Yuk kita coba uji normalitas kolmogorov-smirnov dengan R/RStudio, langkah mudahnya yaitu data diatas perlu kita simpan terlebih dahulu kedalam format excel saja agar lebih mudah
Nomor Nama Nilai 1 A 40 2 B 50 3 C 50 4 D 60 5 F 60 6 G 60 7 H 70 8 I 70 9 J 70 10 K 70 11 L 80 12 M 80 13 N 80 14 O 90 15 P 90 16 Q 100
Nanti kita butuh package nortest, berikut kode yang digunakan untuk uji normalitas kolmogorov-smirnov dengan R/RStudio
library(readxl) library(nortest) dat =readxl::read_xlsx("Data Nilai Mahasiswa Mata Kuliah RO.xlsx") nortest::lillie.test(dat$Nilai)
hasilnya
Lilliefors (Kolmogorov-Smirnov) normality test data: dat$Nilai D = 0.125, p-value = 0.7235
terlihat bahwa nilai statistik dari
- uji Kolmogorov-Smirnov (D) 0,125, lebih kecil dibandingkan nilai kritis Kolmogorov-Smirnov 0,327, maka hipotesis nol diterima dan hipotesis alternatif ditolak, sehingga asumsi mengenai data nilai ujian ditarik dari populasi yang berdistribusi normal dapat diterima pada tingkat signifikansi 5%.
- nilai p -value adalah 0.7235. Karena nilai probabilitas, yakni 0.7235, lebih besar dibandingkan tingkat signifikansi, yakni 0,05, maka hipotesis nol diterima, dan hipotesis alternatif ditolak. Hal ini berarti asumsi mengenai data nilai ujian ditarik dari populasi yang berdistribusi normal dapat diterima pada tingkat signifikansi 5%
Selain menggunakan package nortest diatas, kita bisa kok menggunakan function built in untuk hitung kolomogorov smirnov untuk one single test yaitu wajib disebutkan mean dan sd nya kalau tidak akan diberikan nilai default yaitu mean = 1 dan sd = 0.
ks.test(dat$Nilai,"pnorm",mean=mean(dat$Nilai), sd=sd(dat$Nilai))
hasilnya yaitu
Asymptotic one-sample Kolmogorov-Smirnov test data: dat$Nilai D = 0.125, p-value = 0.9639 alternative hypothesis: two-sided
untuk hasil diatas sama seperti di SPSS yaitu D dan p-value nya
Mengapa nilai p-value di SPSS dan R itu beda?
Bila kalian perhatikan ada perbedaan nilai output di SPSS dan R yaitu
- p-value pada SPSS yaitu
- R nortest menghasilkan 0.7235 dan
- SPSS menghasilkan 0.964
- sedangkan nilai D nya sama yaitu 0.125
p-value berbeda karena cara perhitungan nya berbeda antara SPSS dan R akan tetapi walaupun beda semuanya diatas 5%! Saya sedang cari tahu algoritma yang digunakan antara masing-masing untuk menghasilkan p-value. Silahkan kalian komen dibawah ini
Uji Normalitas yang lain
- Uji Normalitas Populasi dengan Quantile-Quantile Plot (Q-Q Plot)
- Uji Normalitas Populasi dengan Uji Jarque-Bera
- Cara Hitung Manual Uji Normalitas dengan Uji Kolmogorov-Smirnov
ref: Belajar Statistika dengan R Prana Ugiana Gio, Dasapta Erwin Irawan, 2016
Mengapa Output di SPSS dan R kadang berbeda
Mengapa Output di SPSS dan R kadang berbeda – Mengapa Hasil Nilai di R dan SPSS terkadang beda?
Belajar Statistik
Materi statistik yang saling berkaitan satu sama lain, bisa kalian pelajari materi yang lain Belajar Statistik