ANOVA (analysis of variance) uji perbedaan rata-rata data lebih dari dua kelompok

By | January 2, 2022
Print Friendly, PDF & Email
2,505 Views

ANOVA (analysis of variance) uji perbedaan rata-rata data lebih dari dua kelompok. Bila kita menggunakan uji t test student kita hanya bisa menguji perbedaan antara 2 populasi saja sehingga untuk 2 populasi keatas kita butuh uji ANOVA. Untuk menguji perbedaan rata-rata tiga kelompok atau lebih dapat menggunakan ANOVA (analysis of variance). ANOVA (analysis of variance) adalah suatu metode analisis statistika yang termasuk ke dalam cabang statistika inferensi.

Pengujian ANOVA dilakukan dengan membandingkan varians. Dengan membandingkan varians tersebut, dapat diketahui ada tidaknya perbedaan rata-rata dari tiga atau lebih kelompok.  Misalnya kita ingin mengetahui apakah ada perbedaan rata-rata nilai antara siswa kelas I, II, dan kelas III. Terdapat dua jenis Anova, yaitu analisis varian satu faktor (one way anova) dan analisis varian dua faktor (two ways anova). Beberapa alasan menggunakan uji hipotesis dengan ANOVA adalah:

  1. Memudahkan analisis beberapa kelompok sampel yang berbeda dengan resiko kesalahan terkecil.
  2. Mengetahui signifikansi perbedaan rata-rata (μ) antara kelompok sampel yang satu dengan yang lain.
  3. Analisis varians relatif mudah dimodifikasi dan dapat dikembangkan untuk berbagai bentuk percobaan yang lebih rumit.

Asumsi yang digunakan untuk ANOVA

Asumsi-asumsi yang harus dipenuhi dalam ANOVA (analysis of variance):

  1. Data berdistribusi normal
  2. Varians atau ragamnya homogen
  3. Masing-masing sampel saling bebas
  4. Komponen-komponen dalam modelnya bersifat aditif (saling menjumlah)

Hipotesis ANOVA

Apa hipotesis yang digunakan dalam ANOVA? Hipotesis yang digunakan dalam Anova (analysis of variance), yaitu:

  • H_0: \mu_1 = \mu_2 = \mu_3 = … = \mu_n, atau tidak ada perbedaan yang nyata antara rata-rata hitung dari n kelompok
  • H_1: \mu_1 \neq \mu_2 \neq \mu_3 \neq … \neq \mu_n, atau ada perbedaan yang nyata antara rata-rata hitung dari n kelompok

Tujuan dan hipotesis ANOVA

Seperti disebutkan dalam pendahuluan, ANOVA digunakan untuk membandingkan kelompok (dalam praktiknya, 3 atau lebih kelompok). Lebih umum, ini digunakan untuk:

  • mempelajari apakah pengukuran serupa di seluruh modalitas yang berbeda (juga disebut level atau perawatan dalam konteks ANOVA) dari variabel kategori
  • membandingkan dampak dari tingkat yang berbeda dari variabel kategoris pada variabel kuantitatif
  • menjelaskan variabel kuantitatif berdasarkan variabel kualitatif

Prinsip Uji Anova adalah melakukan analisis variabilitas data menjadi dua sumber variasi yaitu variasi di dalam kelompok (within) dan variasi antar kelompok (between).

  • Bila variasi within dan between sama (nilai perbandingan kedua varian mendekati angka satu), maka berarti tidak ada perbedaan efek dari intervensi yang dilakukan, dengan kata lain nilai mean yang dibandingkan tidak ada perbedaan.
  • Sebaliknya bila variasi antar kelompok lebih besar dari variasi didalam kelompok, artinya intervensi tersebut memberikan efek yang berbeda, dengan kata lain nilai mean yang dibandingkan menunjukkan adanya perbedaan.

Contoh Kasus ANOVA

Kita coba dengan dataset penguin. Dataset berisi data untuk 344 penguin dari 3 spesies berbeda (Adelie, Chinstrap dan Gentoo) dengan jumlah masing-masing yaitu

  1. Adelie 152
  2. Chinstrap 68
  3. Gentoo 124

Dataset berisi 8 variabel, tetapi nanti kita hanya fokus pada panjang sirip dan spesies untuk artikel ini. Panjang sirip bervariasi dari 172 hingga 231 mm, dengan rata-rata 200,9 mm. Jadi hanya menyimpan 2 variabel yaitu jenis penguin dan panjang sirip, silahkan kalian download terlebih dahulu penguins.csv

Penguins

Generated by wpDataTables

Kalian bisa menggunakan excel/SPSS untuk melakukan plotting, kalian bisa melihat berbeda ya

Nanti kalau kalian menggunakan SPPS yang harus dilakukan yaitu

  • mengubah kolom species menjadi kategorikal, misalkan
    • Adelie diubah menjadi 1
    • Chinstrap diubah menjadi 2
    • Gentoo menjadi 3

Kalian bisa menggunakan excel via logika if then atau menggunakan yang paling praktis sih pakai code di R/Studio. Untuk Cara Import file CSV di SPSS  dibaca saja terlebih dahulu.  Ini adalah file penguins yang siap kalian gunakan di SPSS format CSV penguins2.csv

Penguins2

Generated by wpDataTables

Dalam konteks ini dan sebagai contoh, kita akan menggunakan ANOVA untuk membantu kita menjawab pertanyaan: “Apakah panjang sirip berbeda untuk 3 spesies penguin?”

ANOVA dengan SPSS

Setelah kita download penguins2,csv  lakukan import file CSV ke dalam SPSS yang akan uji yaitu

  • dependent list : flipper_length_mm
  • factor : jenis

Dari menu bar, kita pilih Analyze -> Compare Means -> One-Way ANOVA

  • Kita setting Dependent List dan Factor untuk One -Way Anova

  • Analisis Descriptive juga butuh analisis descriptive, kita pilih Options akan tampil kotak dialog berikut dan centang Descriptive dan Homogeneity of variance test

  • nanti kita juga butuh pengaturan asumsi variance, kita pilih Post Hoc Multiple Comparisons pilih Bonferroni dengan tingkat significance 5% atau 0.05. Perhatikan pertanyaan Equal Variance Assumed yang menandakan asumsi yang digunakan adalah variance nya sama/equal

Hasil ANOVA dengan SPSS

  • Berikut hasil ANOVA untuk statistik deskripsi yaitu jenis (1)
    • (1) Adelie mempunyai rerata 189.95
    • (2) Chinstrap mempunyai rerata 195.82
    • (3) Gentoo mempunyai rerata 217.19

  • Berikut hasil Uji  Variance (diingat bahwa salah satu asumsi Anova adalah variansnya sama). Dari tabel Test of Homegeneity of Variances terlihat bahwa hasil uji menunjukan bahwa varian ketiga kelompok tersebut sama (P-value = 0,367), sehingga uji Anova valid untuk menguji hubungan ini.

  • Hasil ANOVA yaitu Kita lihat tabel ANOVA , dari tabel itu pada kolom Sig. diperoleh nilai P (P-value) = 0,000. Dengan demikian pada taraf nyata = 0,05 kita menolak Ho, sehingga kesimpulan yang didapatkan adalah ada perbedaan yang bermakna

  • Ketika H0 ditolak berarti data tersebut mempunyai perbedaan yang signifikan. Kategori mana saja yang berbeda itu akan menimbulkan pertanyaan bukan? jelas ada beberapa kombinasi seperti
    • kelas 1 vs kelas 2
    • kelas 2 vs kelas 3, dan
    • kelas 3 vs kelas 1
  • Tentu hal diatas cukup menggunakan uji t student, kalau di ANOVA kita menggunakan Post Hoc Test, kalian bisa melihat tanda asterik * pada setiap kelas yang menandakan bahwa kombinasi ketiganya berbeda
    • 2 vs 3 berbeda
    • 1 vs 3 berbeda
    • 1 vs 2 berbeda

  • Untuk menentukan uji lanjut mana yang digunakan, maka kembali kita lihat tabel Test of Homogeneity of Variances,
    • bila hasil tes menunjukan varian sama, maka uji lanjut yang digunakan adalah uji Bonferroni.
    • Namun bilai hasil tes menunjukan varian tidak sama, maka uji lanjut yang digunakan adalah uji Games-Howell.
  • Mengingat hasil dari Test of Homogeneity menghasilkan bahwa varian ketiga kelompok tersebut sama, maka uji lanjut (Post Hoc Test) yang digunakan adalah Uji Bonferroni seperti yang dilakukan diatas.

ANOVA dengan R/RStudio

Untuk test ANOVA dengan R/RStudio sangat mudah sekali,

  • Hasil statistik deskriptif yaitu
library(tidyverse)
library(dplyr)

penguins2 = read.csv('penguins2.csv')
group_by(penguins2, species) %>%
    summarise(
        mean = mean(flipper_length_mm, na.rm = TRUE),
        sd = sd(flipper_length_mm, na.rm = TRUE)
    )

hasil

# A tibble: 3 x 3
  species    mean    sd
  <fct>     <dbl> <dbl>
1 Adelie     190.  6.54
2 Chinstrap  196.  7.13
3 Gentoo     217.  6.48
  • Hasil ANOVA, jangan lupa kita asumsikan variance nya sama/equal seperti di SPSS diatas
oneway.test(flipper_length_mm ~ jenis,
            data = penguins2,
            var.equal = TRUE # assuming equal variances
)

hasil p-value sangat kecil yaitu dibawah 5%

   One-way analysis of means

data:  flipper_length_mm and jenis
F = 594.8, num df = 2, denom df = 339, p-value < 2.2e-16

Mengenal lebih jauh post hoc test

Tes post-hoc adalah keluarga tes statistik sehingga ada beberapa di antaranya. Yang paling umum adalah:

  • Tukey HSD, digunakan untuk membandingkan semua grup satu sama lain (jadi semua kemungkinan perbandingan 2 grup).
  • Dunnett, digunakan untuk membuat perbandingan dengan kelompok referensi. Misalnya, pertimbangkan 2 kelompok perlakuan dan satu kelompok kontrol. Jika kalian hanya ingin membandingkan 2 kelompok perlakuan terhadap kelompok kontrol, dan kalian tidak ingin membandingkan 2 kelompok perlakuan satu sama lain, uji Dunnett lebih disukai.
  • Koreksi Bonferroni jika memiliki serangkaian perbandingan yang direncanakan untuk dilakukan.

Demikian pembahasan mengenai ANOVA (analysis of variance) uji perbedaan rata-rata data lebih dari dua kelompok. Nanti akan ada update/revisi terutama yang post hoc test. Silahkan untuk comment dibawah ini dan berikan klik di iklan bila artikel ini membantu kalian!

See also  Cara mengatasi RStudio - n must only be used inside dplyr verbs

Leave a Reply

Your email address will not be published.




Enter Captcha Here :