ANOVA (analysis of variance) uji perbedaan rata-rata data lebih dari dua kelompok

By | September 2, 2023
Print Friendly, PDF & Email
4,647 Views

Analisis Variansi (ANOVA) adalah sebuah metode statistik yang digunakan untuk membandingkan rata-rata dari tiga atau lebih kelompok yang berbeda. ANOVA adalah alat statistik yang kuat untuk menguji apakah terdapat perbedaan signifikan antara rata-rata kelompok-kelompok ini. Teknik ini telah menjadi salah satu yang paling umum digunakan dalam analisis data di berbagai bidang, termasuk ilmu sosial, ilmu alam, ilmu kedokteran, dan bisnis. Artikel ini akan membahas secara detail mengenai apa itu ANOVA, berbagai jenis ANOVA, dan langkah-langkah dalam melakukan analisis ANOVA.

ANOVA (analysis of variance) adalah uji perbedaan rata-rata data lebih dari dua kelompok. Bila kita menggunakan uji t test student kita hanya bisa menguji perbedaan antara 2 populasi saja sehingga untuk 2 populasi keatas kita butuh uji ANOVA. Untuk menguji perbedaan rata-rata tiga kelompok atau lebih dapat menggunakan ANOVA (analysis of variance). ANOVA (analysis of variance) adalah suatu metode analisis statistika yang termasuk ke dalam cabang statistika inferensi.

Apa itu ANOVA?

ANOVA adalah singkatan dari Analisis Variansi, yang pada dasarnya adalah sebuah metode statistik yang digunakan untuk membandingkan rata-rata dari tiga atau lebih kelompok yang berbeda. Tujuan utama ANOVA adalah untuk mengukur apakah ada perbedaan signifikan antara rata-rata kelompok-kelompok tersebut. Dalam konteks ini, “variansi” mengacu pada variasi atau perbedaan antara data dalam kelompok-kelompok tersebut. Berikut jenis-jenis ANOVA

  1. ANOVA Satu Arah (One-Way ANOVA): Jenis ini digunakan ketika Anda hanya memiliki satu faktor atau variabel independen yang mempengaruhi variabel dependen. Misalnya, jika Anda ingin mengetahui apakah terdapat perbedaan rata-rata hasil tes antara tiga sekolah berbeda, ANOVA satu arah adalah metode yang tepat
  2. ANOVA Dua Arah (Two-Way ANOVA): Jenis ini digunakan ketika Anda memiliki dua faktor atau lebih yang mempengaruhi variabel dependen. Misalnya, Anda ingin mengevaluasi apakah terdapat pengaruh dari jenis diet (faktor pertama) dan jenis olahraga (faktor kedua) terhadap penurunan berat badan.
  3. ANOVA Berulang (Repeated Measures ANOVA): Digunakan ketika pengukuran yang sama diambil pada subjek yang sama pada beberapa waktu yang berbeda. Ini sering digunakan dalam penelitian ilmu kedokteran atau psikologi.
  4. ANOVA Nonparametrik: Jenis ini digunakan ketika data tidak memenuhi asumsi normalitas dan homogenitas varians yang diperlukan oleh ANOVA parametrik. Contohnya adalah ANOVA Kruskal-Wallis.

Pengujian ANOVA dilakukan dengan membandingkan varians. Dengan membandingkan varians tersebut, dapat diketahui ada tidaknya perbedaan rata-rata dari tiga atau lebih kelompok.  Misalnya kita ingin mengetahui apakah ada perbedaan rata-rata nilai antara siswa kelas I, II, dan kelas III. Terdapat dua jenis Anova, yaitu analisis varian satu faktor (one way anova) dan analisis varian dua faktor (two ways anova). Beberapa alasan menggunakan uji hipotesis dengan ANOVA adalah:

  1. Memudahkan analisis beberapa kelompok sampel yang berbeda dengan resiko kesalahan terkecil.
  2. Mengetahui signifikansi perbedaan rata-rata (μ) antara kelompok sampel yang satu dengan yang lain.
  3. Analisis varians relatif mudah dimodifikasi dan dapat dikembangkan untuk berbagai bentuk percobaan yang lebih rumit.
See also  return all column in groupby in pandas?

Asumsi yang digunakan untuk ANOVA

Asumsi-asumsi yang harus dipenuhi dalam ANOVA (analysis of variance):

  1. Data berdistribusi normal
  2. Varians atau ragamnya homogen
  3. Masing-masing sampel saling bebas
  4. Komponen-komponen dalam modelnya bersifat aditif (saling menjumlah)

Hipotesis ANOVA

Apa hipotesis yang digunakan dalam ANOVA? Hipotesis yang digunakan dalam Anova (analysis of variance), yaitu:

  • H_0: \mu_1 = \mu_2 = \mu_3 = … = \mu_n, atau tidak ada perbedaan yang nyata antara rata-rata hitung dari n kelompok
  • H_1: \mu_1 \neq \mu_2 \neq \mu_3 \neq … \neq \mu_n, atau ada perbedaan yang nyata antara rata-rata hitung dari n kelompok

Tujuan dan hipotesis ANOVA

Seperti disebutkan dalam pendahuluan, ANOVA digunakan untuk membandingkan kelompok (dalam praktiknya, 3 atau lebih kelompok). Lebih umum, ini digunakan untuk:

  • mempelajari apakah pengukuran serupa di seluruh modalitas yang berbeda (juga disebut level atau perawatan dalam konteks ANOVA) dari variabel kategori
  • membandingkan dampak dari tingkat yang berbeda dari variabel kategoris pada variabel kuantitatif
  • menjelaskan variabel kuantitatif berdasarkan variabel kualitatif

Prinsip Uji Anova adalah melakukan analisis variabilitas data menjadi dua sumber variasi yaitu variasi di dalam kelompok (within) dan variasi antar kelompok (between).

  • Bila variasi within dan between sama (nilai perbandingan kedua varian mendekati angka satu), maka berarti tidak ada perbedaan efek dari intervensi yang dilakukan, dengan kata lain nilai mean yang dibandingkan tidak ada perbedaan.
  • Sebaliknya bila variasi antar kelompok lebih besar dari variasi didalam kelompok, artinya intervensi tersebut memberikan efek yang berbeda, dengan kata lain nilai mean yang dibandingkan menunjukkan adanya perbedaan.

Contoh Kasus ANOVA

Kita coba dengan dataset penguin. Dataset berisi data untuk 344 penguin dari 3 spesies berbeda (Adelie, Chinstrap dan Gentoo) dengan jumlah masing-masing yaitu

  1. Adelie 152
  2. Chinstrap 68
  3. Gentoo 124

Dataset berisi 8 variabel, tetapi nanti kita hanya fokus pada panjang sirip dan spesies untuk artikel ini. Panjang sirip bervariasi dari 172 hingga 231 mm, dengan rata-rata 200,9 mm. Jadi hanya menyimpan 2 variabel yaitu jenis penguin dan panjang sirip, silahkan kalian download terlebih dahulu penguins.csv

Kalian bisa menggunakan excel/SPSS untuk melakukan plotting, kalian bisa melihat berbeda ya

See also  Install Remove dan Update R version di Linux

Nanti kalau kalian menggunakan SPPS yang harus dilakukan yaitu

  • mengubah kolom species menjadi kategorikal, misalkan
    • Adelie diubah menjadi 1
    • Chinstrap diubah menjadi 2
    • Gentoo menjadi 3

Kalian bisa menggunakan excel via logika if then atau menggunakan yang paling praktis sih pakai code di R/Studio. Untuk Cara Import file CSV di SPSS  dibaca saja terlebih dahulu.  Ini adalah file penguins yang siap kalian gunakan di SPSS format CSV penguins2.csv

Dalam konteks ini dan sebagai contoh, kita akan menggunakan ANOVA untuk membantu kita menjawab pertanyaan: “Apakah panjang sirip berbeda untuk 3 spesies penguin?”

ANOVA dengan SPSS

Setelah kita download penguins2,csv  lakukan import file CSV ke dalam SPSS yang akan uji yaitu

  • dependent list : flipper_length_mm
  • factor : jenis

Dari menu bar, kita pilih Analyze -> Compare Means -> One-Way ANOVA

  • Kita setting Dependent List dan Factor untuk One -Way Anova

  • Analisis Descriptive juga butuh analisis descriptive, kita pilih Options akan tampil kotak dialog berikut dan centang Descriptive dan Homogeneity of variance test

  • nanti kita juga butuh pengaturan asumsi variance, kita pilih Post Hoc Multiple Comparisons pilih Bonferroni dengan tingkat significance 5% atau 0.05. Perhatikan pertanyaan Equal Variance Assumed yang menandakan asumsi yang digunakan adalah variance nya sama/equal

Hasil ANOVA dengan SPSS

  • Berikut hasil ANOVA untuk statistik deskripsi yaitu jenis (1)
    • (1) Adelie mempunyai rerata 189.95
    • (2) Chinstrap mempunyai rerata 195.82
    • (3) Gentoo mempunyai rerata 217.19

  • Berikut hasil Uji  Variance (diingat bahwa salah satu asumsi Anova adalah variansnya sama). Dari tabel Test of Homegeneity of Variances terlihat bahwa hasil uji menunjukan bahwa varian ketiga kelompok tersebut sama (P-value = 0,367), sehingga uji Anova valid untuk menguji hubungan ini.

  • Hasil ANOVA yaitu Kita lihat tabel ANOVA , dari tabel itu pada kolom Sig. diperoleh nilai P (P-value) = 0,000. Dengan demikian pada taraf nyata = 0,05 kita menolak Ho, sehingga kesimpulan yang didapatkan adalah ada perbedaan yang bermakna

  • Ketika H0 ditolak berarti data tersebut mempunyai perbedaan yang signifikan. Kategori mana saja yang berbeda itu akan menimbulkan pertanyaan bukan? jelas ada beberapa kombinasi seperti
    • kelas 1 vs kelas 2
    • kelas 2 vs kelas 3, dan
    • kelas 3 vs kelas 1
  • Tentu hal diatas cukup menggunakan uji t student, kalau di ANOVA kita menggunakan Post Hoc Test, kalian bisa melihat tanda asterik * pada setiap kelas yang menandakan bahwa kombinasi ketiganya berbeda
    • 2 vs 3 berbeda
    • 1 vs 3 berbeda
    • 1 vs 2 berbeda
See also  Korelasi linear Pearson dan Fungsi Autokorelasi (ACF) - PACF

  • Untuk menentukan uji lanjut mana yang digunakan, maka kembali kita lihat tabel Test of Homogeneity of Variances,
    • bila hasil tes menunjukan varian sama, maka uji lanjut yang digunakan adalah uji Bonferroni.
    • Namun bilai hasil tes menunjukan varian tidak sama, maka uji lanjut yang digunakan adalah uji Games-Howell.
  • Mengingat hasil dari Test of Homogeneity menghasilkan bahwa varian ketiga kelompok tersebut sama, maka uji lanjut (Post Hoc Test) yang digunakan adalah Uji Bonferroni seperti yang dilakukan diatas.

ANOVA dengan R/RStudio

Untuk test ANOVA dengan R/RStudio sangat mudah sekali,

  • Hasil statistik deskriptif yaitu
library(tidyverse)
library(dplyr)

penguins2 = read.csv('penguins2.csv')
group_by(penguins2, species) %>%
    summarise(
        mean = mean(flipper_length_mm, na.rm = TRUE),
        sd = sd(flipper_length_mm, na.rm = TRUE)
    )

hasil

# A tibble: 3 x 3
  species    mean    sd
  <fct>     <dbl> <dbl>
1 Adelie     190.  6.54
2 Chinstrap  196.  7.13
3 Gentoo     217.  6.48
  • Hasil ANOVA, jangan lupa kita asumsikan variance nya sama/equal seperti di SPSS diatas
oneway.test(flipper_length_mm ~ jenis,
            data = penguins2,
            var.equal = TRUE # assuming equal variances
)

hasil p-value sangat kecil yaitu dibawah 5%

   One-way analysis of means

data:  flipper_length_mm and jenis
F = 594.8, num df = 2, denom df = 339, p-value < 2.2e-16

Mengenal lebih jauh post hoc test

Tes post-hoc adalah keluarga tes statistik sehingga ada beberapa di antaranya. Yang paling umum adalah:

  • Tukey HSD, digunakan untuk membandingkan semua grup satu sama lain (jadi semua kemungkinan perbandingan 2 grup).
  • Dunnett, digunakan untuk membuat perbandingan dengan kelompok referensi. Misalnya, pertimbangkan 2 kelompok perlakuan dan satu kelompok kontrol. Jika kalian hanya ingin membandingkan 2 kelompok perlakuan terhadap kelompok kontrol, dan kalian tidak ingin membandingkan 2 kelompok perlakuan satu sama lain, uji Dunnett lebih disukai.
  • Koreksi Bonferroni jika memiliki serangkaian perbandingan yang direncanakan untuk dilakukan.

Demikian pembahasan mengenai ANOVA (analysis of variance) uji perbedaan rata-rata data lebih dari dua kelompok. Nanti akan ada update/revisi terutama yang post hoc test. Silahkan untuk comment dibawah ini dan berikan klik di iklan bila artikel ini membantu kalian!

Kesimpulan

ANOVA adalah alat statistik yang penting dalam analisis data untuk menguji perbedaan antara tiga atau lebih kelompok. Dengan memahami jenis-jenis ANOVA yang berbeda dan mengikuti langkah-langkah analisis yang tepat, kalian dapat mengambil kesimpulan yang kuat dari data dan membuat keputusan yang lebih baik dalam berbagai konteks penelitian dan bisnis. Penting untuk diingat bahwa ANOVA hanya memberikan informasi tentang perbedaan rata-rata, bukan perbedaan individu, sehingga interpretasi hasilnya harus dilakukan dengan hati-hati dan kontekstual.

Leave a Reply