Uji Kesamaan Rata-Rata Dari Dua Populasi Tidak Berhubungan dengan Asumsi Varians Populasi Sama

By | December 19, 2021
3,524 Views

Uji Kesamaan Rata-Rata Dari Dua Populasi Tidak Berhubungan dengan Asumsi Varians Populasi Sama / Asumsi Varians yang Sama (t Test for Independent Populations with Assumption  \sigma_1=\sigma_2Dalam uji kesamaan rata-rata dari dua populasi yang tidak berhubungan dengan asumsi varians yang sama, menguji ada tidaknya perbedaan rata-rata antara populasi pertama dan populasi kedua. Dengan kata lain, menguji apakah selisih rata-rata antara kelompok kedua dan pertama berbeda atau sama dengan nol. Dalam uji ini, pengamatan-pengamatan pada populasi pertama saling bebas atau independen dengan pengamatan-pengamatan pada populasi kedua (independent populations). Uji ini didasarkan pada ketidaktahuan (unknown) mengenai nilai varians dari dua populasi, namun diasumsikan varians dari dua populasi tersebut sama. Oiya disclaimer bahwa artikel ini saya comot langsung dari referensi

Berikut beberapa contoh kasus yang dapat diselesaikan dengan pendekatan uji kesamaan ratarata dari dua populasi independen dengan asumsi varians yang sama dengan uji t.

  • Menguji ada tidaknya perbedaan (perbedaan yang signifikan secara statistika) nilai indeks prestasi (secara rata-rata) antara mahasiswa laki-laki dan perempuan.
  • Menguji ada tidaknya perbedaan harga saham antara perusahaan manufaktur dan real estate.
  • Menguji ada tidaknya perbedaan uang jajan antara mahasiswa kedokteran dan mahasiswa matematika.
  • Menguji ada tidaknya perbedaan indeks prestasi antara mahasiswa dominan otak kanan dan dominan kotak kiri.

Uji Hipotesis

Dalam uji kesamaan rata-rata dari dua populasi yang tidak berhubungan dengan asumsi varians yang sama,

  • hipotesis nol menyatakan tidak terdapat perbedaan rata-rata antara populasi pertama dan populasi kedua. Dengan kata lain, selisih rata-rata antara populasi kedua dan pertama sama dengan nol (\mu_2 − \mu_1 = 0).
  • Hipotesis alternatif menyatakan terdapat perbedaan rata-rata antara populasi pertama dan populasi kedua. Dengan kata lain, selisih rata-rata antara populasi kedua dan pertama berbeda dari nol (\mu_2 − \mu_1 \neq 0). Nilai statistik dari uji t (t_{hitung}) dihitung dengan rumus sebagai berikut.

Urutan dalam pengujian hipotesis untuk membandingkan dua kelompok sebagai berikut

    \[ t=\frac{\bar{X}_2-\bar{X}_1}{s_p \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} \]

Perhatikan bahwa

  • t merupakan nilai statistik dari uji t,
  • \bar{x}_1 merupakan nilai rata-rata dari sampel pertama,
  • \bar{x}_2 merupakan nilai rata-rata dari sampel kedua,
  • n_1 merupakan jumlah pengamatan dalam sampel pertama, dan
  • n_2 merupakan jumlah pengamatan dalam sampel kedua.
  • Berikut rumus untuk menghitung s_p
See also  Machine Learning dengan Torch

    \[ s_p=\sqrt{\frac{s_1^2(n_1-1)+s_2^2(n_2-1)}{n_1+n_2-2}} \]

Perhatikan bahwa s_p disebut pooled estimator standard deviation for two samples, yang mana merupakan estimator dari \sigma . Untuk pengambilan keputusan terhadap hipotesis, dapat dilakukan dengan membandingkan nilai statistik dari uji t terhadap nilai kritis t(t_{kritis}). Sebelum menghitung nilai kritis t, terlebih dahulu menghitung nilai derajat bebas. Berikut rumus untuk menghitung nilai derajat bebas.

    \[ derajat \space \space bebas = n_1+n_2-2 \]

Perhatikan bahwa

  • n_1 menyatakan banyaknya pengamatan/elemen pada sampel pertama,
  • n_2 menyatakan banyaknya pengamatan/elemen pada sampel kedua.

Misalkan n_1=n_2=10 dan tingkat signifikansi yang digunakan \alpha = 5%, maka nilai kritis t adalah ±2,101.

 



kalau menggunakan R/RStudio

> qt(0.975,df=18) #pengujian hipotesis 2 arah sehingga, 0.975 alias 0.025 atau 2.5%
[1] 2.100922

Berikut aturan pengambilan keputusan terhadap hipotesis berdasarkan uji t.

jika |t_{hitung} \leq |t_{kritis}|, maka H_0 diterima, dan H_1 ditolak

jika |t_{hitung} > |t_{kritis}|, maka H_0 ditolak dan H_1 diterima

 

 

Pengambilan keputusan terhadap hipotesis juga dapat dilakukan dengan menggunakan pendekatan nilai probabilitas dari uji t. Nilai probabilitas dari uji t dibandingkan dengan tingkat signifikansi yang digunakan. Berikut aturan pengambilan keputusan terhadap hipotesis berdasarkan nilai probabilitas.

jika nilai probabilitas \leq tingkat signifikansi maka H_0 diterima dan H_1 diterima

jika nilai  probabilitas <  tingkat signifikansi maka H_0 ditolak dan H_1 diterima

Uji Asumsi Normalitas

Dalam uji kesamaan rata-rata dari dua populasi yang tidak berhubungan dengan asumsi varians yang sama, populasi pertama dan populasi kedua diasumsikan berdistribusi normal. Namun ketika ukuran sampel cukup besar, yakni masing-masing sampel berukuran ≥ 30, maka populasi tidak harus berdistribusi normal. 

Untuk menguji asumsi normalitas tersebut, dapat digunakan pendekatan grafik, yakni Q-Q plot. Pada pendekatan Q-Q plot, jika titik-titik (dots) menyebar jauh (menyebar jauh berliku-liku pada garis diagonal seperti ular) dari garis diagonal, maka diindikasi asumsi normalitas tidak dipenuhi. Jika titik-titik menyebar sangat dekat pada garis diagonal, maka asumsi normalitas dipenuhi.

Di samping itu, dapat juga digunakan pendekatan uji Kolmogorov-Smirnov atau uji Jarque-Bera, untuk menguji asumsi normalitas.

  • Hipotesis nol menyatakan data sampel ditarik dari populasi yang berdistribusi normal, sedangkan
  • Hipotesis alternatif menyatakan data sampel ditarik dari populasi yang tidak berdistribusi normal.

Untuk pengambilan keputusan terhadap hipotesis, dapat dibandingkan antara nilai probabilitas dari uji Kolmogorov-Smirnov atau uji Jarque-Bera, dengan tingkat signifikansi yang digunakan \alpha. Berikut aturan pengambilan keputusan terhadap hipotesis.

jika nilai probabilitas \leq tingkat siginifikansi, H_0 diterima dan H_1 ditolak

jika nilai probabilitas > tingkat siginifikansi, H_0 ditolak dan H_1 diterima

Uji Asumsi Kesamaan Varians

Selain asumsi normalitas, asumsi lain yang dikenakan adalah asumsi kesamaan varians, yakni sampel-sampel yang diteliti berasal dari populasi-populasi yang memiliki varians yang sama. Untuk menguji apakah sampel-sampel yang diteliti berasal dari populasi-populasi yang memiliki varians yang sama, dapat digunakan uji Levene. Pada uji Levene,

  • Hipotesis nol menyatakan sampel-sampel yang diambil berasal dari populasi-populasi yang memiliki varians yang sama, sedangkan
  • Hipotesis alternatif menyatakan paling tidak terdapat sepasang populasi yang memiliki varians yang berbeda.
See also  Visualisasi data dengan Peta Heat Map

Pengambilan keputusan terhadap hipotesis dilakukan dengan membandingkan nilai statistik dari uji Levene L dengan nilai kritis F(F_{kritis}). Sebelum menghitung nilai kritis F, terlebih dahulu menghitung nilai dari derajat bebas pembilang dan derajat bebas penyebut. Berikut rumus untuk menghitung nilai dari derajat bebas pembilang dan derajat bebas penyebut

    \begin{align*} derajat bebas pembilang &= k-1 \\ derajat bebas penyebut&= N-1 \\ \end{align*}

Perhatikan bahwa

  • k menyatakan banyaknya sampel/populasi yang diteliti, sedangkan
  • N merupakan jumlah pengamatan/elemen dari seluruh sampel.

Diketahui misalkan

  • nilai k adalah 2, sedangkan
  • nilai N adalah 20 (n_1 + n_2 = 10 + 10 = 20 ).
  • Misalkan tingkatsignifikansi yang digunakan adalah 5%,
  • sehingga nilai kritis F dengan derajat bebas pembilang 2 − 1 = 1,
  • derajat bebas penyebut 20 − 2 = 18, dan
  • tingkat signifikansi 5% adalah 4,41

atau dengan R/RStudio

> qf(0.95,df1=1,df2=18)
[1] 4.413873
>

Berikut aturan pengambilan keputusan terhadap hipotesis berdasarkan uji Levene (aturan distribusi F).

jika L \leq F_{kritis}, maka H_0 diterima dan H_1 ditolak

jika L > F_{kritis}, maka H_0 ditolak dan H_1 diterima

 

Pengambilan keputusan terhadap hipotesis dapat juga digunakan pendekatan nilai probabilitas dari uji Levene. Nilai probabilitas tersebut dibandingkan dengan tingkat signifikansi \alpha.
Berikut aturan pengambilan keputusan terhadap hipotesis.

jika nilai probabilitas \geq \alpha, maka H_0 diterima dan H_1 ditolak

jika nilai probabilitas < \alpha, maka H_0 ditolak dan H_1 diterima

Contoh Kasus

Contoh soal contoh soal hipotesis nol dan hipotesis alternatif untuk uji dalam kasus ini. Misalkan seorang peneliti akan meneliti mengenai ada tidaknya perbedaan (secara rata-rata) nilai ujian matematika dasar antara mahasiswa laki-laki dan perempuan. Untuk keperluan penelitian, peneliti tersebut mengambil sampel sebanyak 20 nilai ujian mata kuliah matematika dasar yang terdiri dari 10 nilai ujian mahasiswa laki-laki dan 10 nilai ujian mahasiswa perempuan. Data yang telah dikumpulkan disajikan dalam tabel dibawah ini.

Peneliti akan menguji apakah terdapat perbedaan (secara rata-rata) yang signifikan secara statistika dari nilai ujian matematika dasar antara mahasiswa laki-laki dan perempuan dengan tingkat signifikansi 5%.

See also  Belajar R - Statistik Deskriptif

Berikut cara perhitungan manual Uji t Kesamaan Rata-Rata Dari Dua Populasi Tidak Berhubungan dengan Asumsi Varians Populasi Sama

 

Berdasarkan data tabel diatas, diketahui

  • \bar X = 71,3;
  • \bar Y = 79,5;
  • S_X = 8,097325;
  • S_Y = 5,502525,

sehingga

    \begin{align*} s_p&=\sqrt{\frac{s_X^2(n_1-1)+s_Y^2(n_2-1)}{n_X+n_Y-2}}\\ s_p&=\sqrt{\frac{(8,097325)^2(10 − 1) +(5,502525)^2(10-1)}{10+10-2}}\\ s_p&= 6,922588\\ \end{align*}

 

Nilai statistik dari uji t(t_{hitung}) dihitung sebagai berikut

    \begin{align*} t &=\frac{\bar{Y} - \bar{X}}{s_p \sqrt{\frac{1}{n_X}+\frac{1}{n_y}}}\\ \\ t &=\frac{79,5 - 71,3}{6,922588 \sqrt{\frac{1}{10}+\frac{1}{10}}}\\ \\ t &=2,648685349 \end{align*}

Nilai statistik dari uji t berdasarkan perhitungan adalah 2,648685394. Perhatikan bahwa karena |t_{hitung}| > |t_{kritis}|, yakni 2,6487 > 2,101, maka disimpulkan bahwa hipotesis nol ditolak dan hipotesis alternatif diterima. Hal ini berarti terdapat perbedaan (secara rata-rata) yang signifikan secara statistika dari nilai ujian matematika dasar antara mahasiswa laki-laki dan perempuan dengan tingkat signifikansi 5%.

t Test for Independent Populations with Assumption  \sigma_1=\sigma_2 dengan R/RStudio

Untuk menghitung t Test for Independent Populations with Assumption  \sigma_1=\sigma_2 sangat mudah sekali karena di R/RStudio sudah tersedia secara built in jadi nggak perlu install library lagi. Nanti perlu diperhatikan argument yaitu untuk membedakan hal berikut

library(readxl)
library(dplyr)
dat = readxl::read_xlsx("data.xlsx")
  • Ketika asumsi kesamaan varians populasi dipenuhi.
t.test(dat$Y,dat$X,var.equal=TRUE,paired=FALSE)

hasil

   Two Sample t-test

data:  dat$Y and dat$X
t = 2.6487, df = 18, p-value = 0.01633
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
  1.695807 14.704193
sample estimates:
mean of x mean of y 
     79.5      71.3 

perhatikan output “ketika asumsi varians populasi dipenuhi”. Diketahui nilai statistik dari uji t(t) adalah 2,6487. Perhatikan bahwa karena |t_{hitung}| > |t_{kritis}|, yakni 2,6487 > 2,101, maka disimpulkan bahwa hipotesis nol ditolak dan hipotesis alternatif diterima. Hal ini berarti terdapat perbedaan (secara rata-rata) yang signifikan secara statistika dari nilai ujian matematika dasar antara mahasiswa laki-laki dan perempuan dengan tingkat signifikansi 5%.

  • Ketika asumsi kesamaan varians populasi tidak dipenuhi.
t.test(dat$Y,dat$X,var.equal=FALSE,paired=FALSE)

hasil

   Welch Two Sample t-test

data:  dat$Y and dat$X
t = 2.6487, df = 15.851, p-value = 0.01762
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
  1.632025 14.767975
sample estimates:
mean of x mean of y 
     79.5      71.3

 

 

ref: Belajar Statistika dengan R Prana Ugiana Gio, Dasapta Erwin Irawan, 2016