Uji Kesamaan Rata-Rata Dari Dua Populasi Tidak Berhubungan dan Asumsi Varians Populasi Berbeda

By | January 2, 2022
3,046 Views

Uji Kesamaan Rata-Rata dari Dua Populasi yang Tidak Berhubungan (Independen) dengan Asumsi Varians Berbeda (t Test for Independent Populations with Assumption \sigma_1 \neq \sigma_2 berguna untuk menguji ada tidaknya perbedaan rata-rata antara populasi pertama dan populasi kedua. Dengan kata lain, menguji apakah selisih rata-rata antara kelompok kedua dan pertama berbeda atau sama dengan nol. Dalam uji ini, pengamatan pada populasi pertama saling bebas/independen (independent) dengan pengamatan-pengamatan pada populasi kedua (independent populations). Untuk pembahasan yang lain, bisa baca disini.

Berikut beberapa contoh kasus yang dapat diselesaikan dengan pendekatan uji kesamaan rata-rata dari dua populasi tidak berhubungan (independen) dengan asumsi varians yang sama dengan uji t

  • Menguji ada tidaknya perbedaan (perbedaan yang signifikan secara statistika) nilai indeks prestasi (secara rata-rata) antara mahasiswa laki-laki dan perempuan.
  • Menguji ada tidaknya perbedaan harga saham antara perusahaan manufaktur dan real estate.
  • Menguji ada tidaknya perbedaan uang jajan antara mahasiswa kedokteran dan mahasiswa matematika.
  • Menguji ada tidaknya perbedaan indeks prestasi antara mahasiswa dominan otak kanan dan dominan kotak kiri.

Uji Hipotesis

Dalam uji kesamaan rata-rata dari dua populasi yang tidak berhubungan dengan asumsi varians yang berbeda yaitu

  • hipotesis nol menyatakan tidak terdapat perbedaan rata-rata antara populasi pertama dan populasi kedua. Dengan kata lain, selisih rata-rata antara populasi kedua dan pertama sama dengan nol \mu_2-\mu_1=0
  • Hipotesis alternatif menyatakan terdapat perbedaan rata-rata antara populasi pertama dan populasi kedua. Dengan kata lain, selisih rata-rata antara populasi kedua dan pertama berbeda dari nol \mu_2-\mu_1 \neq 0.

Nilai statistik dari uji t t_{hitung} dihitung dengan rumus sebagai berikut.

    \[ t=\frac{\bar{X}_2-\bar{X}_1}{\sqrt{\frac{s^2_1}{n_1}+\frac{s^2_2}{n_2}}} \]

  • t merupakan nilai statistik dari uji t
  • \bar{X}_1 dan \bar{X}_2 merupakan nilai rata-rata dari sampel pertama dan kedua
  • s_1 dan s_2 merupakan nilai standar deviasi dari sampel pertama dan kedua
  • n_1 dan n_2 merupakan jumlah pengamatan dalam sampel pertama dan kedua.

Untuk pengambilan keputusan terhadap hipotesis, dapat dilakukan dengan membandingkan nilai statistik dari uji t terhadap nilai kritis t t_{kritis}. Sebelum menghitung nilai kritis t, terlebih dahulu menghitung nilai derajat bebas. Berikut rumus untuk menghitung nilai derajat bebas.

    \[ derajatbebas = \frac{(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2})^2}{\frac{(\frac{s_1^2}{n_1})^2}{n_1-1}+\frac{(\frac{s_2^2}{n_2})^2}{n_2-1}} \]

Berikut aturan pengambilan keputusan terhadap hipotesis berdasarkan uji t

  • jika |t_{hitung}|\leq |t_{kritis}|, maka H_0 diterima dan H_1 ditolak
  • jika |t_{hitung}| > |t_{kritis}|, maka H_0 ditolak dan H_1 diterima

 

Pengambilan keputusan terhadap hipotesis juga dapat dilakukan dengan menggunakan pendekatan nilai probabilitas dari uji t. Nilai probabilitas dari uji t dibandingkan dengan tingkat signifikansi yang digunakan. Berikut aturan pengambilan keputusan terhadap hipotesis berdasarkan nilai probabilitas.

jika nilai probabilitas \leq tingkat signifikansi maka H_0 diterima dan H_1 ditolak

jika nilai  probabilitas <  tingkat signifikansi maka H_0 ditolak dan H_1 diterima

Uji Asumsi Normalitas

Dalam uji kesamaan rata-rata dari dua populasi yang tidak berhubungan dengan asumsi varians beda, populasi pertama dan populasi kedua diasumsikan berdistribusi normal. Namun ketika ukuran sampel cukup besar, yakni masing-masing sampel berukuran ≥ 30, maka populasi tidak harus berdistribusi normal. 

See also  Merge file CSV dengan Cepat

Untuk menguji asumsi normalitas tersebut, dapat digunakan pendekatan grafik, yakni Q-Q plot. Pada pendekatan Q-Q plot, jika titik-titik (dots) menyebar jauh (menyebar jauh berliku-liku pada garis diagonal seperti ular) dari garis diagonal, maka diindikasi asumsi normalitas tidak dipenuhi. Jika titik-titik menyebar sangat dekat pada garis diagonal, maka asumsi normalitas dipenuhi.

Di samping itu, dapat juga digunakan pendekatan uji Kolmogorov-Smirnov atau uji Jarque-Bera, untuk menguji asumsi normalitas.

  • Hipotesis nol menyatakan data sampel ditarik dari populasi yang berdistribusi normal, sedangkan
  • Hipotesis alternatif menyatakan data sampel ditarik dari populasi yang tidak berdistribusi normal.

Untuk pengambilan keputusan terhadap hipotesis, dapat dibandingkan antara nilai probabilitas dari uji Kolmogorov-Smirnov atau uji Jarque-Bera, dengan tingkat signifikansi yang digunakan \alpha. Berikut aturan pengambilan keputusan terhadap hipotesis.

jika nilai probabilitas \leq tingkat siginifikansi, H_0 diterima dan H_1 ditolak

jika nilai probabilitas > tingkat siginifikansi, H_0 ditolak dan H_1 diterima

Uji Asumsi Kesamaan Varians

Selain asumsi normalitas, asumsi lain yang dikenakan adalah asumsi kesamaan varians, yakni sampel-sampel yang diteliti berasal dari populasi-populasi yang memiliki varians yang sama. Untuk menguji apakah sampel-sampel yang diteliti berasal dari populasi-populasi yang memiliki varians yang sama, dapat digunakan uji Levene. Pada uji Levene,

  • Hipotesis nol menyatakan sampel-sampel yang diambil berasal dari populasi-populasi yang memiliki varians yang sama, sedangkan
  • Hipotesis alternatif menyatakan paling tidak terdapat sepasang populasi yang memiliki varians yang berbeda.

Pengambilan keputusan terhadap hipotesis dilakukan dengan membandingkan nilai statistik dari uji Levene L dengan nilai kritis F(F_{kritis}). Sebelum menghitung nilai kritis F, terlebih dahulu menghitung nilai dari derajat bebas pembilang dan derajat bebas penyebut. Berikut rumus untuk menghitung nilai dari derajat bebas pembilang dan derajat bebas penyebut

    \begin{align*} derajat bebas pembilang &= k-1 \\ derajat bebas penyebut&= N-1 \\ \end{align*}

Perhatikan bahwa

  • k menyatakan banyaknya sampel/populasi yang diteliti, sedangkan
  • N merupakan jumlah pengamatan/elemen dari seluruh sampel.

Diketahui misalkan

  • nilai k adalah 2, sedangkan
  • nilai N adalah 20 (n_1 + n_2 = 10 + 10 = 20 ).
  • Misalkan tingkatsignifikansi yang digunakan adalah 5%,
  • sehingga nilai kritis F dengan derajat bebas pembilang 2 − 1 = 1,
  • derajat bebas penyebut 20 − 2 = 18, dan
  • tingkat signifikansi 5% adalah 4,41

atau dengan R/RStudio

> qf(0.95,df1=1,df2=18)
[1] 4.413873
>

Berikut aturan pengambilan keputusan terhadap hipotesis berdasarkan uji Levene (aturan distribusi F).

jika L \leq F_{kritis}, maka H_0 diterima dan H_1 ditolak

jika L > F_{kritis}, maka H_0 ditolak dan H_1 diterima

 

Pengambilan keputusan terhadap hipotesis dapat juga digunakan pendekatan nilai probabilitas dari uji Levene. Nilai probabilitas tersebut dibandingkan dengan tingkat signifikansi \alpha.
Berikut aturan pengambilan keputusan terhadap hipotesis.

jika nilai probabilitas \geq \alpha, maka H_0 diterima dan H_1 ditolak

jika nilai probabilitas < \alpha, maka H_0 ditolak dan H_1 diterima

Contoh Kasus

Kita akan meneliti mengenai ada tidaknya perbedaan nilai ujian antara mahasiswa laki-laki dan mahasiswa perempuan. Untuk
keperluan penelitian, diambil sampel sebanyak
20 nilai ujian terdiri dari

  • 10 nilai ujian mahasiswa laki-laki dan
  • 10 nilai ujian mahasiswa perempuan.
See also  Text Preprocessing dan text minning

Kita akan menguji apakah terdapat perbedaan (secara rata-rata) yang signifikan secara statistika antara mahasiswa laki-laki dan perempuan dengan tingkat signifikansi 5%.

 

Berikut akan dihitung nilai derajat bebas (degree of freedom)

    \begin{align*} derajatbebas &= \frac{(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2})^2}{\frac{(\frac{s_1^2}{n_1})^2}{n_1-1}+\frac{(\frac{s_2^2}{n_2})^2}{n_2-1}} \\\\ &= \frac{(\frac{0,875595^2}{10}+\frac{4,141927^2}{10})^2}{\frac{(\frac{0,875595^2}{10})^2}{10-1}+\frac{(\frac{4,141927^2}{10})^2}{10-1}} \\\\ &=9,802 \end{align*}

Menghitung uji t_{kritis}

Diketahui derajat bebas (df) bernilai 9,802 bila dibulatkan menjadi 10. Nilai kritis t dengan derajat bebas 10 dan tingkat signifikansi 5% adalah ±2,228. Berikut aturan pengambilan keputusan terhadap hipotesis berdasarkan uji t

  • jika |t_{hitung}|\leq |t_{kritis}|, maka H_0 diterima dan H_1 ditolak
  • jika |t_{hitung}| > |t_{kritis}|, maka H_0 ditolak dan H_1 diterima

 

 

Menghitung uji t_{hitung}

Berikut cara menghitung uji t_{hitung}

Menghitung t_{hitung}

    \begin{align*} t & =\frac{\bar{Y}-\bar{X}}{\sqrt{\frac{s^2_x}{n_x}+\frac{s^2_y}{n_y}}}\\ & =\frac{93,6-70,9}{\sqrt{\frac{(0,8755)^2}{10}+\frac{(4,141927)^2}{10}}}\\\\ & = 16,9563 \end{align*}

Nilai statistik dari uji t berdasarkan perhitungan adalah 16,9563. Perhatikan bahwa karena |t_{hitung}| > |t_{kritis}|, yakni 16,956 > 2,228, maka disimpulkan bahwa hipotesis nol ditolak dan hipotesis alternatif diterima. Hal ini berarti terdapat perbedaan (secara rata-rata) yang signifikan secara statistika dari nilai ujian antara mahasiswa laki-laki dan perempuan dengan tingkat signifikansi 5%.

Menghitung dengan R/RStudio

Berikut cara perhitungan Uji Kesamaan Rata-Rata Dari Dua Populasi Tidak Berhubungan dan Asumsi Varians Populasi Berbeda dengan R/RStudio, perhatikan parameter argumentnya.

library(readxl)
library(dplyr)

dat = readxl::read_xlsx('data independent.xlsx')
t.test(dat$Y,dat$X,var.equal=FALSE, paired=FALSE)

hasil

   Welch Two Sample t-test

data:  dat$Y and dat$X
t = 16.956, df = 9.8028, p-value = 1.374e-08
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 19.70895 25.69105
sample estimates:
mean of x mean of y 
     93.6      70.9

Perhatikan bahwa karena |t_{hitung}|>|t_{kritis}| , yakni 16,956 > 2,228, maka disimpulkan bahwa hipotesis nol ditolak dan hipotesis alternatif diterima. Hal ini berarti terdapat perbedaan (secara rata-rata) yang signifikan secara statistika dari nilai ujian matematika dasar antara mahasiswa laki-laki dan perempuan dengan tingkat signifikansi 5%. Pengambilan keputusan terhadap hipotesis juga dapat dilakukan dengan menggunakan nilai probabilitas dari uji t (p-value). Nilai probabilitas dari uji t dibandingkan dengan tingkat signifikansi yang digunakan. Berikut aturan pengambilan keputusan terhadap hipotesis berdasarkan nilai probabilitas.

jika nilai probabilitas \geq \alpha, maka H_0 diterima dan H_1 ditolak

jika nilai probabilitas < \alpha, maka H_0 ditolak dan H_1 diterima

Diketahui nilai probabilitas (p-value) dari uji t adalah 0,0000001374. Karena nilai probabilitas tersebut (p-value) lebih kecil dibandingkan tingkat signifikansi \alpha= 0,05, maka hipotesis nol ditolak dan hipotesis alternatif diterima. Hal ini berarti terdapat perbedaan (secara rata-rata) yang signifikan secara statistika dari nilai ujian matematika dasar antara mahasiswa laki-laki dan perempuan dengan tingkat signifikansi 5%.

Uji Asumsi Normalitas

Dalam uji kesamaan rata-rata dari dua populasi yang tidak berhubungan dengan asumsi varians yang berbeda, populasi pertama dan populasi kedua diasumsikan berdistribusi normal. Kita akan menggunakan Cara Hitung Manual Uji Normalitas Populasi dengan Uji Jarque-Bera dan Cara Hitung Manual Uji Normalitas dengan Uji Kolmogorov-Smirnov

See also  Install Remove dan Update R version di Linux

Uji Normalitas Kolmogorov-Smirnov

library(nortest)
nortest::lillie.test(dat$X)
nortest::lillie.test(dat$Y)

hasil

> nortest::lillie.test(dat$X)
   Lilliefors (Kolmogorov-Smirnov) normality test

data:  dat$X
D = 0.248, p-value = 0.08194

> nortest::lillie.test(dat$Y)

   Lilliefors (Kolmogorov-Smirnov) normality test

data:  dat$Y
D = 0.094141, p-value = 0.9987

Bila menggunakan SPSS

 

Uji Normalitas Jarque Bera

library(tseries)
jarque.bera.test(dat$X)
jarque.bera.test(dat$Y)

hasil

> jarque.bera.test(dat$X)

   Jarque Bera Test

data:  dat$X
X-squared = 1.0296, df = 2, p-value = 0.5976

> jarque.bera.test(dat$Y)

   Jarque Bera Test

data:  dat$Y
X-squared = 0.20791, df = 2, p-value = 0.9013

Perhatikan output diatas

  • nilai probabilitas dari uji Kolmogorov-Smirnov untuk
    • sampel X (p-value) adalah 0,57,
    • sementara untuk sampel Y adalah 0,999.
  • nilai probabilitas dari uji Jarque-Bera untuk
    • sampel X (p-value) adalah 0,5976,
    • sementara untuk sampel Y adalah 0,9013.

Karena masing-masing nilai probabilitas lebih besar dibandingkan tingkat signifikansi, yakni 0,05, maka hipotesis nol diterima, dan hipotesis alternatif ditolak. Hal ini berarti asumsi normalitas dipenuhi.

Uji Asumsi Ketidaksamaan Varians dalam R

Selain asumsi normalitas, asumsi lain yang dikenakan adalah asumsi ketidaksamaan varians, yakni sampel-sampel yang diteliti berasal dari populasi-populasi yang memiliki varians yang berbeda. Untuk menguji apakah sampel-sampel yang diteliti berasal dari populasi-populasi yang memiliki varians yang berbeda, dapat digunakan uji Levene. Kalian cukup buat kelas untuk membedakan X dan Y. Diubah menjadi berikut

      XY KELAS
   <dbl> <dbl>
 1    70     1
 2    71     1
 3    72     1
 4    70     1
 5    71     1
 6    72     1
 7    70     1
 8    70     1
 9    71     1
10    72     1
11    90     2
12    91     2
13    92     2
14    93     2
15    94     2
16    95     2
17    86     2
18    97     2
19    98     2
20   100     2

Kita pakai SPSS saja yuk buat uji levene.

Analisis Descriptive juga butuh analisis descriptive, kita pilih Options akan tampil kotak dialog berikut dan centang Descriptive dan Homogeneity of variance test
keluaran SPSS yaitu nilai Levene L = 10.305

Untuk nilai F_{kritis} = 4.4138

Untuk pengambilan keputusan terhadap hipotesis dapat dilakukan dengan membandingkan nilai statistik dari uji Levene (L) terhadap nilai kritis dari tabel distribusi  F F_{kritis}. Berikut aturan pengambilan keputusan terhadap hipotesis berdasarkan uji Levene.

jika L \leq nilai kritis F, maka H_o diterima dan H_1 ditolak

jika L > nilai kritis F, maka H_o ditolak dan H_1 diterima

Sehingga nilai 10.305 > 4.4138 yang artinya H_0 ditolak dan H_1 diterima atau menyatakan paling tidak terdapat sepasang populasi yang memiliki varians yang berbeda.

Pengambilan keputusan terhadap hipotesis juga dapat dilakukan dengan membandingkan nilai probabilitas dari uji Levene terhadap tingkat signifikansi  \alpha

jika nilai probabilitas \geq  tingkat signifikansi, maka H_o diterima dan H_1 ditolak

jika nilai probabilitas <  tingkat signifikansi, maka H_o ditolak dan H_1 diterima

Nilai probabilitas /sig. SPSS sebesar 0.005 < 0.5 sehingga H_0 ditolak dan H_1 diterima atau menyatakan paling tidak terdapat sepasang populasi yang memiliki varians yang berbeda pada tingkat signifikansi 5%

Ref:

Belajar Statistika dengan R Prana Ugiana Gio, Dasapta Erwin Irawan, 2016