Uji Kesamaan Rata-Rata Dari Dua Populasi Tidak Berhubungan dan Asumsi Varians Populasi Berbeda

4,281 Views

Uji Kesamaan Rata-Rata dari Dua Populasi yang Tidak Berhubungan (Independen) dengan Asumsi Varians Berbeda (t Test for Independent Populations with Assumption $\sigma_1 \neq \sigma_2$ berguna untuk menguji ada tidaknya perbedaan rata-rata antara populasi pertama dan populasi kedua. Dengan kata lain, menguji apakah selisih rata-rata antara kelompok kedua dan pertama berbeda atau sama dengan nol. Dalam uji ini, pengamatan pada populasi pertama saling bebas/independen (independent) dengan pengamatan-pengamatan pada populasi kedua (independent populations). Untuk pembahasan yang lain, bisa baca disini.

Berikut beberapa contoh kasus yang dapat diselesaikan dengan pendekatan uji kesamaan rata-rata dari dua populasi tidak berhubungan (independen) dengan asumsi varians yang sama dengan uji t

Menguji ada tidaknya perbedaan (perbedaan yang signifikan secara statistika) nilai indeks prestasi (secara rata-rata) antara mahasiswa laki-laki dan perempuan.
Menguji ada tidaknya perbedaan harga saham antara perusahaan manufaktur dan real estate.
Menguji ada tidaknya perbedaan uang jajan antara mahasiswa kedokteran dan mahasiswa matematika.
Menguji ada tidaknya perbedaan indeks prestasi antara mahasiswa dominan otak kanan dan dominan kotak kiri.

Uji Hipotesis

Contents

1 Uji Hipotesis
2 Uji Asumsi Normalitas
3 Uji Asumsi Kesamaan Varians
4 Contoh Kasus
5 Menghitung dengan R/RStudio
6 Uji Asumsi Normalitas
7 Uji Asumsi Ketidaksamaan Varians dalam R

Dalam uji kesamaan rata-rata dari dua populasi yang tidak berhubungan dengan asumsi varians yang berbeda yaitu

hipotesis nol menyatakan tidak terdapat perbedaan rata-rata antara populasi pertama dan populasi kedua. Dengan kata lain, selisih rata-rata antara populasi kedua dan pertama sama dengan nol $\mu_2-\mu_1=0$
Hipotesis alternatif menyatakan terdapat perbedaan rata-rata antara populasi pertama dan populasi kedua. Dengan kata lain, selisih rata-rata antara populasi kedua dan pertama berbeda dari nol $\mu_2-\mu_1 \neq 0$ .

Nilai statistik dari uji t $t_{hitung}$ dihitung dengan rumus sebagai berikut.

$t=\frac{\bar{X}_2-\bar{X}_1}{\sqrt{\frac{s^2_1}{n_1}+\frac{s^2_2}{n_2}}}$

$t$ merupakan nilai statistik dari uji $t$
$\bar{X}_1$ dan $\bar{X}_2$ merupakan nilai rata-rata dari sampel pertama dan kedua
$s_1$ dan $s_2$ merupakan nilai standar deviasi dari sampel pertama dan kedua
$n_1$ dan $n_2$ merupakan jumlah pengamatan dalam sampel pertama dan kedua.

Untuk pengambilan keputusan terhadap hipotesis, dapat dilakukan dengan membandingkan nilai statistik dari uji $t$ terhadap nilai kritis $t$ $t_{kritis}$ . Sebelum menghitung nilai kritis $t$ , terlebih dahulu menghitung nilai derajat bebas. Berikut rumus untuk menghitung nilai derajat bebas.

$derajatbebas = \frac{(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2})^2}{\frac{(\frac{s_1^2}{n_1})^2}{n_1-1}+\frac{(\frac{s_2^2}{n_2})^2}{n_2-1}}$

Berikut aturan pengambilan keputusan terhadap hipotesis berdasarkan uji $t$

jika $|t_{hitung}|\leq |t_{kritis}|$ , maka $H_0$ diterima dan $H_1$ ditolak
jika $|t_{hitung}| > |t_{kritis}|$ , maka $H_0$ ditolak dan $H_1$ diterima

Pengambilan keputusan terhadap hipotesis juga dapat dilakukan dengan menggunakan pendekatan nilai probabilitas dari uji $t$ . Nilai probabilitas dari uji $t$ dibandingkan dengan tingkat signifikansi yang digunakan. Berikut aturan pengambilan keputusan terhadap hipotesis berdasarkan nilai probabilitas.

jika nilai probabilitas $\leq$ tingkat signifikansi maka $H_0$ diterima dan $H_1$ ditolak

jika nilai probabilitas $<$ tingkat signifikansi maka $H_0$ ditolak dan $H_1$ diterima

Uji Asumsi Normalitas

Dalam uji kesamaan rata-rata dari dua populasi yang tidak berhubungan dengan asumsi varians beda, populasi pertama dan populasi kedua diasumsikan berdistribusi normal. Namun ketika ukuran sampel cukup besar, yakni masing-masing sampel berukuran ≥ 30, maka populasi tidak harus berdistribusi normal.

Untuk menguji asumsi normalitas tersebut, dapat digunakan pendekatan grafik, yakni Q-Q plot. Pada pendekatan Q-Q plot, jika titik-titik (dots) menyebar jauh (menyebar jauh berliku-liku pada garis diagonal seperti ular) dari garis diagonal, maka diindikasi asumsi normalitas tidak dipenuhi. Jika titik-titik menyebar sangat dekat pada garis diagonal, maka asumsi normalitas dipenuhi.

Di samping itu, dapat juga digunakan pendekatan uji Kolmogorov-Smirnov atau uji Jarque-Bera, untuk menguji asumsi normalitas.

Hipotesis nol menyatakan data sampel ditarik dari populasi yang berdistribusi normal, sedangkan
Hipotesis alternatif menyatakan data sampel ditarik dari populasi yang tidak berdistribusi normal.

Untuk pengambilan keputusan terhadap hipotesis, dapat dibandingkan antara nilai probabilitas dari uji Kolmogorov-Smirnov atau uji Jarque-Bera, dengan tingkat signifikansi yang digunakan $\alpha$ . Berikut aturan pengambilan keputusan terhadap hipotesis.

jika nilai probabilitas $\leq$ tingkat siginifikansi, $H_0$ diterima dan $H_1$ ditolak

jika nilai probabilitas $>$ tingkat siginifikansi, $H_0$ ditolak dan $H_1$ diterima

Uji Asumsi Kesamaan Varians

Selain asumsi normalitas, asumsi lain yang dikenakan adalah asumsi kesamaan varians, yakni sampel-sampel yang diteliti berasal dari populasi-populasi yang memiliki varians yang sama. Untuk menguji apakah sampel-sampel yang diteliti berasal dari populasi-populasi yang memiliki varians yang sama, dapat digunakan uji Levene. Pada uji Levene,

Hipotesis nol menyatakan sampel-sampel yang diambil berasal dari populasi-populasi yang memiliki varians yang sama, sedangkan
Hipotesis alternatif menyatakan paling tidak terdapat sepasang populasi yang memiliki varians yang berbeda.

Pengambilan keputusan terhadap hipotesis dilakukan dengan membandingkan nilai statistik dari uji Levene $L$ dengan nilai kritis $F(F_{kritis})$ . Sebelum menghitung nilai kritis $F$ , terlebih dahulu menghitung nilai dari derajat bebas pembilang dan derajat bebas penyebut. Berikut rumus untuk menghitung nilai dari derajat bebas pembilang dan derajat bebas penyebut

$\begin{align*} derajat bebas pembilang &= k-1 \\ derajat bebas penyebut&= N-1 \\ \end{align*}$

Perhatikan bahwa

$k$ menyatakan banyaknya sampel/populasi yang diteliti, sedangkan
$N$ merupakan jumlah pengamatan/elemen dari seluruh sampel.

Diketahui misalkan

nilai $k$ adalah 2, sedangkan
nilai $N$ adalah 20 $(n_1 + n_2 = 10 + 10 = 20 )$ .
Misalkan tingkatsignifikansi yang digunakan adalah 5%,
sehingga nilai kritis $F$ dengan derajat bebas pembilang 2 − 1 = 1,
derajat bebas penyebut 20 − 2 = 18, dan
tingkat signifikansi 5% adalah 4,41

atau dengan R/RStudio

> qf(0.95,df1=1,df2=18)
[1] 4.413873
>

Berikut aturan pengambilan keputusan terhadap hipotesis berdasarkan uji Levene (aturan distribusi F).

jika $L \leq F_{kritis}$ , maka $H_0$ diterima dan $H_1$ ditolak

jika $L > F_{kritis}$ , maka $H_0$ ditolak dan $H_1$ diterima

Pengambilan keputusan terhadap hipotesis dapat juga digunakan pendekatan nilai probabilitas dari uji Levene. Nilai probabilitas tersebut dibandingkan dengan tingkat signifikansi $\alpha$ .
Berikut aturan pengambilan keputusan terhadap hipotesis.

jika nilai probabilitas $\geq \alpha$ , maka $H_0$ diterima dan $H_1$ ditolak

jika nilai probabilitas $< \alpha$ , maka $H_0$ ditolak dan $H_1$ diterima

Contoh Kasus

Kita akan meneliti mengenai ada tidaknya perbedaan nilai ujian antara mahasiswa laki-laki dan mahasiswa perempuan. Untuk
keperluan penelitian, diambil sampel sebanyak 20 nilai ujian terdiri dari

10 nilai ujian mahasiswa laki-laki dan
10 nilai ujian mahasiswa perempuan.

Kita akan menguji apakah terdapat perbedaan (secara rata-rata) yang signifikan secara statistika antara mahasiswa laki-laki dan perempuan dengan tingkat signifikansi 5%.

Berikut akan dihitung nilai derajat bebas (degree of freedom)

$\begin{align*} derajatbebas &= \frac{(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2})^2}{\frac{(\frac{s_1^2}{n_1})^2}{n_1-1}+\frac{(\frac{s_2^2}{n_2})^2}{n_2-1}} \\\\ &= \frac{(\frac{0,875595^2}{10}+\frac{4,141927^2}{10})^2}{\frac{(\frac{0,875595^2}{10})^2}{10-1}+\frac{(\frac{4,141927^2}{10})^2}{10-1}} \\\\ &=9,802 \end{align*}$

Menghitung uji $t_{kritis}$

Diketahui derajat bebas (df) bernilai 9,802 bila dibulatkan menjadi 10. Nilai kritis $t$ dengan derajat bebas 10 dan tingkat signifikansi 5% adalah ±2,228. Berikut aturan pengambilan keputusan terhadap hipotesis berdasarkan uji $t$

jika $|t_{hitung}|\leq |t_{kritis}|$ , maka $H_0$ diterima dan $H_1$ ditolak
jika $|t_{hitung}| > |t_{kritis}|$ , maka $H_0$ ditolak dan $H_1$ diterima

Menghitung uji $t_{hitung}$

Berikut cara menghitung uji $t_{hitung}$

Menghitung $t_{hitung}$

$\begin{align*} t & =\frac{\bar{Y}-\bar{X}}{\sqrt{\frac{s^2_x}{n_x}+\frac{s^2_y}{n_y}}}\\ & =\frac{93,6-70,9}{\sqrt{\frac{(0,8755)^2}{10}+\frac{(4,141927)^2}{10}}}\\\\ & = 16,9563 \end{align*}$

Nilai statistik dari uji $t$ berdasarkan perhitungan adalah 16,9563. Perhatikan bahwa karena $|t_{hitung}| > |t_{kritis}|$ , yakni 16,956 > 2,228, maka disimpulkan bahwa hipotesis nol ditolak dan hipotesis alternatif diterima. Hal ini berarti terdapat perbedaan (secara rata-rata) yang signifikan secara statistika dari nilai ujian antara mahasiswa laki-laki dan perempuan dengan tingkat signifikansi 5%.

Menghitung dengan R/RStudio

Berikut cara perhitungan Uji Kesamaan Rata-Rata Dari Dua Populasi Tidak Berhubungan dan Asumsi Varians Populasi Berbeda dengan R/RStudio, perhatikan parameter argumentnya.

library(readxl)
library(dplyr)

dat = readxl::read_xlsx('data independent.xlsx')
t.test(dat$Y,dat$X,var.equal=FALSE, paired=FALSE)

hasil

   Welch Two Sample t-test

data:  dat$Y and dat$X
t = 16.956, df = 9.8028, p-value = 1.374e-08
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 19.70895 25.69105
sample estimates:
mean of x mean of y 
     93.6      70.9

Perhatikan bahwa karena $|t_{hitung}|>|t_{kritis}|$ , yakni 16,956 > 2,228, maka disimpulkan bahwa hipotesis nol ditolak dan hipotesis alternatif diterima. Hal ini berarti terdapat perbedaan (secara rata-rata) yang signifikan secara statistika dari nilai ujian matematika dasar antara mahasiswa laki-laki dan perempuan dengan tingkat signifikansi 5%. Pengambilan keputusan terhadap hipotesis juga dapat dilakukan dengan menggunakan nilai probabilitas dari uji $t$ (p-value). Nilai probabilitas dari uji $t$ dibandingkan dengan tingkat signifikansi yang digunakan. Berikut aturan pengambilan keputusan terhadap hipotesis berdasarkan nilai probabilitas.

jika nilai probabilitas $\geq \alpha$ , maka $H_0$ diterima dan $H_1$ ditolak

jika nilai probabilitas $< \alpha$ , maka $H_0$ ditolak dan $H_1$ diterima

Diketahui nilai probabilitas (p-value) dari uji $t$ adalah 0,0000001374. Karena nilai probabilitas tersebut (p-value) lebih kecil dibandingkan tingkat signifikansi $\alpha= 0,05$ , maka hipotesis nol ditolak dan hipotesis alternatif diterima. Hal ini berarti terdapat perbedaan (secara rata-rata) yang signifikan secara statistika dari nilai ujian matematika dasar antara mahasiswa laki-laki dan perempuan dengan tingkat signifikansi 5%.

Uji Asumsi Normalitas

Dalam uji kesamaan rata-rata dari dua populasi yang tidak berhubungan dengan asumsi varians yang berbeda, populasi pertama dan populasi kedua diasumsikan berdistribusi normal. Kita akan menggunakan Cara Hitung Manual Uji Normalitas Populasi dengan Uji Jarque-Bera dan Cara Hitung Manual Uji Normalitas dengan Uji Kolmogorov-Smirnov

Uji Normalitas Kolmogorov-Smirnov

library(nortest)
nortest::lillie.test(dat$X)
nortest::lillie.test(dat$Y)

hasil

> nortest::lillie.test(dat$X)
   Lilliefors (Kolmogorov-Smirnov) normality test

data:  dat$X
D = 0.248, p-value = 0.08194

> nortest::lillie.test(dat$Y)

   Lilliefors (Kolmogorov-Smirnov) normality test

data:  dat$Y
D = 0.094141, p-value = 0.9987

Bila menggunakan SPSS

Uji Normalitas Jarque Bera

library(tseries)
jarque.bera.test(dat$X)
jarque.bera.test(dat$Y)

hasil

> jarque.bera.test(dat$X)

   Jarque Bera Test

data:  dat$X
X-squared = 1.0296, df = 2, p-value = 0.5976

> jarque.bera.test(dat$Y)

   Jarque Bera Test

data:  dat$Y
X-squared = 0.20791, df = 2, p-value = 0.9013

Perhatikan output diatas

nilai probabilitas dari uji Kolmogorov-Smirnov untuk
- sampel X (p-value) adalah 0,57,
- sementara untuk sampel Y adalah 0,999.
nilai probabilitas dari uji Jarque-Bera untuk
- sampel X (p-value) adalah 0,5976,
- sementara untuk sampel Y adalah 0,9013.

Karena masing-masing nilai probabilitas lebih besar dibandingkan tingkat signifikansi, yakni 0,05, maka hipotesis nol diterima, dan hipotesis alternatif ditolak. Hal ini berarti asumsi normalitas dipenuhi.

Uji Asumsi Ketidaksamaan Varians dalam R

Selain asumsi normalitas, asumsi lain yang dikenakan adalah asumsi ketidaksamaan varians, yakni sampel-sampel yang diteliti berasal dari populasi-populasi yang memiliki varians yang berbeda. Untuk menguji apakah sampel-sampel yang diteliti berasal dari populasi-populasi yang memiliki varians yang berbeda, dapat digunakan uji Levene. Kalian cukup buat kelas untuk membedakan X dan Y. Diubah menjadi berikut

      XY KELAS
   <dbl> <dbl>
 1    70     1
 2    71     1
 3    72     1
 4    70     1
 5    71     1
 6    72     1
 7    70     1
 8    70     1
 9    71     1
10    72     1
11    90     2
12    91     2
13    92     2
14    93     2
15    94     2
16    95     2
17    86     2
18    97     2
19    98     2
20   100     2

Kita pakai SPSS saja yuk buat uji levene.

Analisis Descriptive juga butuh analisis descriptive, kita pilih Options akan tampil kotak dialog berikut dan centang Descriptive dan Homogeneity of variance test

keluaran SPSS yaitu nilai Levene L = 10.305

Untuk nilai $F_{kritis}$ = 4.4138

Untuk pengambilan keputusan terhadap hipotesis dapat dilakukan dengan membandingkan nilai statistik dari uji Levene $(L)$ terhadap nilai kritis dari tabel distribusi F $F_{kritis}$ . Berikut aturan pengambilan keputusan terhadap hipotesis berdasarkan uji Levene.

jika $L \leq$ nilai kritis F, maka $H_o$ diterima dan $H_1$ ditolak

jika $L >$ nilai kritis F, maka $H_o$ ditolak dan $H_1$ diterima

Sehingga nilai 10.305 > 4.4138 yang artinya $H_0$ ditolak dan $H_1$ diterima atau menyatakan paling tidak terdapat sepasang populasi yang memiliki varians yang berbeda.

Pengambilan keputusan terhadap hipotesis juga dapat dilakukan dengan membandingkan nilai probabilitas dari uji Levene terhadap tingkat signifikansi $\alpha$

jika nilai probabilitas $\geq$ tingkat signifikansi, maka $H_o$ diterima dan $H_1$ ditolak

jika nilai probabilitas $<$ tingkat signifikansi, maka $H_o$ ditolak dan $H_1$ diterima

Nilai probabilitas /sig. SPSS sebesar 0.005 < 0.5 sehingga $H_0$ ditolak dan $H_1$ diterima atau menyatakan paling tidak terdapat sepasang populasi yang memiliki varians yang berbeda pada tingkat signifikansi 5%

Ref:

Belajar Statistika dengan R Prana Ugiana Gio, Dasapta Erwin Irawan, 2016

Uji Hipotesis

Uji Asumsi Normalitas

Uji Asumsi Kesamaan Varians

Contoh Kasus

Berikut akan dihitung nilai derajat bebas (degree of freedom)

Menghitung uji

Menghitung uji

Menghitung dengan R/RStudio

Uji Asumsi Normalitas

Uji Asumsi Ketidaksamaan Varians dalam R

Leave a Comment Cancel reply

Menghitung uji $t_{kritis}$

Menghitung uji $t_{hitung}$