Buku Belajar Dasar Statistika dengan R – Deteksi Autokorelasi

By | June 13, 2020
Print Friendly, PDF & Email

Kalau membahas mengenai regresi linear, maka setidaknya ada 5 jenis asumsi yang harus kalian lakukan

  1. Normalitas
  2. Linearitas
  3. Multikolinearitas
  4. Autokolinearitas
  5. Heteroskedastisitas

Tapi pada sesi ini saya hanya akan membahas mengenai autokolerasi saja yang mana pada asumsi regresi klasik dikatakan bahwa kesalahan atau gangguan yang masuk kedalam fungsi regresi populasi adalah random atau tak berkorelasi.

Jika asumsi ini dilanggar, masalah yang muncul adalah terjadi autokorelasi. Autokorelasi dapat didefinisikan sebagai adanya korelasi antar galat atau dapat terjadi ketika kovarians dan korelasi antar galat tidak sama dengan nol. Uji autokorelasi bertujuan untuk mengetahui apakah dalam suatu model regresi linier ada korelasi antar kesalahan pengganggu (residual = u_i ) pada periode t dengan kesalahan pengganggu pada periode t-1 (periode sebelumnya). Berikut beberapa pemahaman mengenai istilah diatas, maka kita akan kembali kepada regresi linear, misalkan data berikut (data produksi.xlsx)

X adalah variabel independ dan Y adalah variabel depend, dengan menggunakan regresi linear https://softscients.com/2020/04/18/buku-belajar-dasar-dasar-statistika-dengan-r-regresi-linear-berganda-r-squared/ disitu sudah ada pengertian residual juga. Oiya, kalian butuh sebuah package dplyr, tidyverse, dan readxl yang harus kalian install package tersebut. Baca saja https://softscients.com/2020/04/11/buku-belajar-dasar-dasar-statistika-dengan-r-manipulasi-data-frame-dengan-dplyr/, jika sudah maka langsung saja kita akan gunakan untuk loading dataset excel. Untuk menghitung regresi linear, cukup gunakan perintah berikut

library(dplyr)
library(tidyverse)
library(readxl)

#loading dataset
produksi=read_excel('data produksi.xlsx')

model = lm (formula = Y ~ X, data = produksi)
summary(model)
plot(produksi$X,produksi$Y,xlab = 'X', ylab = 'Y', main = 'Plot X dan Y')
abline(model)

hasil

Call:
lm(formula = Y ~ X, data = produksi)

Residuals:
    Min      1Q  Median      3Q     Max 
-12.013  -3.386  -1.468   2.779  12.965 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  6.62427    3.32688   1.991   0.0619 .  
X            1.63103    0.05093  32.022   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 6.272 on 18 degrees of freedom
Multiple R-squared:  0.9827,	Adjusted R-squared:  0.9818 
F-statistic:  1025 on 1 and 18 DF,  p-value: < 2.2e-16

Sesuai dengan hasil diatas, didapatkan persamaan Regresi Linear yaitu

    \[Y=6.62427+X1.63103\]

serta nilai R sebesar 0.987 (mendekati 1 berarti semakin linear)

Deteksi Autokorelasi dengan Grafik ACF

Secara umum deteksi autokorelasi ada 2 cara yaitu metode grafik (ACF) dan analitis (durbin-watson).  Untuk metode grafik bisa menggunakan plot residualnya

Autokorelasi Positif seperti grafik berikut

Autokorelasi negatif seperti grafik berikut

Sedangkan non korelasi seperti berikut

 

Namun terkadang akan sulit memahami sebuah plot grafik diatas, maka solusi analitik dapat menggunakan durbin watson. Kita kembali pada dataset diatas, bila kita plot residualnya.

Y = produksi$Y
X = produksi$X

Yt = predict(model)
ut = c(residuals(model))
ut_1 = append(0,ut[1:length(ut)-1])
H = data.frame(X,Y,Yt,ut,ut_1)
H  

plot(ut_1,ut,xlab = 'ut_1', ylab = 'ut', main = 'Plot ut_1 dan ut')
#buat regresi lagi untuk residualnya
model_residul = lm(formula=H$ut_1 ~ H$ut, data= H)
abline(model_residul)

hasil

       X     Y        Yt          ut       ut_1
1   30.3  52.9  56.04439  -3.1443873  0.0000000
2   30.9  53.8  57.02300  -3.2230036 -3.1443873
3   30.9  54.9  57.02300  -2.1230036 -3.2230036
4   33.4  58.2  61.10057  -2.9005712 -2.1230036
5   35.1  60.0  63.87332  -3.8733172 -2.9005712
6   37.3  63.4  67.46158  -4.0615767 -3.8733172
7   41.0  68.2  73.49638  -5.2963768 -4.0615767
8   44.9  78.0  79.85738  -1.8573823 -5.2963768
9   46.5  84.7  82.46703   2.2329744 -1.8573823
10  50.3  90.6  88.66493   1.9350716  2.2329744
11  53.5  98.2  93.88421   4.3157850  1.9350716
12  52.8 101.7  92.74250   8.9575040  4.3157850
13  55.9 102.7  97.79868   4.9013201  8.9575040
14  63.0 108.3 109.37897  -1.0789720  4.9013201
15  73.0 124.7 125.68924  -0.9892425 -1.0789720
16  84.8 157.9 144.93536  12.9646382 -0.9892425
17  86.6 158.2 147.87121  10.3287895 12.9646382
18  98.9 170.2 167.93284   2.2671568 10.3287895
19 110.8 180.0 187.34207  -7.3420652  2.2671568
20 124.7 198.0 210.01334 -12.0133412 -7.3420652

Y_t adalah hasil prediksi

u_t adalah Y-Y_t

Mempunyai hubungan korelasi positif, atau dengan grafik ACF seperti berikut

acf(model$residuals)

Statistik Uji Durbin-Watson

Metode ini hanya berlaku untuk model regresi yang variabel-variabel bebasnya tidak mengandung lagged dependent variable (time lag). Statistik Uji Durbin Watson tidak relevan digunakan dalam penaksiran model regresi yang menggunakan data cross section dan penaksiran model regresi tanpa intercept. Rumus untuk menghitung durbin-watson adalah

    \[d=\frac{\sum_{t=2}^{t=N}{(e_t-e_{t-1})^{2}}}{\sum_{t=1}^{t=N}{e_t^2}}\]

d adalah nilai durbin watson

e_t adalah nilai residual

e_{t-1} adalah nilai residul t-1 (periode sebelumnya)

Secara umum Interpretasi uji Durbin-Watson dapat dinyatakan sebagai berikut :

Dengan

dL : lower bound (batas bawah)

dU : upper bound (batas atas)

wilayah kritis

jika D>dU, gagal tolak H0

jika D<dL, tolak H0

jika dL <= D <= dU pengujian tidak meyakinkan

untuk menghitung durbin watson, kita butuh library lmtest, maka tambahkan berikut jangan lupa atau kalian harus install dulu

library(lmtest) #untuk durbin watson

Sedangkan perintah untuk menghitung durbin watson adalah

dwtest(Y ~ X, data = produksi)

hasil

   Durbin-Watson test

data:  Y ~ X
DW = 0.69655, p-value = 0.0001075
alternative hypothesis: true autocorrelation is greater than 0

diperoleh nilai statistik uji Durbin-Watson adalah sebesar 0,696550. Dari tabel Durbin Watson didapat bahwa nilai 𝑑𝐿 dan 𝑑𝑈 secara berturut-turut adalah 1,2015 dan 1,4107 dengan n=20 dan k =1 (Jumlah variabel bebas). Nilai statistik uji Durbin-Watson (0,696550) < 𝑑𝐿 (1,2015). Sehingga dapat disimpulkan bahwa terjadi autokorelasi positif pada data.

 

 

Leave a Reply

Your email address will not be published. Required fields are marked *