Senin, 09 November 2015

Uji Normalitas *Stata 12

Kembali kepada data yang kita miliki dengan variabel dependen indeks gini dan variabel independen gdp, log ekspor, log cpi, dan unemployment rate. Dalam excel datanya bisa diambil disini >>>. Pengamatan dilakukan selama 32 tahun mulai tahun 1979 - 2010, dengan struktur data sebagai berikut:


Setelah dilakukan uji linearitas maka didapatkanlah variabel-variabel baru yaitu logexp dan logcpi,
kamu bisa lihat bahasannya disini >>>
Asumsi penting dalam model regresi kuadrat terkecil (OLS) adalah keabsahan atau validitas setiap item dalam model. Ketika residual (e) menyebar normal, residual akan terletak diantara observed value dan (Y) dan predicted value

Kita akan menjalankan command regresi dalam dengan bantuan software stata 12,

.regress gini gdp logexp logcpi unem, robust


Model sudah baik dengan indikasi nilai Prob > F = 0,019, dan kita hanya memperoleh satu variabel signifikan yaitu gdp (0,018 < 0,05). command robust diatas dimaksudkan untuk mengendalikan faktor heteroskedastisitas. Kamu bisa lihat di bahasan Uji Heteroskedastisitas.

Selanjutnya kita akan mencari observed value,

.predict gini_predict
.label variable gini_predict "gini predicted"
.scatter gini gini_predict


Nilai predicted kita kurang baik dalam menerangkan model variabel dependen gini, indikasinya dapat dilihat dari pola predicted value yang tersebar jauh dari garis linier.

Kemudian kita mendapatkan nilai residual dengan,

.predict e, resid

Command tersebut akan memberikan kita variabel baru yaitu e, dalam persentasi grafik, sebaran normal dapat kita amati dari pola grafik kdensity, pnorm dan qnorm. Untuk kdensity pernah kita bahas pada bahasan sebelumnya di bahasan Deteksi dan Koreksi Linearitas *Stata 12. Tapi pada bahasan ini akan kita ulang kembali,

,kdensity e, normal


Kita lihat dari kurva densitas kernel, bentuk lonceng sempurna adalah sebaran normal, sedangkan yang satu lagi adalah kurva yang kita peroleh dari nilai residual (e). Bentuk lonceng yang kita dapatkan masih mengikuti pola kurva normal, oleh karena itu kita dapat menemukan cukup bukti untuk menerima H0, dimana residual data menyebar normal. Ketika nilai residual (e) tidak mengikuti pola kurva normal, maka kita harus melihat variabel yang hilang, spesifikasi model, asumsi linearitas, dan bentuk fungsional data. Singkatnya kita perlu meninjau kembali organisasi data kita. Pada kenyataannya dengan jumlah sampel yang sangat besar, uji normalitas menjadi tidak terlalu signifikan dilakukan.

Berikutnya kita akan melihat histogram residual,

.histogram e, kdensity normal


Dari tampilan histogram, sepertinya model kita baik-baik saja, dengan residual masih menyebar normal, lihat susunan balok histogram.

Berikutnya kita akan melihat sebaran bagian tengah dari residual dengan standardize normal probability plot (pnorm),

.pnorm, e


Residual di bagian tengah terlihat sedikit keluar dari garis linier, tetapi masih ok.

Mari kita periksa kembali sebaran residual di bagian ekor (tail) dengan quintile-normal plot (qnorm), disini kita membandingkan antara quintiles of residual vs quintiles of normal,

.qnorm e


Residual di bagian ekor (tail) sepertinya melenceng dari garis linier, kejadian di atas masih kita asumsikan residual menyebar normal.

Untuk lebih meyakinkan, kita akan coba tampilkan pengujian normalitas non-grafik, yaitu Shapiro-Wilk test, dengan command sebagai berikut;

.swilk e


Hipotesis null yang diberikan adalah residual menyebar normal. Hasil p-value/Prob>z menunjukkan nilai signifikansi sebesar 0,23 (jauh di atas nilai kritik 0,05), maka kita telah memiliki cukup bukti untuk menerima H0.(yoso)
download materi dalam bentuk pdf di bawah >>>

0 komentar:

Posting Komentar