Rabu, 04 November 2015

Uji Asumsi Multikolinearitas *stata 12

Multikolinearitas adalah kondisi terdapatnya hubungan linier atau korelasi yang tinggi antara masing-masing variabel independen dalam model regresi. Multikolinearitas biasanya terjadi ketika sebagian besar variabel yang digunakan saling terkait dalam suatu model regresi. Oleh karena itu masalah multikolinearitas tidak terjadi pada regresi linier sederhana yang hanya melibatkan satu variabel independen.
Indikasi terdapat masalah multikolinearitas dapat kita lihat dari kasus-kasus sebagai berikut:
1. Nilai R2 yang tinggi (signifikan), namun nilai standar error dan tingkat signifikansi masing-masing variabel sangat rendah.
2. Perubahan kecil sekalipun pada data akan menyebabkan perubahan signifikan pada variabel yang diamati.
3. Nilai koefisien variabel tidak sesuai dengan hipotesis, misalnya variabel yang seharusnya memiliki pengaruh positif (nilai koefisien positif), ditunjukkan dengan nilai negatif.
Memang belum ada kriteria yang jelas dalam mendeteksi masalah multikolinearitas dalam model regresi linier. Selain itu hubungan korelasi yang tinggi belum tentu berimplikasi terhadap masalah multikolinearitas. Tetapi kita dapat melihat indikasi multikolinearitas dengan tolerance value (TOL), eigenvalue, dan yang paling umum digunakan adalah varians inflation factor (vif).

Hingga saat ini tidak ada kriteria formal untuk menentukan batas terendah dari nilai toleransi atau VIF. Beberapa ahli berpendapat bahwa nilai toleransi kurang dari 1 atau VIF lebih besar dari 10 menunjukkan multikolinearitas signifikan, sementara itu para ahli lainnya menegaskan bahwa besarnya R2 model dianggap mengindikasikan adanya multikolinearitas. Klein (1962) menunjukkan bahwa, jika VIF lebih besar dari 1/(1 – R2) atau nilai toleransi kurang dari (1 – R2), maka multikolinearitas dapat dianggap signifikan secara statistik.
Kita kembali kepada data yang telah kita bahas sebelumnya yaitu melihat pengaruh variabel indeks gini terhadap produk domestik bruto (GDP), ekspor barang dan jasa (% dari GDP), indeks harga konsumen (% dari GDP), dan tingkat pengangguran yang diambil dari BPS dan World Bank, pengamatan dilakukan dengan data dari tahun 1979 hingga 2010 (lihat datanya di bahasan ini, Regresi linier). 
Model yang sudah kita dapatkan dan bebas dari masalah linearitas adalah sebagai berikut.

.regress gini gdp logexp logcpi unem, robust


Mari kita lihat dari regresi yang kita peroleh, variabel gdp signifikan berpengaruh terhadap gini, namun dengan nilai koefisien yang sangat kecil (0,00013), sedangkan variabel  lain tidak berpengaruh signifikan. Variabel logexp berpengaruh negatif terhadap gini, hal ini telah sesuai dengan asumsi bahwa peningkatan 0,1 satuan variabel logexp akan mengurangi 0,000036 gini. Demikian juga dengan variabel unem, peningkatan tingkat pendapatan akan mengurangi indeks gini, dan seterusnya. Kemudian nilai standar error yang kita peroleh sangat kecil, demikian pula halnya dengan nilai R-square sebesar 20,57% (lihat nilai R-sq) tidak mengindikasikan adanya multikolinearitas.
Berikutnya kita akan melihat korelasi antara variabel independen, jika variabel-variabel independennya saling terkorelasi, maka kita asumsikan data mengandung masalah kolinearitas,

.pwcorr gdp logexp logcpi unem, star(0,05) sig



Salah satu asumsi dari regresi linier adalah antar variabel independen tidak bersifat multikolinear, artinya salah satu regresor tidak memiliki fungsi linier terhadap regresor lain. Kita dapatkan dari hasil korelasi bahwa terdapat korelasi antar variabel independen terutama pada tingkat signifikansi 95%, antara lain gdp dengan unem, logexp dengan unem, dan logexp dengan logcpi. Hubungan korelasi antar variabel mengindikasikan adanya masalah multikolinearitas. Tetapi dalam kasus ini korelasi tidak terlalu signifikan, untuk lebih meyakinkan dugaan kita selanjutnya kita akan melihat nilai variance inflation factor (vif), karena saat terjadi multikolinearitas standar error kemungkinan mengalami inflasi. Nilai vif > 10 atau 1/vif < 0,10 akan mengindikasikan adanya masalah multikolinearitas. Pertama-tama kita jalankan regresi linier terlebih dahulu, setelah menjalankan regresi kita cukup mengetikkan command vif untuk melihat variance inflation faktor,

.regress gini gdp logexp logcpi unem, robust
.vif

ternyata nilai vif tidak ada yang lebih dari 10, maka asumsi kita terpenuhi.

Command lain dalam stata untuk mendeteksi masalah kolinearitas adalah
collin, namun dalam pengetikannya kita tidak lagi menjalankan command regresi terlebih dahulu. Untuk mengaktifkan command ini kita dapat mengetikkan findit collin ke dalam stata.

.findit collin



kemudian akan ditampilkan jendela search dalam stata, cari collin, lalu klik install,

Setelah terinstal kita coba command collin tanpa memasukkan variabel dependen gini. Sekali lagi bahwa collin tidak perlu dilakukan command regress terlebih dahulu seperti halnya dengan command vif.

.collin gdp logexp logcpi unem


Berikut output dari collinearity diagnostic, hasilnya sama dengan vif, tidak mengindikasikan adanya masalah multikolinearitas. (yoso)


download materi ini dalam versi pdf di bawah >>>

0 komentar:

Posting Komentar