Kamis, 30 Agustus 2018

Regresi Poisson *SPSS v23

download bahasan ini dalam versi pdf disini >>>

Setelah kita memahami sebaran Poisson (atau yang belum bisa baca disini >>>), kita akan membahas langkah-langkah menjalankan regresi Poisson dengan menggunakan SPSS 17.00. Kita akan melihat kejadian di Kabupaten “X”, dilaporkan bahwa serangan hama tikus lebih banyak ditemukan di perkebunan sawit yang dikelola oleh perusahaan daripada kebun rakyat/plasma dengan 0 menyatakan kebun plasma dan 1 menyatakan kebun perusahaan. Data mengenai luasan total areal perkebunan dari 4 millik perusahaan dan 18 plasma diberikan beserta data luasan serangan hama tikus seperti pada tabel berikut ini:

H0: Luasan lahan dan Jenis Pengelolaan berpengaruh pada Luas Areal Serangan Hama Tikus.
H1: Luasan lahan dan Jenis Pengelolaan tidak berpengaruh pada Luas Areal Serangan Hama Tikus
untuk materi mengenai hipotesis H0 dan H1 silahkan baca kembali disini>>>
.
1
Tipe pengelolaan: 0=plasma; 1=perusahaan

Perlu kita ketahui bahwa variabel dependen yang kita gunakan adalah Luas Areal Serangan yang di akan kita nyatakan dengan Y, sedangkan variabel independen adalah Luasan Lahan (X1) dan Tipe Pengelolaan (X2), Kita akan  membandingkan nilai mean dari variabel dependen Tipe Pengelolaan (Y) dengan Luas Areal Serangan (X2) dengan ANALYZE-COMPARE MEAN-MEAN, input dalam dependent list variabel dependen kita yaitu “Tipe Pengelolaan” dan masukkan “Luas Areal Serangan” ke dalam independen list.

2

Output SPSS: mean dari Y*X2

3

Dari perbandingan mean kedua tipe pengelolaan kebun terhadap luas areal serangan didapatkan mean yang berbeda signifikan berturut-turut untuk tipe pengelolaan plasma dan perusahaan berturut-turut adalah 1163,3 dan 41674,5. Kemudian kita akan melakukan regresi Poisson dengan Luas Areal Serangan sebagai variabel dependen, tipe pengelolaan sebagai faktor, dan Luasan Lahan sebagai kovariat.

1. Lakukan prosedur ANALYZE-GENERALIZED LINEAR MODEL-GENERALIZED LINEAR MODEL,

4

2. Pada kotak dialog yang muncul pilih TYPE OF MODEL, kemudian ceklist POISSON LOGLINEAR, kita akan menggunakan model linier untuk mengetahui log dari jumlah kejadian,

5

3. Pilih tab RESPONSE lalu masukkan variabel “Areal Serangan” dalam kotak DEPENDENT VARIABEL,

6

4. Pilih tab PREDICTORS, lalu masukkan variabel “Tipe Pengelolaan” ke dalam kotak FACTORS, dan “Luasan lahan” ke dalam kotak COVARIATES,

7

5. Setelah itu kita lihat pada tab MODEL, masukkan variabel independen kita ke dalam box MODEL-OK,

8

6. Pilih SAVE, kemudian checklist STANDARDIZED DEVIANCE RESIDUALS, dan lain-lain – OK,
seperti berikut:

9

7. Dan kita mendapatkan residual

10

8. Kita Plotkan Standardized Deviance Residual dengan GRAPH-CHART BUILDER, drag and drop ke kotak CHART VIEW Histogram, lalu isikan axis dengan nilai Standardized Devianced Residual, lalu di kotak dialog EDIT PROPERTIES, ceklist DISPLAY NORMAL CURVE-APPLY seperti berikut:

11

9. Kita dapatkan estimasi dengan kurva residual yang masih mengikuti pola menyebar normal, sesuai dengan asumsi model Poisson;
12

10. Output regresi Poisson adalah sebagai berikut:

13

Dari output PARAMETER ESTIMATES dapat kita simpulkan bahwa:

Variabel independen Tipe Pengelolaan Plasma bernilai B=(-3,837), dimana variabel X2=0 berpengaruh negatif terhadap Luas Areal Serangan Hama Tikus. Hal ini diperkuat oleh Nilai Signifikansi < 0,001, dengan demikian kita dapat menolak H0, bahwa Tipe pengelolaan kebun oleh Rakyat/Plasma tidak memberikan efek bagi Luas Areal Serangan Hama Tikus.

Variabel X2=1 bernilai B=0, dimana pengaruhnya sangat kecil terhadap Luas Areal Serangan Hama Tikus, kekurangan informasi ini nilai signifikansi ini tidak dapat kita tarik kesimpulan untuk menolak H0.
Variabel Luas Lahan berpengaruh negatif terhadap Luas Areal Serangan Hama Tikus dengan nilan B=-6,15, nilai signifikansi < 0,001 menerangkan bahwa variabel ini tidak berpengaruh terhadap variabel Luas Areal Serangan Hama Tikus, dengan demikian kita dapat menolak H0.

Model yang kita peroleh dari persamaan adalah:

151614

download bahasan ini dalam versi pdf di bawah

Sebaran Poisson

download bahasan ini dalam bentuk pdf disini>>>

Kita mungkin menjalankan analisis regresi dengan memperhatikan asumsi data yang menyebar normal, tapi pada beberapa kasus kita mungkin menemukan data yang tidak menyebar normal. Hal ini tentunya dapat kita atasi dengan transformasi data. Tapi adakalanya transformasi data yang kita lakukan tetap saja menghasilkan data yang tidak menyebar normal, hal ini dapat menyebabkan prinsip kenormalan dilanggar. Kita mengenal beberapa tipe data seperti nominal, ordinal, interval, dan mungkin data deret hitung (count). Untuk data deret hitung biasanya kita temukan pada suatu kasus atau pada sampel percobaan. Data jenis ini paling sering menyebabkan data tidak menyebar normal. Pendekatan yang sering digunakan adalah dengan regresi logistik, dengan menyusun kategori variabel misalnya 1=terpilih, 2=tidak terpilih, hal ini bisa dilakukan tetapi kita akan kehilangan informasi riil yang mendekati kenyataan, hasilnya menjadi bias, atau bahkan kekurangan power dalam pengujian. Contoh data deret hitung (count) yang sering kita temui antara lain:
  • Jumlah kecelakaan di jalan raya yang terjadi dalam sebulan
  • Jumlah anak ikan yang menetas pada perlakuan khusus di laboratorium
  • Jumlah serangan tikus pada 1 hektar sawah
  • Jumlah serangan penyakit pada tanaman dalam satu m2
  • Jumlah pertandingan sepakbola yang tertunda karena hujan pada satu musim liga, dan lain-lain.
Karakteristik Data Deret Hitung (Count) antara lain:
  • Tidak bernilai < 0
  • Keragamannya tidak konstan, selalu berubah, biasanya bias sangat tinggi,
  • Data deret hitung (count) biasanya mengikuti distribusi poisson
Ketika variabel respon (bebas) berada dalam bentuk deret hitung (count), kita dapat menggunakan regresi poisson dimana datanya bernilai > 0 dan bernilai absolute (positif). Regresi poisson mengikuti bentuk data logaritma natural dimana:

loge(Y) = β0 + β1X1 + β2X2….

maka dapat kita tulis dalam bentuk lain

Y = (eβ0) (eβ1X1) (eβ2X2)…

Dengan demikian regresi poisson menyatakan hasil dalam bentuk logaritma sebagai fungsi linier variabel prediktor.

Karakteristik Sebaran Poisson
  • Jumlah hasil percobaan (μ) pada suatu daerah diketahui (disini daerah dapat berupa panjang, area, volume atau periode waktu, dan lain-lain)
  • Probabilitas/peluang hasil percobaan selama selang waktu yang singkat atau dalam suatu daerah yang kecil proporsional terhadap besar-kecilnya daerah, bukan pada banyaknya hasil percobaan yang terjadi di luar selang waktu atau daerah tersebut.
  • Poisson memiliki nilai konstanta (e) sebesar 2,71828.
  • Rata-rata banyaknya hasil percobaan yang terjadi selama selang waktu tertentu dinotasikan dengan μ.
  • Banyaknya hasil percobaan dalam suatu percobaan poisson dinotasikan dengan x dan biasa disebut sebagai peubah acak X.
  • P(x; μ): dapat dijelaskan sebagai x hasil yang muncul pada percobaan poisson, dimana jumlah rataan banyaknya hasil adalah sebesar μ.
Jika diketahui rataan jumlah hasil (μ) yang terjadi pada suatu daerah, kita dapat menghitung peluang poisson berdasarkan rumus berikut,

P(x; μ) = (e) (μx) / x!

Dimana x adalah jumlah hasil aktual yang dihasilkan dari percobaan, sedangkan e merupakan konstanta = 2.71828.

Percobaan Poisson dapat saja digunakan untuk menentukan hasil pengamatan-pengamatan mengenai dering telepon per jam, jumlah tikus di sawah per hektar, jumlah kelahiran Caesar di rumah sakit, kejadian kematian akibat kangker, dan banyaknya pembelian suatu merk kosmetik tertentu di sebuah pusat perbelanjaan.

Ilustrasi
Seorang salesman yang bernama mamat yang menjual panci dalam satu bulan dapat menjual rata-rata 2 unit panci per hari (jyaaahhh,,panci pake unit). Berapa kemungkinan panci akan terjual 3 unit esok harinya?

Dengan Notasi sebaran poisson dapat kita tulis sebagai berikut:
  • μ = 2; karena rata-rata 2 panci yang terjual per hari.
  • x = 3; karena kita akan melihat kecenderungan salesman mamat akan menjual 3 panci esok harinya.
  • e = 2.71828; konstanta sebaran poisson.
Kemudian kita akan memasukkan penjualan mamat ke dalam rumus sebagai berikut:

P(x; μ) = (e) (μx) / x!
P(3; 2) = (2.71828-2) (23) / 3!
P(3; 2) = (0,1353) (8) / 6
P(3; 2) = 0.180

Jadi peluang salesman mamat menjual 3 unit panci esok harinya adalah 0,180.

Atau dalam bentuk lain dengan menggunakan tabel sebaran poisson yang biasanya terdapat dalam buku wajib para statistikawan Pengantar Statistika Edisi ke-3 karangan Ronald E.Walpole, maka rumus peluang mamat menjual 3 unit panci esok harinya adalah:

P(3; 2) = (e-2) (23) / 3!

maka:

P(3; 2) = 0,8571 – 0,6767
P(3; 2) = 0,180

Dari tabel sebaran poisson, dapat kita lihat bahwa nilai  adalah 0,8571
Sedangkan nilai  adalah 0,6767

Ilustrasi II
Rata-rata pembelian produk lipstik “cantik berseri” di suatu department store pada hari minggu adalah 5 per hari, berapa probabilitas department store tersebut akan menjual kosmetik kurang dari 4 pada hari minggu berikutnya?
  • μ = 5; karena rata-rata lipstik yang terjual pada hari minggu adalah 5.
  • x = 0, 1, 2, atau 3; kemungkinan terjual kurang dari 4, maka kemungkunan mereka membeli 0, 1, 2, atau 3 lipstik.
  • e = 2.71828; nilai konstanta.
Kita akan menghitung agregat dari peluang-peluang yang terjadi antara lain: P(0; 5) + P(1; 5) + P(2; 5) + 

P(3; 5).
P(x < 3, 5)       = P(0; 5) + P(1; 5) + P(2; 5) + P(3; 5)
P(x < 3, 5)       = [ (e-5)(50) / 0! ] + [ (e-5)(51) / 1! ] + [ (e-5)(52) / 2! ] + [ (e-5)(53) / 3! ]
P(x < 3, 5)       = [ (0.006738)(1) / 1 ] + [ (0.006738)(5) / 1 ] + [ (0.006738)(25) / 2 ] + [ (0.006738)(125) / 6 ]
P(x < 3, 5)       = [ 0.0067 ] + [ 0.03369 ] + [ 0.084224 ] + [ 0.140375 ]
P(x < 3, 5)       = 0.2650

Jadi peluang lipstik “cantik berseri” akan terjual kurang dari 4 pada hari minggu kemudian adalah 0.2650.
Selanjutnya akan kita bahas trik menjalankan regresi poisson dengan SPSS.

download bahasan ini dalam bentuk pdf disini>>>

Sumber:
Anonim.  ____.  Research Method II: Multivariate Analysis, Poisson Regression Analysis.
Walpolle, E. Ronald.  1995.  Pengantar Statistika, Edisi Ketiga – cetakan keenam.  Gramedia Pustaka Utama.  Jakarta.
Berk R, MacDonald J.  2007.  Overdispersion and Poisson Regression.  Department of Criminolgy, University of Pennsylvania: Pennsylvania.

Sebaran Normal

download materi ini versi pdf disini>>>

Sebaran normal digambarkan dengan bentuk kurva simetris, berbentuk seperti lonceng, dari pola data yang diukur. Sebaran normal memiliki nilai mean, mode dan median yang sama. Sebaran normal juga dikenal dengan nama sebaran Gauss (1777 – 1855) yang telah menemukan persamaannya dari studi mengenai galat dalam pengukuran berulang terhadap benda yang sama.
Gambar di bawah merupakan ilustrasi dari sebaran normal:


Suatu variabel acak kontinu X yang memiliki sebaran berbentuk lonceng tersebut disebut dengan variabel acak normal. Dua parameter yang menentukan sebaran peluang variabel acak normal ini adalah nilai mean (µ) dan simpangan baku (σ).
Luas di bawah kurva dibatasi oleh X = X1 dan X = X2 sama dengan peluang bahwa variabel acak mengambil nilai antara X = X1 dan X = X2. Jadi untuk kurva normal P(X1< X < X2) pada gambar di bawah ini dinyatakan oleh luas daerah antara X1  dan X2.


Jika data menyebar normal, kita dapat mentransformasikan setiap pengamatan yang berasal dari sembarangvariabel acak normal X menjadi suatu nilai variabel acak normal Z dengan nilai tengah nol dan ragam =1. Kemuadian nilai X akan kita rubah menjadi Z mengikuti transformasi berikut ini:


Bila X berada diantara X = X1 dan X = X2, maka variabel acak Z akan berada diantara nilai-nilai padanannya:


Dengan demikian:


***contoh 1:
jika pada suatu ujian nilai rata-ratanya adalah 69 dan simpangan bakunya 5. Ketika 15% peserta akan diberikan nilai A, dan diasumsikan mengikuti sebaran normal, berapakan batas nilai terkecil untuk nilai A, dan batas nilai tertinggi untuk B



**pada luasan daerah 15% adalah jumlah mahasiswa yang diberikan nilai A dan merupakan batas terkecil untuk nilai A, sedangkan daerah sebelah kiri sebesar 85% merupakan batas terbesar untuk nilai B sehinga luasan daerah sebelah kiri adalah 0,85 dapat kita lihat dari tabel Z adalah 1,045, dimana P(Z <1,045) = 0,85. download tabel Z-statistic disini>>>,
Sehingga;

X = (5)(1,045) + 69
            X = 74,225

**Jadi, nilai terendah bagi A adalah 74 dan nilai tertinggi untuk B adalah 73.

***contoh 2:
Perusahaan ANGIN GLEBUK membayar gaji karyawannya rata-rata Rp 1.000 per jam dengan simpangan baku 328 sen. Bila gaji tersebut menyebar normal dan dibayarkan sampai sen terdekat, persentase karyawan yang gajinya melebihi Rp 1.500 per jam.

**kita dapat menggambarkan kasus di atas dengan kurva sebaran normal sebagai berikut:



**Luasan daerah dalam kurva adalah 100%, langkah awal kita akan menghitung luasan daerah di sebelah kanan yaitu 1.500 dengan mengganti X = 1.500 dengan Z = 1.500, dengan menggunakan formula berikut ini:



**Setelah memperoleh luasan kurva di sebelah kanan, kita akan mencari luasan kurva di sebelah kiri:

P(X > 1500)       =          P(Z > 1,5)
=          1 – P(Z < 1,5)
=          1 – 0,9332 (lihat table Z)
=         0,067

**Jadi persentase karyawan yang gajinya melebihi Rp 1.500 per jam adalah 6,7%.


download materi ini versi pdf disini>>>

Kamis, 03 Desember 2015

Prosedur Iterasi Cochrane-Orcutt

download materi ini dalam bentuk pdf disini>>>

Persamaan regresi dengan masalah autokorelasi diberikan dengan persamaan berikut ini:

Yt = β + β1X2 + β2X1 + µt

Dimana persamaan untuk komponen error yang saling terkorelasi:

µt = ρt-1 + εt

ρYt-1 = β1ρ + β2Xt-1 +ρµt-1

Kemudian kita masukkan ke dalam persamaan regresi:

Yt - ρYt-1= β1(1-ρ) + β2Xt-1 + ρt - ρµt-1

Maka persamaan regresi menjadi

Yt = β1(1-ρ) + ρYt-1 + β2Xt - β2ρXt-1 + εt

Dalam model Cochrane-Orcutt kita mencari nilai ρ (rho) dengan meregresikan εt dengan εt-1. Tahapan pemodelan yang kita lakukan secara berurutan adalah:

  1. Menghitung ρ pada model µt = ρµt-1 + εt melalui regresi dari nilai residual yang diperoleh,
  2. Jalankan analisis regresi dengan model AR(1),
  3. Lihat kembali model regresi dengan differencing order pertama atau AR(1) dengan persamaan Yt = β + β1X1 + β2X2 + ρµt-1 + µt apakah residual baru yang kita dapatkan masih terkorelasi, lihat dengan nilai durbin watson statistic, lihat daerah penerimaan dan penolakan durbin watson disini>>>
  4. Jika masih terkorelasi teruskan dengan model AR(2) dengan persamaan Yt = β + β1X1 + β2X2 + ρµt-1 + ρµt-1 + µt, hal ini diteruskan hingga tidak terdapat lagi korelasi antar error,
Berikut ini kita memiliki data tahunan persentase harapan hidup wanita (liveexp) dinyatakan dalam persentase dari total populasi wanita, dan data tahunan pertumbuhan populasi (popgrow) penduduk dinyatakan dalam persentase dari total populasi di negara Belgia. Data diperoleh dari world bank dengan judul world development indicator, data terdiri atas 31 pengamatan mulai dari tahun 1980 - 2010, kamu bisa ambil contoh datanya disini>>>
Untuk yang belum mengerti cara impor data dan penggunaan command dengan stata 12, lihat bahasannya disini>>>

Dengan bantuan software stata 12, kita akan plot datanya sebagai berikut:

1. Tampilan data;

.describe liveexp popgrow


Menambahkan label sebagai keterangan;

.label variable livexc "life expectancy of female, % of female population"
.label variable popgrow "total population growth, % of total population"
.describe livexc popgrow


Lihat, setelah menambah label, maka keterangan variabel sudah ada,

2. Plot data;

.scatter livexc popgrow


Plot data menunjukkan bahwa data tersebar cukup jauh dari garis linier,

3. Meregresikan variabel dependen livexc dengan variabel independen popgrow,

.regress livexc popgrow



Dari output regresi didapatkan persamaan:


livexc = 78,06 + 5,45*popgrow µ

4. Mendapatkan dan menampilkan grafik residual,

.predict e, resid

.graph twoway scatter e livexc, c(l) ylabel(-1 0 1) xlabel(76(2)84) yline(0)


5. Menyatakan variabel waktu (time series) ke dalam stata, jika kamu menggunakan interval lain, lihat cara menyatakannya disini>>>

.set obs 31
.generate time = y(1980) + _n-1
.format %ty time
.tsset time


Dengan demikian stata telah membaca variabel runtun waktu ke dalam record,

6. Pengujian autokorelasi dengan statistik durbin-watson,

.dwstat


Dari hasil pengujian autokorelasi dengan statistik durbin-watson, kita peroleh nilainya yaitu 0,31, ini mengindikasikan terdapatnya autokorelasi positif.
Dengan demikian kita akan melakukan prosedur koreksi autokorelasi dengan prosedur iteratif Cochrane-Orcutt,

7. Prosedur transformasi persamaan Cochrane-Orcutt dijalankan dengan command prais, kemudian command corc untuk menampilkan nilai iterasi ρ,

.prais livexc popgrow, corc

Output prosedur iterasi rho:
Iteration 0:  rho = 0.0000
Iteration 1:  rho = 0.7911
Iteration 2:  rho = 0.9078
Iteration 3:  rho = 0.9264
Iteration 4:  rho = 0.9350
Iteration 5:  rho = 0.9402
Iteration 6:  rho = 0.9437
Iteration 7:  rho = 0.9462
Iteration 8:  rho = 0.9481
Iteration 9:  rho = 0.9495
Iteration 10:  rho = 0.9507
Iteration 11:  rho = 0.9516
Iteration 12:  rho = 0.9524
Iteration 13:  rho = 0.9530
Iteration 14:  rho = 0.9536
Iteration 15:  rho = 0.9540
Iteration 16:  rho = 0.9544
Iteration 17:  rho = 0.9547
Iteration 18:  rho = 0.9550
Iteration 19:  rho = 0.9552
Iteration 20:  rho = 0.9555
Iteration 21:  rho = 0.9556
Iteration 22:  rho = 0.9558
Iteration 23:  rho = 0.9559
Iteration 24:  rho = 0.9560
Iteration 25:  rho = 0.9561
Iteration 26:  rho = 0.9562
Iteration 27:  rho = 0.9563
Iteration 28:  rho = 0.9564
Iteration 29:  rho = 0.9564
Iteration 30:  rho = 0.9565
Iteration 31:  rho = 0.9565
Iteration 32:  rho = 0.9566
Iteration 33:  rho = 0.9566
Iteration 34:  rho = 0.9566
Iteration 35:  rho = 0.9566
Iteration 36:  rho = 0.9567
Iteration 37:  rho = 0.9567
Iteration 38:  rho = 0.9567
Iteration 39:  rho = 0.9567
Iteration 40:  rho = 0.9567
Iteration 41:  rho = 0.9567
Iteration 42:  rho = 0.9568
Iteration 43:  rho = 0.9568
Iteration 44:  rho = 0.9568
Iteration 45:  rho = 0.9568
Iteration 46:  rho = 0.9568
Iteration 47:  rho = 0.9568
Iteration 48:  rho = 0.9568
Iteration 49:  rho = 0.9568
Iteration 50:  rho = 0.9568
Iteration 51:  rho = 0.9568
Iteration 52:  rho = 0.9568
Iteration 53:  rho = 0.9568
Iteration 54:  rho = 0.9568
Iteration 55:  rho = 0.9568
Iteration 56:  rho = 0.9568
Iteration 57:  rho = 0.9568
Iteration 58:  rho = 0.9568
Iteration 59:  rho = 0.9568
Iteration 60:  rho = 0.9568



  • Dari output regresi dengan prosedur cochrane-orcutt, model AR(1):
  • Model signifikan secara statistik dengan nilai Prob > F = 0,033,
  • R-squared sebesar 0,15 mengindikasikan persamaan hanya dapat menjelaskan sebesar 15,23 keragaman dalam model,
  • Model yang kita peroleh setelah prosedur iterasi adalah:
livexct = 85,05 + 0,65*popgrowt + µt
dimana:

µt = 0.96*µt-1 + εt

  • Statistik Durbin Watson sebesar 2,66 mengindikasikan bahwa model tidak mengandung masalah autokorelasi. (yoso)
download materi ini dalam bentuk pdf disini>>>

Jumat, 27 November 2015

Model Seemingly Unrelated Regression (SUR)

download materi ini versi pdf disini>>>

Ketika kita memiliki beberapa set persaman regresi linier berganda, dimana setiap persamaan menjelaskan tentang fenomena perekonomian. Beberapa persamaan ini dapat kita nyatakan sebagai model persamaan simultan, jika salah satu variabel penjelasnya bersifat dependen (endogenous). Tetapi jika tidak ada variabel dalam sistem persamaan simultan tersebut yang kita anggap sebagai variabel independen, kemungkinan masih ada interaksi antara persamaan individual tersebut jika disturbances atau error memiliki hubungan korelasi antara satu variabel dengan paling tidak beberapa variabel lain. Dengan demikian, persamaan tersebut dapat kita hubungkan secara statistik, walaupun tidak bersifat struktural, melalui sebaran error matriks keragaman kovarian non-diagonal. Kemungkinan tersebut telah dibahas dalam paper seminar Zellner (1962), yang menyoroti persamaan “seemingly unrelated regression” (SURE) untuk menunjukkan fakta bahwa persamaan individual pada kenyataannya saling terkait antara satu dengan yang lainnya, walaupun secara model tidak.
Gabungan antara beberapa set persamaan yang meliputi struktur model SURE, dan bentuk error (disturbances) keragaman matriks kovarian, memberikan informasi tambahan yang lebih luas lagi, dibandingkan jika persamaan individual dihitung secara terpisah. Hal ini menjelaskan kepada kita bahwa menggunakan model secara kolektif dari beberapa persamaan akan memberikan hasil yang optimal ketika kita menarik inferensia mengenai parameter yang digunakan dalam model. Tentunya, hal yang paling relevan dalam bahasan ini adalah ketajaman inferensia akan meningkatkan pengenalan kita terhadap persamaan gabungan yang ditawarkan dalam model SURE. (Srivasta .K, Giles .D, 1987)

Ilustrasi:

Kita akan membahas penerapan model SUR dengan data indikator perekonomian yang terdiri dari 100 pengamatan dalam kuartal yang dimulai pada kuartal I 1989 hingga Kuartal  IV 2013. Beberapa indikator yang kita miliki adalah suku bunga bank sentral (int_rate), tingkat inflasi (inflation), harga minyak mentah dunia (oil_price), produksi total dalam negeri dalam million US$ (prod), jumlah populasi penetap (resdnc), stok uang di bank sentral (money_stock), indeks harga implisit (imp_price), dan nilai ekspor komoditi migas dalam million US$ (export). Kamu bisa download contoh datanya disini>>>
Ilustrasi ini menggunakan bantuan perangkat lunak stata 12.

Tahap impor data,

File > import > excell spreadsheet,

Checklist import first row as variables names > ok,

Sekarang kita bekerja dengan command,

.describe


Lihat storage type data kita tidak mengandung variabel strings,

.list

Data akan dimunculkan dalam output secara lengkap,

Model persamaan yang akan kita gunakan adalah 2, yaitu mengikuti persamaan dasar regresi, model kita akan terdiri dari;
.int_rate = b_0 + b_1*oil_price + b_2*prod + b_3*imp_price + e_int_rate
.inflation = g_0 + g_1*resdnc + g_2*money_stock + g_3*export + e_inflation
Dimana b_0 adalah slope untuk int_rate, b_1, b_2, dan b_3 adalah koefisien regresi variabel int_rate, dan e_int_rate adalah error untuk int_rate.
Sedangkan g_0 adalah slope untuk inflation, g_1, g_2, dan g_3 adalah koefisien regresi variabel inflation, dan e_inflation adalah error untuk inflation.
Matriks dari persamaan untuk koefisien regresi adalah:
β̑sur = (X’V-1X)-1 X’V-1Y
dimana X adalah matriks prediktor, Y adalah vektor dari hasil persamaan, dan V adalah:
V = S IN
Persamaan dari Knocker dimana S adalah matriks kovarian keragaman, dan I adalah matriks identitas n dari jumlah kasus dalam analisis.

Berikutnya kita akan run model SUR dengan Stata 12,

.sureg (int_rate oil_price prod imp_price) (inflation resdnc money_stock export), corr



Uji Breusch Pagan seperti yang ditunjukkan dalam output kita digunakan untuk menguji asumsi bahwa error antar persamaan saling terkorelasi, Hipotesis null adalah tidak ada korelasi, sedangkan hipotesis alternatifnya adalah persamaan saling terkorelasi. Untuk dua persamaan dalam model SUR, uji statistik menggunakan metode Langrange Multiplier dengan sebaran chi-square dan derajat bebas M(M-1)/M.

LM = Tr212  ~ χ2(M(M-1)/M),     where  r212 = (s12^)2/(s211^ s222^)

Dimana T adalah ukuran sampel, (s12^)2 adalah kuadrat kovarian sample dari error untuk kedua persamaan, dan s211^  dan s222^ adalah keragaman error sampel untuk dua persamaan. Uji statistik ini dapat disusun kembali untuk lebih dari dua persamaan.
Command corr akan memberikan korelasi residual antara 2 model, sedangkan output uji Breusch-Pagan menunjukkan nilai yang signifikan (0,047), maka kita memiliki cukup bukti untuk menerima H1, dan menolak H0 dimana data saling terkorelasi.

Mendapatkan nilai Matriks Persamaan Koefisien Regresi
.matrix list e(V)


Mendapatkan nilai vektor koefisien (b)
.matrix list e(b)


Menampilkan korelasi antar kovarians matriks korelasi dari model,

.estat vce, corr


download materi ini versi pdf disini>>>