Kamis, 03 Desember 2015

Prosedur Iterasi Cochrane-Orcutt

download materi ini dalam bentuk pdf disini>>>

Persamaan regresi dengan masalah autokorelasi diberikan dengan persamaan berikut ini:

Yt = β + β1X2 + β2X1 + µt

Dimana persamaan untuk komponen error yang saling terkorelasi:

µt = ρt-1 + εt

ρYt-1 = β1ρ + β2Xt-1 +ρµt-1

Kemudian kita masukkan ke dalam persamaan regresi:

Yt - ρYt-1= β1(1-ρ) + β2Xt-1 + ρt - ρµt-1

Maka persamaan regresi menjadi

Yt = β1(1-ρ) + ρYt-1 + β2Xt - β2ρXt-1 + εt

Dalam model Cochrane-Orcutt kita mencari nilai ρ (rho) dengan meregresikan εt dengan εt-1. Tahapan pemodelan yang kita lakukan secara berurutan adalah:

  1. Menghitung ρ pada model µt = ρµt-1 + εt melalui regresi dari nilai residual yang diperoleh,
  2. Jalankan analisis regresi dengan model AR(1),
  3. Lihat kembali model regresi dengan differencing order pertama atau AR(1) dengan persamaan Yt = β + β1X1 + β2X2 + ρµt-1 + µt apakah residual baru yang kita dapatkan masih terkorelasi, lihat dengan nilai durbin watson statistic, lihat daerah penerimaan dan penolakan durbin watson disini>>>
  4. Jika masih terkorelasi teruskan dengan model AR(2) dengan persamaan Yt = β + β1X1 + β2X2 + ρµt-1 + ρµt-1 + µt, hal ini diteruskan hingga tidak terdapat lagi korelasi antar error,
Berikut ini kita memiliki data tahunan persentase harapan hidup wanita (liveexp) dinyatakan dalam persentase dari total populasi wanita, dan data tahunan pertumbuhan populasi (popgrow) penduduk dinyatakan dalam persentase dari total populasi di negara Belgia. Data diperoleh dari world bank dengan judul world development indicator, data terdiri atas 31 pengamatan mulai dari tahun 1980 - 2010, kamu bisa ambil contoh datanya disini>>>
Untuk yang belum mengerti cara impor data dan penggunaan command dengan stata 12, lihat bahasannya disini>>>

Dengan bantuan software stata 12, kita akan plot datanya sebagai berikut:

1. Tampilan data;

.describe liveexp popgrow


Menambahkan label sebagai keterangan;

.label variable livexc "life expectancy of female, % of female population"
.label variable popgrow "total population growth, % of total population"
.describe livexc popgrow


Lihat, setelah menambah label, maka keterangan variabel sudah ada,

2. Plot data;

.scatter livexc popgrow


Plot data menunjukkan bahwa data tersebar cukup jauh dari garis linier,

3. Meregresikan variabel dependen livexc dengan variabel independen popgrow,

.regress livexc popgrow



Dari output regresi didapatkan persamaan:


livexc = 78,06 + 5,45*popgrow µ

4. Mendapatkan dan menampilkan grafik residual,

.predict e, resid

.graph twoway scatter e livexc, c(l) ylabel(-1 0 1) xlabel(76(2)84) yline(0)


5. Menyatakan variabel waktu (time series) ke dalam stata, jika kamu menggunakan interval lain, lihat cara menyatakannya disini>>>

.set obs 31
.generate time = y(1980) + _n-1
.format %ty time
.tsset time


Dengan demikian stata telah membaca variabel runtun waktu ke dalam record,

6. Pengujian autokorelasi dengan statistik durbin-watson,

.dwstat


Dari hasil pengujian autokorelasi dengan statistik durbin-watson, kita peroleh nilainya yaitu 0,31, ini mengindikasikan terdapatnya autokorelasi positif.
Dengan demikian kita akan melakukan prosedur koreksi autokorelasi dengan prosedur iteratif Cochrane-Orcutt,

7. Prosedur transformasi persamaan Cochrane-Orcutt dijalankan dengan command prais, kemudian command corc untuk menampilkan nilai iterasi ρ,

.prais livexc popgrow, corc

Output prosedur iterasi rho:
Iteration 0:  rho = 0.0000
Iteration 1:  rho = 0.7911
Iteration 2:  rho = 0.9078
Iteration 3:  rho = 0.9264
Iteration 4:  rho = 0.9350
Iteration 5:  rho = 0.9402
Iteration 6:  rho = 0.9437
Iteration 7:  rho = 0.9462
Iteration 8:  rho = 0.9481
Iteration 9:  rho = 0.9495
Iteration 10:  rho = 0.9507
Iteration 11:  rho = 0.9516
Iteration 12:  rho = 0.9524
Iteration 13:  rho = 0.9530
Iteration 14:  rho = 0.9536
Iteration 15:  rho = 0.9540
Iteration 16:  rho = 0.9544
Iteration 17:  rho = 0.9547
Iteration 18:  rho = 0.9550
Iteration 19:  rho = 0.9552
Iteration 20:  rho = 0.9555
Iteration 21:  rho = 0.9556
Iteration 22:  rho = 0.9558
Iteration 23:  rho = 0.9559
Iteration 24:  rho = 0.9560
Iteration 25:  rho = 0.9561
Iteration 26:  rho = 0.9562
Iteration 27:  rho = 0.9563
Iteration 28:  rho = 0.9564
Iteration 29:  rho = 0.9564
Iteration 30:  rho = 0.9565
Iteration 31:  rho = 0.9565
Iteration 32:  rho = 0.9566
Iteration 33:  rho = 0.9566
Iteration 34:  rho = 0.9566
Iteration 35:  rho = 0.9566
Iteration 36:  rho = 0.9567
Iteration 37:  rho = 0.9567
Iteration 38:  rho = 0.9567
Iteration 39:  rho = 0.9567
Iteration 40:  rho = 0.9567
Iteration 41:  rho = 0.9567
Iteration 42:  rho = 0.9568
Iteration 43:  rho = 0.9568
Iteration 44:  rho = 0.9568
Iteration 45:  rho = 0.9568
Iteration 46:  rho = 0.9568
Iteration 47:  rho = 0.9568
Iteration 48:  rho = 0.9568
Iteration 49:  rho = 0.9568
Iteration 50:  rho = 0.9568
Iteration 51:  rho = 0.9568
Iteration 52:  rho = 0.9568
Iteration 53:  rho = 0.9568
Iteration 54:  rho = 0.9568
Iteration 55:  rho = 0.9568
Iteration 56:  rho = 0.9568
Iteration 57:  rho = 0.9568
Iteration 58:  rho = 0.9568
Iteration 59:  rho = 0.9568
Iteration 60:  rho = 0.9568



  • Dari output regresi dengan prosedur cochrane-orcutt, model AR(1):
  • Model signifikan secara statistik dengan nilai Prob > F = 0,033,
  • R-squared sebesar 0,15 mengindikasikan persamaan hanya dapat menjelaskan sebesar 15,23 keragaman dalam model,
  • Model yang kita peroleh setelah prosedur iterasi adalah:
livexct = 85,05 + 0,65*popgrowt + µt
dimana:

µt = 0.96*µt-1 + εt

  • Statistik Durbin Watson sebesar 2,66 mengindikasikan bahwa model tidak mengandung masalah autokorelasi. (yoso)
download materi ini dalam bentuk pdf disini>>>

Jumat, 27 November 2015

Model Seemingly Unrelated Regression (SUR)

download materi ini versi pdf disini>>>

Ketika kita memiliki beberapa set persaman regresi linier berganda, dimana setiap persamaan menjelaskan tentang fenomena perekonomian. Beberapa persamaan ini dapat kita nyatakan sebagai model persamaan simultan, jika salah satu variabel penjelasnya bersifat dependen (endogenous). Tetapi jika tidak ada variabel dalam sistem persamaan simultan tersebut yang kita anggap sebagai variabel independen, kemungkinan masih ada interaksi antara persamaan individual tersebut jika disturbances atau error memiliki hubungan korelasi antara satu variabel dengan paling tidak beberapa variabel lain. Dengan demikian, persamaan tersebut dapat kita hubungkan secara statistik, walaupun tidak bersifat struktural, melalui sebaran error matriks keragaman kovarian non-diagonal. Kemungkinan tersebut telah dibahas dalam paper seminar Zellner (1962), yang menyoroti persamaan “seemingly unrelated regression” (SURE) untuk menunjukkan fakta bahwa persamaan individual pada kenyataannya saling terkait antara satu dengan yang lainnya, walaupun secara model tidak.
Gabungan antara beberapa set persamaan yang meliputi struktur model SURE, dan bentuk error (disturbances) keragaman matriks kovarian, memberikan informasi tambahan yang lebih luas lagi, dibandingkan jika persamaan individual dihitung secara terpisah. Hal ini menjelaskan kepada kita bahwa menggunakan model secara kolektif dari beberapa persamaan akan memberikan hasil yang optimal ketika kita menarik inferensia mengenai parameter yang digunakan dalam model. Tentunya, hal yang paling relevan dalam bahasan ini adalah ketajaman inferensia akan meningkatkan pengenalan kita terhadap persamaan gabungan yang ditawarkan dalam model SURE. (Srivasta .K, Giles .D, 1987)

Ilustrasi:

Kita akan membahas penerapan model SUR dengan data indikator perekonomian yang terdiri dari 100 pengamatan dalam kuartal yang dimulai pada kuartal I 1989 hingga Kuartal  IV 2013. Beberapa indikator yang kita miliki adalah suku bunga bank sentral (int_rate), tingkat inflasi (inflation), harga minyak mentah dunia (oil_price), produksi total dalam negeri dalam million US$ (prod), jumlah populasi penetap (resdnc), stok uang di bank sentral (money_stock), indeks harga implisit (imp_price), dan nilai ekspor komoditi migas dalam million US$ (export). Kamu bisa download contoh datanya disini>>>
Ilustrasi ini menggunakan bantuan perangkat lunak stata 12.

Tahap impor data,

File > import > excell spreadsheet,

Checklist import first row as variables names > ok,

Sekarang kita bekerja dengan command,

.describe


Lihat storage type data kita tidak mengandung variabel strings,

.list

Data akan dimunculkan dalam output secara lengkap,

Model persamaan yang akan kita gunakan adalah 2, yaitu mengikuti persamaan dasar regresi, model kita akan terdiri dari;
.int_rate = b_0 + b_1*oil_price + b_2*prod + b_3*imp_price + e_int_rate
.inflation = g_0 + g_1*resdnc + g_2*money_stock + g_3*export + e_inflation
Dimana b_0 adalah slope untuk int_rate, b_1, b_2, dan b_3 adalah koefisien regresi variabel int_rate, dan e_int_rate adalah error untuk int_rate.
Sedangkan g_0 adalah slope untuk inflation, g_1, g_2, dan g_3 adalah koefisien regresi variabel inflation, dan e_inflation adalah error untuk inflation.
Matriks dari persamaan untuk koefisien regresi adalah:
β̑sur = (X’V-1X)-1 X’V-1Y
dimana X adalah matriks prediktor, Y adalah vektor dari hasil persamaan, dan V adalah:
V = S IN
Persamaan dari Knocker dimana S adalah matriks kovarian keragaman, dan I adalah matriks identitas n dari jumlah kasus dalam analisis.

Berikutnya kita akan run model SUR dengan Stata 12,

.sureg (int_rate oil_price prod imp_price) (inflation resdnc money_stock export), corr



Uji Breusch Pagan seperti yang ditunjukkan dalam output kita digunakan untuk menguji asumsi bahwa error antar persamaan saling terkorelasi, Hipotesis null adalah tidak ada korelasi, sedangkan hipotesis alternatifnya adalah persamaan saling terkorelasi. Untuk dua persamaan dalam model SUR, uji statistik menggunakan metode Langrange Multiplier dengan sebaran chi-square dan derajat bebas M(M-1)/M.

LM = Tr212  ~ χ2(M(M-1)/M),     where  r212 = (s12^)2/(s211^ s222^)

Dimana T adalah ukuran sampel, (s12^)2 adalah kuadrat kovarian sample dari error untuk kedua persamaan, dan s211^  dan s222^ adalah keragaman error sampel untuk dua persamaan. Uji statistik ini dapat disusun kembali untuk lebih dari dua persamaan.
Command corr akan memberikan korelasi residual antara 2 model, sedangkan output uji Breusch-Pagan menunjukkan nilai yang signifikan (0,047), maka kita memiliki cukup bukti untuk menerima H1, dan menolak H0 dimana data saling terkorelasi.

Mendapatkan nilai Matriks Persamaan Koefisien Regresi
.matrix list e(V)


Mendapatkan nilai vektor koefisien (b)
.matrix list e(b)


Menampilkan korelasi antar kovarians matriks korelasi dari model,

.estat vce, corr


download materi ini versi pdf disini>>>

Rabu, 25 November 2015

Uji Chi-Square

Uji Chi-square dilakukan untuk menjelaskan apakah dua variabel  bersifat independen/saling lepas atau tidak. Artinya dua variabel tersebut tidak saling berhubungan, Dalam penelitian sosial biasanya kita tertarik untuk mengetahui karakteristik atau nilai hubungan dua buah variabel atau lebih, tetapi dalam uji chi-square kita hanya mencari apakah kedua atau lebih variabel itu saling independen atau tidak.

Ilustrasi 1:

Kita ingin melihat hubungan independen antara pedagang yang membayar pajak dengan yang tidak membayar pajak di sebuah pasar inpres.


Tax Payee
Ignorant
Total
Wholesaler
42
76
118
Retailer
52
54
106
Total
94
130
224

Langkah pertama kita adalah menentukan Hipotesis untuk pengujian:
Dalam uji chi-square, Hipotesis Null yang diberikan adalah kedua variabel saling lepas atau independen, atau pada kasus di atas berarti bahwa kecenderungan membayar pajak adalah sama antara pedagang besar (wholesaler) dan pedagang eceran (retailer). Hipotesis alternatifnya adalah kecenderungan untuk membayar pajak adalah tidak sama antara pedagang besar (wholesaler) dengan pedagang eceran (retailer).
Hal yang perlu kita ketahui adalah bahwa uji chi-square hanya menguji apakah kedua variabel saling independen atau tidak, ia tidak dapat  menguji karakteristik ataupun nilai antara kedua variabel tersebut.
Langkah kedua kita akan menghitung nilai yang diharapkan (expected value) dari setiap sel pada tabel di atas, Hal ini dapat dilakukan dengan rumus berikut ini:


Dari contoh di atas, maka expected value untuk jumlah pedagang besar (wholesaler) yang memiliki kecenderungan membayar pajak adalah:


Maka berdasarkan perhitungan di atas expected value untuk wholesaler yang membayar pajak adalah 49,5, sedangkan expected value untuk masing-masing sel yang lain adalah:


Tax Payee
Ignorant
Total
Wholesaler
42(49,5)
76(68,5)
118
Retailer
52(44,5)
54(61,5)
106
Total
94
130
224

Kemudian kita akan menghitung nilai statistik chi-square dengan formula sebagai berikut:


Kemudian untuk menentukan tingkat signifikansi kita perlu mengetahui derajat bebas (df) uji chi-square sampel independen. Formula untuk derajat bebas adalah sebagai berikut:
df = (jumlah kolom – 1) x (jumlah baris – 1)
df = (2-1) x (2-1) = 1
Berdasarkan tabel chi-square sampel independen (kamu bisa download tabel sebaran chi-square disini>>>), maka pada tingkat signifikansi 0,05 adalah:


Dari perhitungan yang kita peroleh, dapat kita simpulkan bahwa ϰ2hitung > ϰ2tabel (4,13 > 3,84), dengan demikian kita dapat menolak H0 dimana data tidak saling independen pada tingkat signifikansi 95%.

Ilustrasi 2:

Sebuah lembaga keuangan ingin membandingkan, apakah kinerja mereka dalam menawarkan produk perbankan meningkat daripada tahun lalu, mereka kemudian menyusun kategori produk perbankan mereka sebagai berikut:

1 = Tabungan Junior
2 = Tabungan Pensiun
3 = Tabungan Syariah
4 = Asuransi Pendidikan “EduKasi”
5 = Kredit perumahan “Bersahaja”
6 = Kredit Usaha Koperasi “AyoPinjam”

Berikut ini adalah nasabah yang telah menggunakan produk mereka di tahun lalu,

1 = 34
2 = 52
3 = 33
4 = 10
5 = 58
6 = 13

Sedangkan jumlah nasabah yang membeli produk mereka tahun ini adalah sebagai berikut;

1 = 38
2 = 40
3 = 39
4 = 5
5 = 55
6 = 23

Data diatas secara tabulasi dapat disusun seperti berikut ini,

Product
Observed Value
Expected Value
TOTAL
1
38
34
72
2
40
52
92
3
39
33
72
4
5
10
15
5
55
58
113
6
23
13
36
TOTAL
200
200
400

Manajer keuangan lembaga tersebut ingin mengetahui apakah sebaran populasi nasabah tahun ini sama halnya dengan tahun lalu, dengan demikian Hipotesis yang disusun adalah sebagai berikut;

H0 ; Tidak terdapat perubahan nyata antara sebaran populasi nasabah tahun ini dengan sebaran populasi nasabah tahun lalu.
H1 ;  Terdapat perbedaan nyata antara sebaran populasi nasabah tahun ini dengan sebaran populasi nasabah tahun lalu.

Dalam menyelesaian masalah ini kita dapat melakukan uji chi-square dengan command chitesti Nick Cox yang sudah tersedia dalam stata 12,
Impor data kita ke dalam stata, tampilannya seperti berikut ini:
Lihat data kita yang sudah terinput,


.list


Jika commandnya tidak berjalan, kita harus instal terlebih dahulu dari www.stata.com dengan cara mengetikkan command,

.findit chitesti



Setelah installation complete, kamu bisa jalankan command untuk pengujian chi-square

.chitesti 38 40 39 5 55 23 \ 34 52 33 10 58 13, sep(6)


Atau tanpa kamu menginput nilainya dengan command,

.chitest observed expected, sep(6)

Maka outputnya akan sama saja.
Dari nilai Pearson chi-square yang kita peroleh adalah 14,68 dan nilai signifikansi 0,012, dengan demikian model yang kita peroleh cukup baik (0,012 < 0,05) dengan tingkat signifikansi 95%. Dengan demikian kita telah memiliki cukup bukti untuk menerima H0, dimana tidak terdapat perbedaan antara sebaran populasi nasabah kini dan satu tahun yang lalu.(yoso)
download materi uji chi-square versi pdf di bawah ini.

download link