Kamis, 30 Agustus 2018

Regresi Poisson *SPSS v23

download bahasan ini dalam versi pdf disini >>>

Setelah kita memahami sebaran Poisson (atau yang belum bisa baca disini >>>), kita akan membahas langkah-langkah menjalankan regresi Poisson dengan menggunakan SPSS 17.00. Kita akan melihat kejadian di Kabupaten “X”, dilaporkan bahwa serangan hama tikus lebih banyak ditemukan di perkebunan sawit yang dikelola oleh perusahaan daripada kebun rakyat/plasma dengan 0 menyatakan kebun plasma dan 1 menyatakan kebun perusahaan. Data mengenai luasan total areal perkebunan dari 4 millik perusahaan dan 18 plasma diberikan beserta data luasan serangan hama tikus seperti pada tabel berikut ini:

H0: Luasan lahan dan Jenis Pengelolaan berpengaruh pada Luas Areal Serangan Hama Tikus.
H1: Luasan lahan dan Jenis Pengelolaan tidak berpengaruh pada Luas Areal Serangan Hama Tikus
untuk materi mengenai hipotesis H0 dan H1 silahkan baca kembali disini>>>
.
1
Tipe pengelolaan: 0=plasma; 1=perusahaan

Perlu kita ketahui bahwa variabel dependen yang kita gunakan adalah Luas Areal Serangan yang di akan kita nyatakan dengan Y, sedangkan variabel independen adalah Luasan Lahan (X1) dan Tipe Pengelolaan (X2), Kita akan  membandingkan nilai mean dari variabel dependen Tipe Pengelolaan (Y) dengan Luas Areal Serangan (X2) dengan ANALYZE-COMPARE MEAN-MEAN, input dalam dependent list variabel dependen kita yaitu “Tipe Pengelolaan” dan masukkan “Luas Areal Serangan” ke dalam independen list.

2

Output SPSS: mean dari Y*X2

3

Dari perbandingan mean kedua tipe pengelolaan kebun terhadap luas areal serangan didapatkan mean yang berbeda signifikan berturut-turut untuk tipe pengelolaan plasma dan perusahaan berturut-turut adalah 1163,3 dan 41674,5. Kemudian kita akan melakukan regresi Poisson dengan Luas Areal Serangan sebagai variabel dependen, tipe pengelolaan sebagai faktor, dan Luasan Lahan sebagai kovariat.

1. Lakukan prosedur ANALYZE-GENERALIZED LINEAR MODEL-GENERALIZED LINEAR MODEL,

4

2. Pada kotak dialog yang muncul pilih TYPE OF MODEL, kemudian ceklist POISSON LOGLINEAR, kita akan menggunakan model linier untuk mengetahui log dari jumlah kejadian,

5

3. Pilih tab RESPONSE lalu masukkan variabel “Areal Serangan” dalam kotak DEPENDENT VARIABEL,

6

4. Pilih tab PREDICTORS, lalu masukkan variabel “Tipe Pengelolaan” ke dalam kotak FACTORS, dan “Luasan lahan” ke dalam kotak COVARIATES,

7

5. Setelah itu kita lihat pada tab MODEL, masukkan variabel independen kita ke dalam box MODEL-OK,

8

6. Pilih SAVE, kemudian checklist STANDARDIZED DEVIANCE RESIDUALS, dan lain-lain – OK,
seperti berikut:

9

7. Dan kita mendapatkan residual

10

8. Kita Plotkan Standardized Deviance Residual dengan GRAPH-CHART BUILDER, drag and drop ke kotak CHART VIEW Histogram, lalu isikan axis dengan nilai Standardized Devianced Residual, lalu di kotak dialog EDIT PROPERTIES, ceklist DISPLAY NORMAL CURVE-APPLY seperti berikut:

11

9. Kita dapatkan estimasi dengan kurva residual yang masih mengikuti pola menyebar normal, sesuai dengan asumsi model Poisson;
12

10. Output regresi Poisson adalah sebagai berikut:

13

Dari output PARAMETER ESTIMATES dapat kita simpulkan bahwa:

Variabel independen Tipe Pengelolaan Plasma bernilai B=(-3,837), dimana variabel X2=0 berpengaruh negatif terhadap Luas Areal Serangan Hama Tikus. Hal ini diperkuat oleh Nilai Signifikansi < 0,001, dengan demikian kita dapat menolak H0, bahwa Tipe pengelolaan kebun oleh Rakyat/Plasma tidak memberikan efek bagi Luas Areal Serangan Hama Tikus.

Variabel X2=1 bernilai B=0, dimana pengaruhnya sangat kecil terhadap Luas Areal Serangan Hama Tikus, kekurangan informasi ini nilai signifikansi ini tidak dapat kita tarik kesimpulan untuk menolak H0.
Variabel Luas Lahan berpengaruh negatif terhadap Luas Areal Serangan Hama Tikus dengan nilan B=-6,15, nilai signifikansi < 0,001 menerangkan bahwa variabel ini tidak berpengaruh terhadap variabel Luas Areal Serangan Hama Tikus, dengan demikian kita dapat menolak H0.

Model yang kita peroleh dari persamaan adalah:

151614

download bahasan ini dalam versi pdf di bawah

Sebaran Poisson

download bahasan ini dalam bentuk pdf disini>>>

Kita mungkin menjalankan analisis regresi dengan memperhatikan asumsi data yang menyebar normal, tapi pada beberapa kasus kita mungkin menemukan data yang tidak menyebar normal. Hal ini tentunya dapat kita atasi dengan transformasi data. Tapi adakalanya transformasi data yang kita lakukan tetap saja menghasilkan data yang tidak menyebar normal, hal ini dapat menyebabkan prinsip kenormalan dilanggar. Kita mengenal beberapa tipe data seperti nominal, ordinal, interval, dan mungkin data deret hitung (count). Untuk data deret hitung biasanya kita temukan pada suatu kasus atau pada sampel percobaan. Data jenis ini paling sering menyebabkan data tidak menyebar normal. Pendekatan yang sering digunakan adalah dengan regresi logistik, dengan menyusun kategori variabel misalnya 1=terpilih, 2=tidak terpilih, hal ini bisa dilakukan tetapi kita akan kehilangan informasi riil yang mendekati kenyataan, hasilnya menjadi bias, atau bahkan kekurangan power dalam pengujian. Contoh data deret hitung (count) yang sering kita temui antara lain:
  • Jumlah kecelakaan di jalan raya yang terjadi dalam sebulan
  • Jumlah anak ikan yang menetas pada perlakuan khusus di laboratorium
  • Jumlah serangan tikus pada 1 hektar sawah
  • Jumlah serangan penyakit pada tanaman dalam satu m2
  • Jumlah pertandingan sepakbola yang tertunda karena hujan pada satu musim liga, dan lain-lain.
Karakteristik Data Deret Hitung (Count) antara lain:
  • Tidak bernilai < 0
  • Keragamannya tidak konstan, selalu berubah, biasanya bias sangat tinggi,
  • Data deret hitung (count) biasanya mengikuti distribusi poisson
Ketika variabel respon (bebas) berada dalam bentuk deret hitung (count), kita dapat menggunakan regresi poisson dimana datanya bernilai > 0 dan bernilai absolute (positif). Regresi poisson mengikuti bentuk data logaritma natural dimana:

loge(Y) = β0 + β1X1 + β2X2….

maka dapat kita tulis dalam bentuk lain

Y = (eβ0) (eβ1X1) (eβ2X2)…

Dengan demikian regresi poisson menyatakan hasil dalam bentuk logaritma sebagai fungsi linier variabel prediktor.

Karakteristik Sebaran Poisson
  • Jumlah hasil percobaan (μ) pada suatu daerah diketahui (disini daerah dapat berupa panjang, area, volume atau periode waktu, dan lain-lain)
  • Probabilitas/peluang hasil percobaan selama selang waktu yang singkat atau dalam suatu daerah yang kecil proporsional terhadap besar-kecilnya daerah, bukan pada banyaknya hasil percobaan yang terjadi di luar selang waktu atau daerah tersebut.
  • Poisson memiliki nilai konstanta (e) sebesar 2,71828.
  • Rata-rata banyaknya hasil percobaan yang terjadi selama selang waktu tertentu dinotasikan dengan μ.
  • Banyaknya hasil percobaan dalam suatu percobaan poisson dinotasikan dengan x dan biasa disebut sebagai peubah acak X.
  • P(x; μ): dapat dijelaskan sebagai x hasil yang muncul pada percobaan poisson, dimana jumlah rataan banyaknya hasil adalah sebesar μ.
Jika diketahui rataan jumlah hasil (μ) yang terjadi pada suatu daerah, kita dapat menghitung peluang poisson berdasarkan rumus berikut,

P(x; μ) = (e) (μx) / x!

Dimana x adalah jumlah hasil aktual yang dihasilkan dari percobaan, sedangkan e merupakan konstanta = 2.71828.

Percobaan Poisson dapat saja digunakan untuk menentukan hasil pengamatan-pengamatan mengenai dering telepon per jam, jumlah tikus di sawah per hektar, jumlah kelahiran Caesar di rumah sakit, kejadian kematian akibat kangker, dan banyaknya pembelian suatu merk kosmetik tertentu di sebuah pusat perbelanjaan.

Ilustrasi
Seorang salesman yang bernama mamat yang menjual panci dalam satu bulan dapat menjual rata-rata 2 unit panci per hari (jyaaahhh,,panci pake unit). Berapa kemungkinan panci akan terjual 3 unit esok harinya?

Dengan Notasi sebaran poisson dapat kita tulis sebagai berikut:
  • μ = 2; karena rata-rata 2 panci yang terjual per hari.
  • x = 3; karena kita akan melihat kecenderungan salesman mamat akan menjual 3 panci esok harinya.
  • e = 2.71828; konstanta sebaran poisson.
Kemudian kita akan memasukkan penjualan mamat ke dalam rumus sebagai berikut:

P(x; μ) = (e) (μx) / x!
P(3; 2) = (2.71828-2) (23) / 3!
P(3; 2) = (0,1353) (8) / 6
P(3; 2) = 0.180

Jadi peluang salesman mamat menjual 3 unit panci esok harinya adalah 0,180.

Atau dalam bentuk lain dengan menggunakan tabel sebaran poisson yang biasanya terdapat dalam buku wajib para statistikawan Pengantar Statistika Edisi ke-3 karangan Ronald E.Walpole, maka rumus peluang mamat menjual 3 unit panci esok harinya adalah:

P(3; 2) = (e-2) (23) / 3!

maka:

P(3; 2) = 0,8571 – 0,6767
P(3; 2) = 0,180

Dari tabel sebaran poisson, dapat kita lihat bahwa nilai  adalah 0,8571
Sedangkan nilai  adalah 0,6767

Ilustrasi II
Rata-rata pembelian produk lipstik “cantik berseri” di suatu department store pada hari minggu adalah 5 per hari, berapa probabilitas department store tersebut akan menjual kosmetik kurang dari 4 pada hari minggu berikutnya?
  • μ = 5; karena rata-rata lipstik yang terjual pada hari minggu adalah 5.
  • x = 0, 1, 2, atau 3; kemungkinan terjual kurang dari 4, maka kemungkunan mereka membeli 0, 1, 2, atau 3 lipstik.
  • e = 2.71828; nilai konstanta.
Kita akan menghitung agregat dari peluang-peluang yang terjadi antara lain: P(0; 5) + P(1; 5) + P(2; 5) + 

P(3; 5).
P(x < 3, 5)       = P(0; 5) + P(1; 5) + P(2; 5) + P(3; 5)
P(x < 3, 5)       = [ (e-5)(50) / 0! ] + [ (e-5)(51) / 1! ] + [ (e-5)(52) / 2! ] + [ (e-5)(53) / 3! ]
P(x < 3, 5)       = [ (0.006738)(1) / 1 ] + [ (0.006738)(5) / 1 ] + [ (0.006738)(25) / 2 ] + [ (0.006738)(125) / 6 ]
P(x < 3, 5)       = [ 0.0067 ] + [ 0.03369 ] + [ 0.084224 ] + [ 0.140375 ]
P(x < 3, 5)       = 0.2650

Jadi peluang lipstik “cantik berseri” akan terjual kurang dari 4 pada hari minggu kemudian adalah 0.2650.
Selanjutnya akan kita bahas trik menjalankan regresi poisson dengan SPSS.

download bahasan ini dalam bentuk pdf disini>>>

Sumber:
Anonim.  ____.  Research Method II: Multivariate Analysis, Poisson Regression Analysis.
Walpolle, E. Ronald.  1995.  Pengantar Statistika, Edisi Ketiga – cetakan keenam.  Gramedia Pustaka Utama.  Jakarta.
Berk R, MacDonald J.  2007.  Overdispersion and Poisson Regression.  Department of Criminolgy, University of Pennsylvania: Pennsylvania.

Sebaran Normal

download materi ini versi pdf disini>>>

Sebaran normal digambarkan dengan bentuk kurva simetris, berbentuk seperti lonceng, dari pola data yang diukur. Sebaran normal memiliki nilai mean, mode dan median yang sama. Sebaran normal juga dikenal dengan nama sebaran Gauss (1777 – 1855) yang telah menemukan persamaannya dari studi mengenai galat dalam pengukuran berulang terhadap benda yang sama.
Gambar di bawah merupakan ilustrasi dari sebaran normal:


Suatu variabel acak kontinu X yang memiliki sebaran berbentuk lonceng tersebut disebut dengan variabel acak normal. Dua parameter yang menentukan sebaran peluang variabel acak normal ini adalah nilai mean (µ) dan simpangan baku (σ).
Luas di bawah kurva dibatasi oleh X = X1 dan X = X2 sama dengan peluang bahwa variabel acak mengambil nilai antara X = X1 dan X = X2. Jadi untuk kurva normal P(X1< X < X2) pada gambar di bawah ini dinyatakan oleh luas daerah antara X1  dan X2.


Jika data menyebar normal, kita dapat mentransformasikan setiap pengamatan yang berasal dari sembarangvariabel acak normal X menjadi suatu nilai variabel acak normal Z dengan nilai tengah nol dan ragam =1. Kemuadian nilai X akan kita rubah menjadi Z mengikuti transformasi berikut ini:


Bila X berada diantara X = X1 dan X = X2, maka variabel acak Z akan berada diantara nilai-nilai padanannya:


Dengan demikian:


***contoh 1:
jika pada suatu ujian nilai rata-ratanya adalah 69 dan simpangan bakunya 5. Ketika 15% peserta akan diberikan nilai A, dan diasumsikan mengikuti sebaran normal, berapakan batas nilai terkecil untuk nilai A, dan batas nilai tertinggi untuk B



**pada luasan daerah 15% adalah jumlah mahasiswa yang diberikan nilai A dan merupakan batas terkecil untuk nilai A, sedangkan daerah sebelah kiri sebesar 85% merupakan batas terbesar untuk nilai B sehinga luasan daerah sebelah kiri adalah 0,85 dapat kita lihat dari tabel Z adalah 1,045, dimana P(Z <1,045) = 0,85. download tabel Z-statistic disini>>>,
Sehingga;

X = (5)(1,045) + 69
            X = 74,225

**Jadi, nilai terendah bagi A adalah 74 dan nilai tertinggi untuk B adalah 73.

***contoh 2:
Perusahaan ANGIN GLEBUK membayar gaji karyawannya rata-rata Rp 1.000 per jam dengan simpangan baku 328 sen. Bila gaji tersebut menyebar normal dan dibayarkan sampai sen terdekat, persentase karyawan yang gajinya melebihi Rp 1.500 per jam.

**kita dapat menggambarkan kasus di atas dengan kurva sebaran normal sebagai berikut:



**Luasan daerah dalam kurva adalah 100%, langkah awal kita akan menghitung luasan daerah di sebelah kanan yaitu 1.500 dengan mengganti X = 1.500 dengan Z = 1.500, dengan menggunakan formula berikut ini:



**Setelah memperoleh luasan kurva di sebelah kanan, kita akan mencari luasan kurva di sebelah kiri:

P(X > 1500)       =          P(Z > 1,5)
=          1 – P(Z < 1,5)
=          1 – 0,9332 (lihat table Z)
=         0,067

**Jadi persentase karyawan yang gajinya melebihi Rp 1.500 per jam adalah 6,7%.


download materi ini versi pdf disini>>>