Rabu, 21 Oktober 2015

Sebaran Binomial

Dalam statistik, kita seringkali menemukan data deret hitung (count) yang berbentuk acak diskret, misalnya pada kasus pelemparan koin yang dilakukan sebanyak 6 kali, kita mungkin mendapatkan 3 gambar ataupun 3 angka yang keluar, dengan demikian peluangnya adalah 0,5 untuk gambar dan 0,5 untuk angka.
Atau kita pernah menjalani ujian dengan tipe pilihan ganda, tentunya peluang kita untuk memilih jawaban A, B, C dan D adalah sama untuk yang hanya menebak-nebak, yaitu 0,25 untuk jawaban benar dan 0,75 untuk jawaban salah. Terakhir adalah jika kita melihat data operasi transplan jantung di sebuah rumah sakit, maka kita akan temukan dari 20 kali operasi, berapa pasien yang dapat bertahan, tentunya peluangnya adalah 0,5 untuk berhasil dan 0,5 untuk gagal.
Beberapa ilustrasi di atas merupakan contoh kasus percobaan yang berjumlah n yang akan memberikan hasil antara sukses atau gagal, satu dari dua pilihan, atau katakanlah bersifat dikotomi. Percobaan ini seringkali disebut sebagai percobaan binom atau yang kita kenal dengan bernoulli trial dengan karakteristik yang berbeda dengan percobaan poisson yang telah kita bahas. Percobaan binom memiliki karakteristik antara lain:
  • Terdiri atas sejumlah n percobaan berjumlah tetap,
  • Hasil yang didapat hanya dua kemungkinan yaitu sukses atau gagal, atau sisi gambar atau sisi angka seperti pada
kasus pelemparan koin tadi,
  • Peluang sukses yang dinotasikan dengan p, adalah sama pada setiap percobaan,
  • Setiap percobaan adalah independen, artinya hasil dari satu percobaan tidak mempengaruhi hasil percobaan yang lain.
Hasil dari percobaan binom adalah jumlah keberhasilan, variabel diskret X yang menunjukkan jumlah keberhasilan disebut variabel acak binom. Nilai yang mungkin untuk percobaan binom adalah X=0,1,2, ...,n dan peluang-peluang yang dihasilkannya akan menunjukkan sebaran binom yang dinotasikan dengan B(n,p).
Formula yang digunakan pada percobaan binom untuk mendapatkan sejumlah k keberhasilan pada n percobaan adalah seperti berikut:
rumus 1
Dimana:
n          = jumlah percobaan
k          = jumlah keberhasilan
n-k       = jumlah kegagalan
p          = kemungkinan keberhasilan pada satu kali percobaan
1-p       = kemungkinan kegagalan pada satu kali percobaan
Ilustrasi singkat:
Jika naomi menebak dari 10 pertanyaan pilihan ganda yang diberikan dalam ujian statistik, berapakah kemungkinan naomi menjawab 5 pertanyaan dengan benar jika pilihan jawaban yang diberikan adalah 5?
Untuk permasalahan Naomi kita memiliki n = 10, k = 5, dengan demikian peluang naomi menjawab benar p = 0,2, dan kemungkinan naomi menjawab salah adalah 0,8.
rumus 2
Maka P(5 jawaban benar dari 10 pertanyaan) ≈ 0,026
Probabilitas Binom Kumulatif
Ilustrasi di atas menerangkan peluang Naomi menjawab 5 jawaban dengan benar, bagaimana jika dikatakan paling banyak 5 jawaban benar?pertanyaan tersebut akan mengarah kepada peluang binom kumulatif dimana variabel acak binom akan jatuh pada rentang tertentu baik itu lebih besar dari atau sama dengan (>), kurang dari atau sama dengan (<).
Masalah tersebut dapat diselesaikan dengan menghitung P(6), P(7), P(8), P(9), P(10), yang kemudian dapat kita singkat dengan:
rumus 3
Dimana kita akan menghitung nilai-nilainya sebagai berikut:
P(k > 5, 10) = P(6) + P(7) + P(8) + P(9) + P(10)
Menghitung Sebaran Binom dengan Excell
Jika kita menghitung nilai Probabilitas dengan excell berdasarkan data ujian Naomi di atas, adalah seperti berikut ini:
1
Kemudian pada nilai probabilitas kita tinggal mengetikkan BINOMDIST(nomor cell, FALSE), seperti berikut:
2
Kita lihat pada gambar urutan dari formula BINOMDIST yaitu NUMBER (jumlah keberhasilan), TRIAL (jumlah percobaan), PROBABILITY (probabilitas keberhasilan), dan CUMULATIVE yang dinyatakan dengan FALSE yang menunjukkan 1-p (1-0,2).
Kemudian klik enter dan akan menunjukkan hasil 0,0264:
3
Kemudian kita akan mencari probabilitas kumulatifnya jika pertanyaan mengarah kepada rentang tertentu, dalam kasus ini peluang Naomi dapat menjawab paling banyak 5 jawaban benar ( < 5 ).
Untuk menjawab pertanyaan ini kita hanya mengganti fungsi kumulatif FALSE dengan TRUE seperti berikut ini:
4
Setelah kita enter hasilnya akan tampak seperti berikut:
5
Kita juga akan menghitung probabilitas naomi menjawab paling sedikit 5 jawaban benar ( > 5 ), dengan demikian kita akan menghitung P(6), P(7), P(8), P(9), dan P(10), sebagai berikut:
6
Kemudian kita lakukan proses yang sama pada P(7) dan seterusnya sehingga didapatkan hasil berikut:
7
Setelah didapatkan hasil masing-masing probabilitasnya, kita tinggal menggunakan fungsi SUM untuk mengetahui probabilitas kumulatif seperti di bawah ini:
8
Maka hasilnya akan ditampilkan sebagai berikut:
9
download versi pdf di bawah ini >>>

Konsep Data Statistik

Statistik merupakan suatu bidang keilmuan terkait dengan metode interpretasi dan analisis data. Baik itu bersifat numerik, ataupun kategorik, data dapat diinterpretasi dengan metode statistik dan diformulasikan untuk analisis lebih lanjut guna kepentingan peneliti. Mengetahui jenis dan tipe data dalam konsep statistik akan mempermudah pengguna dalam menentukan cara pengumpulannya dan bagaimana mengolahnya sesuai dengan kebutuhan. Data umumnya terdiri dalam beberapa tipe antara lain: 

1. Data Kualitatif (qualitative data
Data kualitatif adalah data yang ditunjukkan dengan kata-kata, tidak dengan angka. Misalnya data indeks prestasi dinyatakan dengan sangat memuaskan, memuaskan, kurang memuaskan, dan …….. (lanjutkan sendiri) Data kualitatif terdiri atas data nominal dan data ordinal. Data nominal dinyatakan dengan ukuran berdasarkan kategori dan tidak menunjukkan adanya perbedaan atau peringkat; misalnya jenis kelamin(pria – wanita), agama (islam – kristen – budha), dan jenis lagu (pop – dangdut – jazz). Data ordinal menyatakan peringkat, tapi interval pengukurannya tidak jelas atau tidak memiliki makna apa-apa misalnya ukuran (Small - Medium – large – Xtra large). Dengan demikian data kualitatif dapat digunakan untuk mengkategorikan sesuatu, tetapi tidak memberikan keterangan lebih lanjut tentang kategori tersebut. Misalnya kita ingin mengukur ekspresi seseorang yang dinyatakan dengan sangat senang, senang, kurang senang, atau tidak senang. Tentunya ekspresi ini bersifat subjektif untuk setiap orang serta derajatnya tidak dapat diukur. pemaparan data kualitatif dapat dilihat bahasannya disini >>>
2. Data Kuantitatif (quantitative data
Data ini dinyatakan dalam angka dan memasukkan skala numerik dalam perbandingannya seperti ukuran, temperatur, berat, tinggi, dan lain-lain. Jumlah siswa pada suatu sekolah, tinggi beberapa gunung berapi di Indonesia, tingkat kelahiran penduduk per tahun, dan temperatur dan kelembaban udara di suatu kota merupakan bentuk-bentuk data yang dinyatakan secara kuantitatif. Skala yang digunakan pada pengukuran data kuantitatif yaitu rasio dan interval. Rasio biasa digunakan dalam jumlah uang dan umur, rasio memiliki titik terendah dan tertinggi pengukuran. Interval biasa digunakan untuk mengukur berat, tinggi, waktu, maupun temperatur. Interval tidak memiliki titik awal pengukuran, pembandingan pengukuran dilakukan pada data-data yang dilibatkan dalam penelitian. 

3. Data Kontinu (continuous data). 
Data kontinu dapat berbentuk nilai apapun bahkan dalam unit yang sangat kecil misalnya dalam millimeter maupun mikron. Pengukuran panjang, waktu, kurs, tekanan darah, pendapatan perkapita dapat kita kategorikan ke dalam tipe data kontinu. Contoh data kontinu lain dapat kita lihat pada waktu pembalap menyelesaikan lomba, panjang isolate bakteri di bawah mikroskop, jumlah trombocyt pasien penderita demam berdarah pada sebuah rumah sakit, dan lain sebagainya. 

4. Data Runtun Waktu (time series
Data tipe ini diukur pada rentang waktu yang berbeda, dan memiliki komponen waktu pada prosesnya; Misalnya data pergerakan kurs mata uang per hari, data kunjungan sebuah objek wisata per tahun, peningkatan aktivitas organ jantung per menit, dan data pergerakan harga komoditi di lantai bursa yang diukur setiap menit. untuk konsep data runtun waktu (time series) dalam kacamata ekonometrik dapat dilihat disini >>>
download versi pdf di bawah ini >>>

Jumat, 16 Oktober 2015

Pemaparan Data Kualitatif *new IBM SPSS 23

Jika kita memiliki dua variabel kualitatif yang merupakan sebaran bersama (joint distribution), kita dapat merangkumnya dalam bentuk tabel frekuensi dua arah. Pada tabel frekuensi dua arah, variabel dikategorikan sebagai kelas pada baris dan pada kolom terdapat jenis variabel. Penjumlahan dari data bivariat disebut cross-tabulation atau cross-classification dalam sebuah tabel kontingensi.
Tabel frekuensi yang paling sederhana adalah 2x2, dimana setiap variabel hanya memiliki dua kelas. Sama halnya dengan tabel frekuensi 2x3, 3x3, dan lain-lain, dimana data tersusun dalam sejumlah baris dan kolom.
Berikut ini adalah contoh data golongan darah (bloodtype) dan jenis kelamin (sex):
Kita akan merangkum data ini ke dalam tabel frekuensi 2x2 dengan software SPSS 23:
1.   Langkah pertama buka software SPSS 23 kemudian impor data dari file dalam bentuk excel yang telah kita susun, pilih dari menubar file > open > data > open seperti gambar,
Pastikan type of files dalam bentuk excel,


2.   Setelah muncul kotak dialog opening excel data source, beri checklist pada box seperti berikut, 

3.   Kemudian data kita akan terlihat seperti berikut dalam SPSS 23,

4.   Selanjutnya setelah data siap pilih di menubar analyze > descriptive statistics > crosstabs, seperti gambar,

5.   Setelah muncul kotak dialog crosstabs, masukkan variabel bloodtype ke dalam row, dan variabel sex ke dalam column,

6.   Kemudian akan ditunjukkan output tabel kontingensinya seperti berikut:

7.   Dan diagramnya sebagai berikut,

Jika sebuah variabel kualitatif memiliki kelas i dan kelas j, maka sebaran gabungan dari kedua variabel tersebut dapat dirumuskan dalam tabel frekuensi i x j.  Jika jumlah sampel n dan sel ke-ij memiliki frekuensi fij maka frekuensi relatif sel ij adalah:
Frekuensi relatif dinyatakan dalam persentase.
Untuk tabel frekuensi dua arah, kita dapat menghitung total pada baris dan kolomnya. Untuk kolom ke-i totalnya adalah:
fi. = fi1 + fi2 + fi3 + ... + fij
Sementara itu untuk kolom ke-j total kolom fij adalah:
f.j = f1j + f2j + f3j + ... + fij
Berdasarkan pada total kolom dan baris di atas kita dapat menghitung frekuensi relatif masing-masing, untuk sel ke-ij, untuk baris i maka frekuensi relatifnya adalah :
Dan frekuensi relatif bagi kolom j adalah :
8.   Selanjutnya dari menubar analyze > descriptive > crosstab, kita akan mencari frekuensi untuk masing-masing baris dan kolom, jangan lupa untuk mengatur persentase pada tab cells di bagian kanan kotak dialog crosstabs,



9.   Kita dapatkan output frekuensi berikut,



Dari hasil frekuensi relatif di atas kita dapat menyimpulkan apakan terdapat hubungan antara variabel baris dan kolom. Jika persentase baris sangat berbeda dengan baris yang lainnya maka sebaran dapat dikatakan memiliki keragaman yang tinggi, sehingga kita dapat menyimpulkan bahwa terdapat hubungan antar variabel, artinya variabel baris akan berpengaruh terhadap variabel kolom. Dan sebaliknya jika persentase antar kolom berbeda signifikan maka terdapat hubungan antar variabel dimana nilai variabel kolom berpengaruh terhadap nilai variabel baris.

Rabu, 14 Oktober 2015

Sebaran Penarikan Sampel

Sebaran sampling adalah sebaran probabilitas yang menggambarkan nilai yang mungkin dari sebuah sampel statistik (Agresti dan Finlay, 1997). Ketika data diperoleh dari pengambilan sampel acak atau percobaan acak tak tentu, maka statistik merupakan variabel acak yang tidak lagi mematuhi kaidah probabilitas. Hubungan antara probabilitas dan data dibentuk oleh sebaran sampling statistik. Sebaran sampling menunjukkan bagaimana statistik dapat bervariasi pada data yang dihasilkan secara berulang. Setiap metode statistik memiliki sebaran penarikan sampel yang merupakan salah satu tipe dari sebaran probabilitas. Sebaran penarikan sampel tidak mengacu pada pengamatan individual tetapi terhadap nilai statistik yang dihitung dari pengamatan sampel ke sampel.

Sebaran penarikan sampel mencerminkan keragaman penarikan sampel yang muncul dalam proses pengumpulan data dan perhitungan nilai parameter. Ia berdasarkan pada n pengamatan dari sebaran probabilitas yang dihitung secara statistik yang didapatkan dari pengambilan sampel sebanyak n secara berulang, setiap kita melakukan perhitungan nilai statistik. Secara teoritis bentuknya kita ketahui, dengan itu kita dapat menyatakan bahwa nilai statistik untuk sebuah sampel dengan jumlah sampel n konstan.

Nilai Mean Sebaran Penarikan Sampel
Kita dapat memilih sampel acak sederhana sebesar n dari sebuah populasi, dan mengukur variabel X pada setiap individu dalam sample. Data yang diperoleh terdiri dari pengamatan variabel acak n X1,X2,...,Xn. Xi adalah pengukuran terhadap sebuah variabel secara individu yang dipilih secara acak dari populasi dan oleh karena itu Xi merupakan variabel acak dengan sebaran probabilitas yang sama dengan sebaran probabilitas variabel X. Jika populasi sampel yang digunakan relatif besar, maka dapat kita asumsikan bahwa X1,X2,...,Xn adalah variabel acak independen yang memiliki sebaran probabilitas sama. Inilah yang akan kita jadikan sebagai model probabilitas untuk mengukur masing-masing variabel pada sampel acak sederhana.
Mean sampel dari sampel acak sederhana dengan ukuran n adalah:
Dimana X merupakan variabel acak, sedangkan n adalah jumlah/ukuran sampel.
Jika variabel populasi X memiliki mean populasi µ yang juga merupakan mean dari setiap pengamatan Xt. Untuk sebuah sampel acak dengan jumlah n dari populasi yang memiliki nilai mean µ dan standar deviasi (standar error) σ, sebaran penarikan sampel dari mean sampel acak X memiliki mean µX = µ dan standar deviasi i.e., standar error.(Moore dan McCabe, 1998).

Variabel acak X memiliki keragaman seperti berikut:
Kemudian standar deviasi atau standar errornya seperti berikut ini:
Mean dan standar error X menunjukkan bahwa mean sampel X cenderung mendekati mean populasi µ. Maka semakin besar sampel akan semakin akurat perhitungan karakteristik dari suatu populasi.

Ilustrasi:
Jika kita memiliki data sebaran normal pemakai parfum “tjap jahe” di kampung kapur dengan mean µ=77, dan standar deviasi σ=14;
  • Jika sampel acak kita ambil dari 58 responden, berapa probabilitas bahwa mean sampel X akan terletak para rentang 76 dan 78?
  • Berapa probabilitas bahwa mean sampel X akan terletak kurang dari 76 jika sampel yang digunakan adalah 120 responden?
Clue:
Dari ilustrasi di atas yang kita ketahui adalah; mean = 77; standar deviasi = 14, n = 58.
Maka nilai Ztabel (sebaran populasi menggunakan kurva sebaran Z, lihat disini) = nilai aktual rentang – rentang populasi / standar error.
Untuk jumlah sampel 58, maka Standar error = 
Untuk jumlah sampel 120, maka standar error = 

Perhitungan probabilitas sampel acak X:
1. Pada jumlah sampel acak 58 responden, pertama tama kita akan mencari nilai aktual Ztabel untuk rentang 76 dan 78.
Nilai Ztabel untuk 76 = 76 – 77 = -1/1,838 = -0,54, lihat di tabel Z hasilnya adalah 0,2946.
Nilai Ztabel untuk 78 = 78 – 77 = 1/1,838 = 0,54, lihhat di tabel Z hasilnya adalah 0,7054.
Maka pada rentang 76 – 78 probabilitasnya adalah 0,7054 – 0,2946 = 0,4108.
Maka probabilitas mean sampel X untuk mendapatkan nilai Z antara -0,54 dan 0,54 adalah 0,4108 (41,08%).

2. Pada jumlah sampel 120, maka probabilitas bahwa mean sampel akan terletak pada area kurang 76
Nilai Ztabel  : 76 – 77 = -1/7,617 = -0,13, lihat di tabel Z hasilnya adalah 0,448
Maka probabilitas mean sampel X untuk memperoleh nilai Z < -0,13 adalah 0,448 (44.8%).
download versi pdf di bawah >>>

Senin, 12 Oktober 2015

Sebaran Probabilitas Diskret

Jika suatu penelitian memiliki pengamatan berulang yang sangat panjang terhadap suatu kejadian atau fenomena acak, setiap pengamatan dapat saja menghasilkan satu atau beberapa output yang dapat ditarik menjadi inferensia, tetapi bisa juga tidak. Probabilitas dari sebuah hasil pengamatan dimaknai sebagai proporsi waktu dimana hasilnya akan didapatkan dalam jangka panjang dengan proses pengamatan yang berulang.
Pada proses pelemparan koin (misalnya koin gope) secara berulang, hasil yang akan kita dapati mungkin saja yang keluar angka atau sebaliknya. Jika hasilnya seimbang antara angka dan gambar, maka probabilitasnya akan sama dengan ½. Dengan demikian variabel yang memiliki dua kemungkinan hasil dapat kita sebut variabel acak dengan outputnya berupa angka pada sebuah kejadian acak.
Variabel acak biasanya dinotasikan dengan alfabet, misalnya X dan Y. Nilai variabel acak X bisa saja sama dengan nilai variabel acak yang lain. Sebaran probabilitas variabel acak X memungkinkan hasil yang diperoleh bersama dengan probabilitas variabel acak X.
Sebaran probabilitas variabel acak diskret X menggunakan probabilitas untuk setiap nilai variabel yang mungkin. Probabilitas dinyatakan dengan angka antara 0 dan 1, dan jumlah probabilitas semua nilai yang mungkin diperoleh adalah sama dengan 1. Jika Xi,i = 1,2,...,k, menyatakan hasil yang mungkin dari variabel acak X dan jika P(X = Xi) = P (Xi) = P1 menyatakan probabilitas hasil tersebut, maka :
Dimana setiap probabilitas bernilai antara 0 dan 1, dan probabilitas total sama dengan 1, analoginya adalah sebagai berikut:
Ilustrasi :
Pak Sofyan guru muatan lokal memberikan nilai kepada murid-muridnya antara lain; 30% dengan nilai A, 35% dengan nilai B, 20% dengan nilai C, dan 15% dengan nilai D. Nilai murid merupakan variabel acak X, hitunglah sebaran probabilitas diskret dari X, gambarkan histogram sebaran probabilitas diskretnya.
Solusi:
Pertama-tama kita akan mengelompokkan nilai siswa dalam tabel seperti berikut ini:

Maka sebaran probabilitas diskret :
P(XA) = 30/100 = 0,3
P(XB) = 35/100 = 0,35
P(XC) = 20/100 = 0,2
P(XD) = 15/100 = 0,15
Kemudian kita gambarkan histogram sebaran probabilitas diskret dengan excell seperti berikut:

1. Input data kita ke dalam excell, ingat bahwa X atau variabel acak nilainya selalu bertingkat misalnya 0,1,2,3,...,k. Disini variabel acak X adalah Nilai siswa dimana nilai 0,1,2,3 merepresentasikan grade nilai A,B,C,dan D.


2. Berikut adalah posisi masing masing item

3. Pilih insert, lalu column, pilih salah satu dari 2-D column:



4. Kemudian akan ditampilkan hasilnya seperti gambar histogram di bawah ini:

download materi versi pdf di bawah ini >>>