Senin, 26 Oktober 2015

Korelasi Pearson

Korelasi Pearson
korelasi (r) merupakan nilai statistik yang menggambarkan hubungan antara variabel X dan Y dalam terminologi variabel independen, kedua variabelnya sama-sama bebas. Ketika nilai korelasi yang ditunjukkan oleh scatterplot konsekuen menanjak atau berbentuk seperti trend, maka r = +1, ketika nilai korelasi yang ditunjukkan berpola menurun terhadap ordinat, maka r = -1. Semakin dekat nilai r terhadap 1, maka korelasi akan semakin kuat, begitu pula sebaliknya, semakin nilai r mendekati nol, maka hubungan korelasi akan semakin lemah.
Koefisien Korelasi Pearson
Untuk menghitung koefisien korelasi variabel X, kita memerlukan tiga total penjumlahan kuadrat (SS) dimana SS untuk variabel X adalah:
Dimana:
SS       = total penjumlahan kuadrat (sum of square)
XX       = adalah variabel X dengan X
Xi         = adalah n atau jumlah pengamatan
      = nilai rata-rata variabel X

Sedangkan untuk menghitung nilai total koefisien korelasi variabel Y adalah:
Dimana:
SS       = total penjumlahan kuadrat (sum of square)
XX       = adalah variabel Y dengan Y
Xi         = adalah n atau jumlah pengamatan
       = nilai rata-rata variabel Y

Dengan demikian penjumlahan antara kedua variabel dalam koefisien korelasi (SSXY) adalah:
Maka koefisien korelasi adalah:

Interpretasi Koefisien Korelasi Pearson
Koefisien korelasi menunjukkan apakah korelasi antar variabel bernilai positif atau negatif, hal ini menentukan kekuatan hubungan keduanya. Walaupun tidak ada ketetapan nilai dalam menjelaskan seberapa kuat hubungan korelasi, tapi kita dapat menyimpulkannya sebagai berikut:
0 < │r│ < 0,3 adalah korelasi positif lemah
0,3 < │r│ < 0,7 adalah korelasi positif menengah
│r│ > 0,3 adalah korelasi positif kuat
Ilustrasi:
Berikut ini adalah data jumlah pemilik kendaraan bermotor dan data persentase pemilik surat izin mengemudi (SIM) di beberapa kota. Kita kan melihat hubungan korelasi antara kedua variabel tersebut, kita memiliki 16 pengamatan di 16 kota, berikut datanya:
*kita tidak menampilkan perhitungan manual disini tetapi menggunakan perangkat lunak excel 2010.

Untuk langkah pertama kita akan melihat pola persebaran data dengan scatterplot dengan kriteria sebagai berikut:.

Untuk menampilkan scatterplot dengan excel dapat dengan blok semua data dari kedua variabel > insert > scater. Maka scatterplot yang kita dapatkan dari data di atas adalah sebagai berikut:


Kita lihat pola persebaran data pada scatterplot menunjukkan persebaran yang tidak normal lebih ke arah korelasi negatif.
Berikut kita akan melihat nilai korelasinya dengan analysis toolpack bawaan excel, pilih di menubar data > data analysis, seperti gambar,

Bagi yang tidak memiliki menu data analysis, kamu bisa memunculkannya melalui jendela add-ins, melalui menu file > option > add-ins, maka akan ditampilkan jendela add-ins, kamu tinggal pilih analysis toolpack > ok,



Berikutnya kita ingin mengetahui berapa nilai korelasi antara kedua variabel tersebut, kamu bisa masuk ke menubar data > data analysis > pilih correlation > oke,



Setelah muncul jendela correlation, pilih pada input range data yang ingin kamu analisis, kemudian pada output range letakkan dimana saja pada sel excel untuk tampilan outputnya, lalu ok,



Datanya akan ditampilkan sebagai berikut:



Hasil korelasi antara variabel % driver license own terhadap variabel number of motorcycle adalah -0,43, ini menunjukkan nilai korelasi negatif antara kedua variabel tersebut. Hal ini juga ditunjukkan oleh pola sebaran melalui grafik scaterplot menurun atau berlawanan dengan pola data trend.
download materi versi pdf di bawah ini >>>
download link

0 komentar:

Posting Komentar