Kebanyakan variabel tidak memenuhi uji statistik parametrik karena tidak terdistribusi normal, keragamannya tidak homogen, atau keduanya. Menggunakan uji statistik parametrik seperti ANOVA atau regresi linier pada data tersebut dapat mengakibatkan hasil analisis yang keliru. Pada beberapa kasus, mentransformasi data akan membuat kecocokannya terhadap asumsi menjadi lebih baik.
Untuk mentransformasi data, anda dapat menggunakan operasi matematik pada setiap observasi, kemudian menggunakan angka-angka yang telah bertransformasi tersebut pada pengujian.
Berikut ini adalah jenis-jenis normalisasi data dengan transformasi:
Berikut ini 12 angka data time series nilai tukar Rupiah terhadap dollar Amerika Serikat; kolom kedua adalah data asli, kolom ketiga adalah data log, dan kolom ketiga adalah data akar unit:
Tahun
|
Data
|
Log
|
Akar Unit
|
1978
|
442
|
2,645422
|
21,0238
|
1979
|
623
|
2,794558
|
24,96197
|
1980
|
627
|
2,797268
|
25,03997
|
1981
|
632
|
2,80058
|
25,13563
|
1982
|
661
|
2,820464
|
25,7177
|
1983
|
889
|
2,949024
|
29,8203
|
1984
|
901
|
2,954734
|
30,017
|
1985
|
778
|
2,891192
|
27,89946
|
1986
|
855
|
2,932129
|
29,24585
|
1987
|
1.153
|
3,061852
|
33,95674
|
1988
|
1.325
|
3,12214
|
36,39739
|
Tentunya setelah data ditransformasi, kita juga harus melakukan transformasi terhadap hasilnya. Kita dapat melakukan lawan dari fungsi matematika yang anda gunakan pada transformasi data. Untuk data log, kita dapat melakukan transformasi balik dengan menambahkan pangkat 10 ke angka tersebut.
Pada transformasi log kita menggunakan nilai log dari variabel yang kita gunakan dari analisis. Transformasi log berguna untuk data dimana kita menemukan nilai residual yang semakin besar untuk nilai yang lebih besar dari variabel dependen. Trend pada nilai residual tersebut muncul seringkali karena error atau perubahan nilai dari variabel hasil merupakan persen dari data aktualnya.
Berikut ini adalah beberapa tipe data dengan transformasi yang lazim digunakan:
1. Data Jumlah/Total (amount)
Jumlah merupakan jenis data yang paling lazim ditemui. Datanya terdiri dari data positif (tidak negative), bilangan bulat, pecahan, dan angka irasional. Data jenis ini tidak mungkin negative, misalnya jumlah uang, ketinggian gedung, jangka waktu, dan lain-lain. Menganalisa data jumlah biasanya dengan mengambial angka logaritmanya. Beberapa ukuran yang biasanya digunakan dalam ilmu pengetahuan adalah ukuran logaritmik data actual. Misalnya skala Richter untuk mengukur gempa, mengukur intensitas suara, dan kecepatan peluru senapan.
2. Data Perhitungan (counts)
Perhitungan adalah jumlah dari suatu benda. Biasanya direpresentasikan dengan bilangan bulat non-negatif, seperti jumlah orang di kelas dan jumlah pegawai di perusahaan.
Akar unit (square roots) atau Logaritma (logarithms) biasanya diterapkan pada data perhitungan. Ada juga jenis transformasi yang disebut transformasi “Box-Cox” yang merupakan alat untuk mentransformasi data perhitungan.
3. Pecahan (fraction)
Merupakan data rasio dan biasanya merupakan data persentase dengan dasar perhitungan 100. Namun, semua angka rasional juga disebut pecahan.
Persen biasanya akan lebih mudah dibaca dengan log[ p/(1 – p) ], dimana p adalah persentase yang digambarkan sebagai pecahan antara 0 dan 1. Jika kita ingin mentransformasi persentase 100, transformasinya adalah log[ p/100-p) ].
4. Peringkat (rank)
Peringkat merupakan bilangan bulat yang menggambarkan tingkatan objek atau entitas. Seringkali variabel tambahan ditambahkan kepada data tersebut untuk mengindikasikan tingkatan objek yang dideskripsikan. Peringkat biasanya ditransformasikan dengan log.
5. Neraca (balance)
Neraca merupakan variabel yang diukur pada sebuah skala yang dapat berupa angka negative atau positif, biasanya memungkinkan bagi semua angka baik itu bilangan bulat, pecahan, rasional, dan irasional. Misalnya data keuntungan perusahaan, keuntungan/kerugian transaksi saham, temperatur suhu, dan lain-lain. Data neraca jarang ditransformasikan.
Sumber: Mosteller,F. and .Tukey, J., Data Analysis and Regression, Reading, MA: Addison-Wesley, 1977
download materi versi pdf dibawah ini >>>
download materi versi pdf dibawah ini >>>
Beli Referensi Lengkap :
Aplikasi Analisis Multivariate dengan program SPSS 21 update PLS Regresi Imam Ghozali
Aplikasi Analisis Multivariate dengan program SPSS 21 update PLS Regresi Imam Ghozali
0 komentar:
Posting Komentar