Rabu, 21 Oktober 2015

Normalisasi Data Dengan Transformasi *excel

Kebanyakan variabel tidak memenuhi uji statistik parametrik karena tidak terdistribusi normal, keragamannya tidak homogen, atau keduanya. Menggunakan uji statistik parametrik seperti ANOVA atau regresi linier pada data tersebut dapat mengakibatkan hasil analisis yang keliru. Pada beberapa kasus, mentransformasi data akan membuat kecocokannya terhadap asumsi menjadi lebih baik.
Untuk mentransformasi data, anda dapat menggunakan operasi matematik pada setiap observasi, kemudian menggunakan angka-angka yang telah bertransformasi tersebut pada pengujian.
Berikut ini adalah jenis-jenis normalisasi data dengan transformasi:
normalisasi
Berikut ini 12 angka data time series nilai tukar Rupiah terhadap dollar Amerika Serikat; kolom kedua adalah data asli, kolom ketiga adalah data log, dan kolom ketiga adalah data akar unit:
Tahun
Data
Log
Akar Unit
1978
442
2,645422
21,0238
1979
623
2,794558
24,96197
1980
627
2,797268
25,03997
1981
632
2,80058
25,13563
1982
661
2,820464
25,7177
1983
889
2,949024
29,8203
1984
901
2,954734
30,017
1985
778
2,891192
27,89946
1986
855
2,932129
29,24585
1987
1.153
3,061852
33,95674
1988
1.325
3,12214
36,39739
Tentunya setelah data ditransformasi, kita juga harus melakukan transformasi terhadap hasilnya. Kita dapat melakukan lawan dari fungsi matematika yang anda gunakan pada transformasi data. Untuk data log, kita dapat melakukan transformasi balik dengan menambahkan pangkat 10 ke angka tersebut.
Pada transformasi log kita menggunakan nilai log dari variabel yang kita gunakan dari analisis. Transformasi log berguna untuk data dimana kita menemukan nilai residual yang semakin besar untuk nilai yang lebih besar dari variabel dependen. Trend pada nilai residual tersebut muncul seringkali karena error atau perubahan nilai dari variabel hasil merupakan persen dari data aktualnya.
Berikut ini adalah beberapa tipe data dengan transformasi yang lazim digunakan:

1. Data Jumlah/Total (amount)

Jumlah merupakan jenis data yang paling lazim ditemui. Datanya terdiri dari data positif (tidak negative), bilangan bulat, pecahan, dan angka irasional. Data jenis ini tidak mungkin negative, misalnya jumlah uang, ketinggian gedung, jangka waktu, dan lain-lain. Menganalisa data jumlah biasanya dengan mengambial angka logaritmanya. Beberapa ukuran yang biasanya digunakan dalam ilmu pengetahuan adalah ukuran logaritmik data actual. Misalnya skala Richter untuk mengukur gempa, mengukur intensitas suara, dan kecepatan peluru senapan.

2. Data Perhitungan (counts)

Perhitungan adalah jumlah dari suatu benda. Biasanya direpresentasikan dengan bilangan bulat non-negatif, seperti jumlah orang di kelas dan jumlah pegawai di perusahaan.
Akar unit (square roots) atau Logaritma (logarithms) biasanya diterapkan pada data perhitungan. Ada juga jenis transformasi yang disebut transformasi “Box-Cox” yang merupakan alat untuk mentransformasi data perhitungan.

3. Pecahan (fraction)

Merupakan data rasio dan biasanya merupakan data persentase dengan dasar perhitungan 100. Namun, semua angka rasional juga disebut pecahan.
Persen biasanya akan lebih mudah dibaca dengan log[ p/(1 – p) ], dimana p adalah persentase yang digambarkan sebagai pecahan antara 0 dan 1. Jika kita ingin mentransformasi persentase 100, transformasinya adalah log[ p/100-p) ].

4. Peringkat (rank)

Peringkat merupakan bilangan bulat yang menggambarkan tingkatan objek atau entitas. Seringkali variabel tambahan ditambahkan kepada data tersebut untuk mengindikasikan tingkatan objek yang dideskripsikan. Peringkat biasanya ditransformasikan dengan log.

5. Neraca (balance)

Neraca merupakan variabel yang diukur pada sebuah skala yang dapat berupa angka negative atau positif, biasanya memungkinkan bagi semua angka baik itu bilangan bulat, pecahan, rasional, dan irasional. Misalnya data keuntungan perusahaan, keuntungan/kerugian transaksi saham, temperatur suhu, dan lain-lain. Data neraca jarang ditransformasikan.
Sumber: Mosteller,F. and .Tukey, J., Data Analysis and Regression, Reading, MA: Addison-Wesley, 1977
download materi versi pdf dibawah ini >>>

0 komentar:

Posting Komentar