Bagaimana cara mengatasi data yang tidak berdistribusi normal dalam uji normalitas?

Halo mahasiswa, hari ini skripsimalang.com akan memberikan beberapa penyebab dan solusi untuk mengatasi data yang tidak normal.

Apa yang menjadi penyebab data yang tidak normal?

Sebuah data bisa disebut normal adalah ketika data tersebut mengikuti pola distribusi normal. Pada beberapa teknik analisis yang termasuk ke dalam analisis statistik parametrik memberikan syarat data harus mengikuti distribusi normal. Terkadang hal tersebut tidak sesuai dengan harapan peneliti dimana data yang sudah dianalisis justru tidak normal.

Ada beragam penyebab kenapa data yang sudah dianalisis tidak mengikuti distribusi normal, salah satunya adakesalahan pada saat pengambilan data. Kesalahan saat pengambilan databisa terjadi karena beragam faktor internal dan juga faktor ekternal. Oleh sebab itu kesalahan saat pengambilan data harus diminimalkan. Kesalahan berikutnya adalah salah saat memberikan perlakuan ketika mengambil data primer. Penyebab data sekunder tidak normal salah satunya karena saat pengambilan data dilakukan tidak secara acak.

Kecenderungan pada saat Anda melakukan penelitian di bidang sosial, data yang diperoleh tidak normal. Jadi Anda tidak perlu gusar karena kondisi tersebut sangatlah wajar.

Bagaimana cara mengatasi data yang tidak normal?

Menambah jumlah data

Cara tersebut bisa dilakukan jika data penelitian Anda tidak normal dan perlu adanya untuk menambah data. Data yang sudah dimiliki bisa ditambah dengan beberapa data baru, kemudian data yang sudah digabungkan tersebut bisa Anda uji normalitas lagi. Cara yang demikian dapat dilakukan hingga memperoleh data yang normal. Namun cara tersebut cenderung tidak bisa dilakukan disebabkan waktuu penelitian yang terbatas dan besarnya dana yang harus dikeluarkan.

Menghilangkan data

Cara berikut bertolak belakang dengan cara sebelumnya. Pada cara ini ada beberapa data yang harus dihilangkan agar memperoleh data yang normal, namun bukan asal menghilangkan data. Tapi data yang dihilangkan harus benar-benar yang menyebabkan sebuah data tidak normal. Dsata yang tidak normal biasanya disebabkan oleh data outlier. Menghilangkan data yang demikian harus memperhatikan bahwa pengurangan dari data tersebut, tidak akan mempengaruhi tujuan penelitian.

Melakukan transformasi

Cara ini dengan mengubah data ke bentuk-bentuk tertentu misalnya LN. Selanjutnya Anda bisa melakukan pengujian ulang.

Menerima apa adanya

Anda bisa melakukan anlisis dengan teknik berbeda untuk melakukan uji hipotesis, yaitu dengan non parametrik pada uji ini Anda tidak perlu mensyaratkan data berdistriburi normal.

skripsimalang.com sudah menyelesaikan empat Tips Mengatasi Data Yang Tidak Normal, sehingga Anda bisa memulai lagi dengan melakukan koreksi ulang. Apakah data bisa menerima teori dan cara yang kami berikan. Apabila memang bisa dilakukan, maka silakan dengan tetap mengikuti aturan baku yang dimiliki oelh masing-masing teknik analisis yang ada.

Gambar : Cover Artikel Ditulis oleh : Dimas Purbo Wicaksono Fenda Putra, S.E.

Data berdistribusi normal merupakan salah satu syarat yang harus dipenuhi dalam analisis parametrik. Dampak dari data yang tidak berdistribusi normal menyebabkan varians data menjadi tidak homogen. Sehingga bila data tidak berdistribusi normal maka perlu diperbaiki atau diobati supaya normal. Ada beberapa cara yang bisa kita lakukan untuk menjadikan data berdistribusi normal. Pada kesempatan ini penulis akan berbagi tips solusi mengatasi data yang tidak berdistribusi normal. Berikut adalah solusi yang insyaAllah bermanfaat dan bisa kalian coba sendiri.

Solusi 1 : tambah jumlah data baru (di tambah hingga hasil menunjukkan data berdistribusi normal), usahakan jumlah sampel data lebih dari 30. Lebih dari 30 bukan jumlah total data ya, melainkan jumlah sampel yang diteliti.

Solusi 2 : Deteksi outler, data yang terjangkit outlier buang.

Solusi 3 : tranformasi data ke dalam bentuk log atau ln (jika transformasi melalui eviews hasilnya masih tetap, lakukan transformasi di microsoft excel)

Solusi 4 : jika hasil tetap tidak normal, ganti analisis dengan non parametrik (uji non parametrik tidak mensyaratkan pengujian normalitas).

Solusi 5 : bila jumlah sampel observasi data lebih 30 dan ternyata data tidak normal maka biarkan saja. Gunakan pendapat central limit theorem yg menyatakan bahwa data yang memiliki jumlah sampel lebih dari 30 maka dianggap normal. Mengapa ? Karena uji normalitas pada dasarnya diperuntukkan untuk data yang memiliki sampel kecil. Untuk data dengan jumlah sampel besar dianggap normal.

Informasi ekonometrika secara lengkap, silakan kunjungi channel youtube saya di : Dimas Channel

Note : Silakan bagi teman-teman yang ingin meng-copy artikel ini. Mohon sertakan sumber aslinya. Terima Kasih :-) 

 Gambar : Cover Artikel

Ditulis oleh : Dimas Purbo Wicaksono Fenda Putra, S.E.

A.Penjelasan Normalitas

Uji normalitas bertujuan untuk menguji apakah dalam model regresi, variabel pengganggu atau residual mempunyai distribusi normal. Pengujian normalitas yang sering digunakan adalah uji Jarque-Bera (JB). Uji JB adalah salah satu metode pengujian  yang digunakan untuk sampel besar (asymptotic).

Rumus uji JB adalah :

Di mana :

n= besarnya sampel

S= koefisien skewness

K= koefisien kurtosisi

Nilai JB mengikuti 2 df (degree of freedom) distribusi chi-square. Nilai JB selanjutnya dapat kita hitung signifikansi-nya untuk menguji hipotesa.

B.Tahapan Pengolahan Data

Pada kesempatan ini, kita akan belajar cara uji normalitas beserta pengobatan-nya dengan software eviews per-tahapan agar mudah dipahami dan dipraktekkan secara langsung.

Variabel yang dipergunakan :

Y   = Kriminalitas

X1 = Kemiskinan

X2 = Pengangguran

X3 = Penduduk

Langkah 1 : Persiapkan data yang akan diolah, usahakan data telah disusun terlebih dahulu. Berikut susunan data-nya (Data ini merupakan data sekunder, data ini hanya sebagai contoh saja).

Berikut adalah contoh data cross section.

Gambar : Data Latihan

Langkah 2 : Buka Sofware eviews-nya, Klik File -> New -> Workfile.

Gambar :Pengolah Data Eviews 9

Langkah 3 : Pada bagian Workfile structure type, pilih Unstructured/Undated.

Gambar :Pengolah Data Eviews 9

Langkah 4 : Di data range isikan dengan jumlah pengamatan saudara, misal : 35. Kemudian klik ok.

Gambar :Pengolah Data Eviews 9

Langkah 5 : Menuju menu Quick, lalu pilih Empty Group (Edit Series).

Gambar :Pengolah Data Eviews 9

Langkah 6 : Setelah itu copy-kan data yang sudah siap diolah (note : Jangan lupa sertakan variabel independent dan dependent), kemudian klik paste pada kolom atas group.

Gambar :Pengolah Data Eviews 9

Langkah 7 : Data sudah masuk ke dalam program eviews. Kemudain pilih Proc -> Make Equation.

Gambar :Pengolah Data Eviews 9

Langkah 8 : Lalu akan muncul tampilan Equation Estimator -> Specification.

Gambar :Pengolah Data Eviews 9

Langkah 9 : Ubah persamaan regresi kriminalitas kemiskinan pengangguran penduduk c menjadi kriminalitas c kemiskinan pengangguran penduduk. Pada Estimation setting di bagian Method-pilih dengan “LS - Least Squared (NLS and ARMA).

Gambar :Pengolah Data Eviews 9

Langkah 10 : Kemudian klik ok. Hasilnya sebagai berikut.

Gambar :Pengolah Data Eviews 9

Langkah 11 : Setelah kita mengetahui hasil dari regresi data. Lakukan uji normalitas. Caranya dengan kita menuju ke View => Residual Diagnostics dan pilih Histogram - Normality Test. Klik ok.

Gambar :Pengolah Data Eviews 9

Langkah 12 : Hasilnya sebagai berikut.

Gambar :Pengolah Data Eviews 9

Interpretasi output :

Hipotesa :

H1        : Data tidak berdistribusi normal

H0        : Data berdistribusi normal

Persyaratan Normalitas :

Jika nilai probability < 0.05, maka data tidak berdistribusi normal.

Jika nilai probability > 0.05, maka data berdistribusi normal.

Hasil uji normalitas residual di atas adalah: nilai jarque bera sebesar 8.948679 dengan p value sebesar 0.011398 dimana < 0.05 sehingga terima H1 atau yang berarti residual tidak berdistribusi normal.

Selain menggunakan pengamatan tingkat alpha, kita bisa membuktikan hasil tidak normal melalui perhitungan manual dengan rumus yang sudah dijelaskan diawal yaitu :

Di mana :

n= besarnya sampel

S= koefisien skewness

K= koefisien kurtosisi

Identifikasi :

Berdasarkan nilai Skewness dan Kurtosis nilai JB statistik hasilnya sebagai berikut :

S2/Skewness    = 0.973374

K/Kurtosis       = 11.36410

Nilai JB = 0.011398 kita bandingkan dengan tabel chi square. Sebelum kita masuk ke tabel chi square, saya akan ajarkan cara melihat tabel persentase distribusi t terlebih dahulu. Untuk mencari hasil di tabel persentase distribusi t, cari nilai df terlebih dahulu dengan rumus.

k=Jumlah variabel penelitian

n=Jumlah observasi/data/responden

Identifikasi :

Berdasarkan nilai n dan k hasil-nya sebagai berikut :

K/Variabel Penelitian = 4 (Kriminalitas, Kemiskinan, Pengangguran, dan Penduduk)

n/Jumlah Observasi = 35 observasi (35 Kabupaten di Jawa Tengah)

Maka kita dapatkan degree of freedom = 31

Langkah selanjutnya tentukan taraf signifikansi-nya. Perlu diperhatikan bahwa yang kita pergunakan disini adalah taraf signifikan dua sisi/sign (5%).

Taraf signifikan dua sisi (5%) = 0.025.

Selanjutnya kita lihat nilai presentase distribusi t.

Gambar : Tabel Persentase Distribusi t

Gambar : Tabel Persentase Distribusi t

Nilai t tabel yang didapat dari jumlah variabel (4) dan jumlah observasi (35) serta taraf signifikansi (dua sisi = 0.025) adalah sebesar 2.03951.

Setelah tadi kita sudah mengetahui cara melihat tabel persentase ditribusi t. Selanjut-nya kita lihat nilai tabel chi squared. Ada beberapa hal yang perlu diperhatikan disini, yaitu :

Titik kritis (tingkat alpha), merupakan nilai peluang dari tingkat kesalahan yang dapat diterima. Nilai yang sering digunakan yaitu 0.05 (5%). Nilai ini ditentukan oleh peneliti.

Degree of Freedom (df), merupakan derajat kebebasan yang digunakan untuk menentukan baris keberapa angka tabel.

Nilai tabel chi-square, merupakan nilai batas untuk menerima dan menolak hipotesa di awal.

Seperti tadi yang sudah dijelaskan di awal, nilai JB mengikuti 2 df (degree of freedom) distribusi chi-square. Langsung kita praktikkan.

Berikut adalah tabel chi-sqaure:

Gambar : Tabel Chi Square

Kita cari nilai df (2) pada tingkat signifikansi 0.05(5%).

Gambar : Tabel Chi Square

Gambar : Tabel Chi Square

Kesimpulan : Nilai chi-sqaure dengan DF (2) sebesar 599.146 dengan tingkat signifikansi 0.05(5%). Sehingga hipotesa nol yang menyatakan residual terdistribusi normal, ditolak.

Kita perlu memperhatikan bahwa asumsi distribusi normal hanya diperuntukkan untuk ukuran sampel yang kecil. Oleh karena itu kita dapat mengabaikan untuk ukuran sampel besar. Jika dilihat dari hasil di atas bahwa masih saja ada data yang tidak terdistribusi normal karena tingkat signifikan yang lebih kecil dari alpha 0,05(5%). Berdasarkan Central Limit Theorem bahwa untuk sampel yang memiliki ukuran besar terutama n lebih dari 30 (n ≥ 30), maka data dianggap normal (Dielman, 1961). 

Kesimpulkan bahwa meskipun hasil dari pengujian asumsi klasik yaitu uji normalitas menunjukkan data tidak berdistribusi normal, karena sampel dalam penelitian ini lebih dari 30 (n ≥ 30), maka data dianggap normal.

C.Tahapan Perbaikan Data

Jika kita masih ingin mencoba menormalkan data, maka langkah yang harus dilakukan adalah dengan mendeteksi nilai outlier-nya. Seandai-nya nilai outlier tidak banyak, solusinya hapus data yang ada outlier-nya. Tetapi kalau banyak yang terjangkit outliernya, solusinya transformasikan data ke dalam fungsi persamaan log menggunakan software eviews. Kita deteksi outlier-nya terlebih dahulu melalui microsoft excel.

Langkah 1 : Buka lembar kerja Microsoft Excel.

Gambar :Pengolah Data Eviews 9

Langkah 2 : Copy-kan data yang akan kita deteksi outlier-nya. 

Gambar :Pengolah Data Eviews 9

Langkah 3 : Buat tabel untuk menentukan outlier seperti gambar dibawah ini. Isikan rumus di excel (example) : Mean : =AVERAGE(E5:E25). Standar Deviasi : =STDEV.S(D2:D36). Standardize : =STANDARDIZE(D2;$I$3;$J$3). Absolute Standardize : =ABS(D2). Outlier : =IF(J7>3;"*";""). Setelah kita masukan rumus tersebut ke masing-masing kolom, maka hasilnya sebagai berikut :

Gambar :Pengolah Data Eviews 9

Langkah 4 : Karena hasilnya menunjukkan ketiga variabel kecuali kriminalitas terjangkit masalah outlier. Solusinya : buat persamaan log untuk semua variabel (walaupun variabel tersebut tidak terjangkit outlier (ex. variabel kriminalitas). Caranya kita kembali lagi ke Proc=>Specify Estimate. 

Gambar :Pengolah Data Eviews 9

Langkah 5 : Buatlah persamaan log menjadi : log(kriminalitas) c log(kemiskinan) log(pengangguran) log(penduduk). Klik ok.

Gambar :Pengolah Data Eviews 9

Langkah 6 : hasil regresi akan berubah.

Gambar :Pengolah Data Eviews 9

Langkah 7 : Langkah selanjutnya kita menuju ke View => Residual Diagnostics dan pilih Histogram - Normality Test. Klik ok.

Gambar :Pengolah Data Eviews 9

Langkah 8 : Hasilnya sebagai berikut.

Gambar :Pengolah Data Eviews 9

Interpretasi output :

Hipotesa :

H1        : Data tidak berdistribusi normal

H0        : Data berdistribusi normal

Persyaratan Normalitas :

Jika nilai probability < 0.05, maka data tidak berdistribusi normal.

Jika nilai probability > 0.05, maka data berdistribusi normal.

Hasil uji normalitas residual di atas adalah: nilai jarque bera sebesar 4.345848 dengan p value sebesar 0.113844 dimana > 0.05 sehingga terima H0 atau yang berarti residual berdistribusi normal.

Perlu diingat bahwa untuk melakukan persamaan log di eviews ada dua syarat yang harus kita penuhi :

Syarat 1 : Data yang kita pergunakan harus berbeda satuan.

Syarat 2 : Data yang sama satuannya boleh di lakukan persamaan log jika mayoritas terdeteksi adanya outlier.

Informasi ekonometrika secara lengkap, silakan kunjungi channel youtube saya di : Dimas Channel

Note : Silakan bagi teman-teman yang ingin meng-copy artikel ini. Mohon sertakan sumber aslinya.Terima Kasih :-)

Bagaimana cara mengatasi data tidak berdistribusi normal?

Cara Mengatasi Data Berdistribusi Tidak Normal.
Klik analyze – descriptive statistics – explore..
Masukkan variabel IQ dan prestasi ke dependent list..
Klik plots, lalu centang histogram dan normality plots with tests..
Klik continue lalu OK..

Apa yang terjadi jika pada uji normalitas data tidak berdistribusi normal?

Data berdistribusi normal merupakan salah satu syarat yang harus dipenuhi dalam analisis parametrik. Dampak dari data yang tidak berdistribusi normal menyebabkan varians data menjadi tidak homogen. Sehingga bila data tidak berdistribusi normal maka perlu diperbaiki atau diobati supaya normal.

Apa yang harus dilakukan peneliti bila setelah dilakukan uji normality datanya tetap tidak berdistribusi normal?

Jika setelah dilakukan pengujian normalitas diketahui bahwa data yang kita gunakan tidak berdistribusi normal, maka kita bisa menggunakan metode analisis lain, yaitu Analisis Statistik Nonparametrik.

Kapan sebuah data dikatakan berdistribusi normal dan tidak normal?

Jika menggunakan uji statistik, misalnya menggunakan uji kolmogorov smirnov, variabel dikatakan berdistribusi normal jika nilai signifikansinya lebih dari atau sama dengan 0,05. Sebaliknya jika signifikansi kurang dari 0,05 maka variabel atau data dinyatakan tidak berdistribusi normal.

Postingan terbaru

LIHAT SEMUA