Uji Asumsi Dasar: Normalitas & Homogenitas.
Sebelum melakukan analisis statistik parametrik (seperti Uji-T atau ANOVA), data harus memenuhi asumsi dasar. Modul ini akan membahas cara menguji apakah data berdistribusi normal dan memiliki varians yang homogen.
Fokus
Pembelajaran
-
Konsep Normalitas
Memahami bentuk distribusi Gaussian dan interpretasi p-value uji normalitas.
-
Konsep Homogenitas
Mengevaluasi kesamaan varians antar dua atau lebih kelompok sampel (Equality of Variance).
-
Pohon Keputusan Uji
Menentukan langkah analitik selanjutnya (Parametrik vs Non-Parametrik).
Asumsi Statistik Parametrik
Penggunaan uji statistik parametrik mensyaratkan pemenuhan asumsi tertentu, terutama normalitas distribusi data dan homogenitas varians. Pelanggaran terhadap asumsi ini dapat memengaruhi validitas kesimpulan dari analisis yang dilakukan.
Uji Normalitas
Menguji apakah sampel yang diambil berasal dari populasi yang berdistribusi normal (seperti kurva lonceng/Gaussian yang simetris, dimana nilai Mean, Median, dan Modus cenderung berhimpit pada satu titik).
- Shapiro-Wilk: Paling sensitif dan direkomendasikan untuk ukuran sampel kecil (n < 50).
- Kolmogorov-Smirnov (K-S): Lebih cocok untuk pengujian sampel besar (n ≥ 50), utamanya dengan penyesuaian/koreksi Lilliefors.
Normalitas kerap dipantau melalui Q-Q Plot (distribusi titik observasi harus menempel mengikuti garis diagonal ideal) dan bentuk bel pada Histogram.
Interpretasi P-Value (H0: Data Normal):
Uji Homogenitas
Menguji asumsi matematis yang disebut Homoskedastisitas, yakni mendeteksi apakah keragaman (varians) sebaran data pada dua kelompok atau lebih bernilai sepadan/setara (Equality of Variance).
- Levene's Test: Teknik paling umum dan populer. Sangat robust (kebal) terhadap penyimpangan kecil dari distribusi kurva normal.
- Bartlett's Test: Akurasi sangat tinggi, namun kelemahannya ia sangat rentan jika asumsi data tidak berdistribusi normal murni.
Jika tetap dilakukan Uji T Parametrik ketika varians ternyata Heterogen, probabilitas Type I Error (menemukan perbedaan padahal kenyataannya tidak ada) akan melonjak tajam.
Interpretasi P-Value (H0: Varians Setara):
Perangkat Lunak Statistik Populer
IBM SPSS
Perangkat lunak statistik yang umum digunakan di institusi riset dan pendidikan. Menyediakan antarmuka berbasis menu (GUI) yang memudahkan pengguna.
Jamovi / JASP
Alternatif perangkat lunak analitik berbasis open-source yang didukung oleh bahasa pemrograman R. Memiliki tampilan yang modern dan responsif.
[ x ] Normality test (Shapiro-Wilk)
[ x ] Equality of variances (Levene's)
R & Python
Bahasa pemrograman yang menawarkan fleksibilitas tinggi bagi analis data dalam mengolah, memvisualisasikan, dan menguji himpunan data.
shapiro_test = scipy.stats.shapiro(data)
levene_test = scipy.stats.levene(grp1, grp2)
Contoh Syntax R:
shapiro.test(dataset$variabel)
car::leveneTest(y ~ group, data)
Alur Pemilihan Uji Statistik
Uji Statistik Parametrik
Digunakan apabila data memenuhi asumsi Normalitas dan Homogenitas (umumnya ditandai dengan nilai p-value > 0.05). Pendekatan ini memiliki kekuatan statistik (statistical power) yang optimal untuk menguji hipotesis.
Uji Statistik Non-Parametrik
Merupakan alternatif apabila data tidak berdistribusi normal. Pendekatan ini umumnya menggunakan sistem peringkat (ranking) data. Jika hanya asumsi homogenitas yang tidak terpenuhi, dapat menggunakan uji parametrik yang dimodifikasi (misalnya Welch's T-Test).
Studi Kasus:
Penentuan Uji Statistik
Pemahaman praktis tentang bagaimana hasil nilai p-value dari pengujian asumsi memengaruhi pemilihan jenis uji statistik lanjutan.
Skenario Penelitian: Perbandingan Obat Antihipertensi
Seorang peneliti melakukan eksperimen untuk membandingkan efektivitas dua obat hipertensi (Obat Captopril dan Obat Amlodipine) dalam menurunkan tekanan darah sistolik. Sampel melibatkan 60 pasien (30 pasien pada masing-masing kelompok independen).
Berdasarkan nilai signifikansi (p-value) dari uji prasyarat berikut, tentukan uji statistik yang paling tepat.
Skenario Asumsi Terpenuhi
Kedua asumsi memiliki p-value > 0.05. Hal ini menunjukkan bahwa distribusi data tekanan darah bersifat normal dan varians antar kedua kelompok pasien adalah setara.
Penggunaan uji ini valid. Pada hasil luaran perangkat lunak (seperti SPSS), peneliti dapat menginterpretasikan nilai signifikansi pada baris "Equal variances assumed".
Skenario Varians Heterogen
Asumsi normalitas terpenuhi (p > 0.05), namun homogenitas varians tidak terpenuhi (p < 0.05). Variasi respons penurunan tekanan darah berbeda secara signifikan antara kedua kelompok.
Merupakan uji parametrik dengan penyesuaian Derajat Kebebasan (Degree of Freedom). Pada luaran analisis, peneliti melihat pada baris "Equal variances NOT assumed".
Skenario Data Tidak Normal
Asumsi normalitas tidak terpenuhi (p < 0.05). Terdapat kemungkinan distribusi data tidak simetris atau adanya sampel dengan nilai tekanan darah ekstrem (outlier).
Menggunakan uji statistik non-parametrik. Metode ini menganalisis berdasarkan peringkat data (Mean Ranks) sehingga lebih kebal terhadap pengaruh nilai observasi yang ekstrem.
Lab Virtual: Evaluasi Asumsi
Pilih skenario atau masukkan data kelompok secara manual. Sistem akan memberikan estimasi mengenai Normalitas (berdasarkan nilai Skewness dan bentuk kurva) serta Homogenitas (berdasarkan rasio varians).
*Catatan: Lab ini menyederhanakan perhitungan p-value untuk keperluan demonstrasi visual.
Asumsi Normalitas
Data mendekati normal jika nilai Skewness berada di rentang -1.0 hingga +1.0.
Asumsi Homogenitas
Visualisasi Inspeksi Normalitas (Kelompok A)
Evaluasi Pemahaman
Uji pengetahuan Anda mengenai syarat dan prasyarat uji parametrik.