Alur Analisis Statistik
EDA mencegah pemilihan uji yang salah. Banyak kesalahan publikasi terjadi karena uji parametrik dipakai meski asumsi normalitas/homogenitas dilanggar.
- Eksploratori (EDA) — ringkasan, distribusi, outlier, missing.
- Cek asumsi — normalitas, homogenitas, independensi, skala.
- Pilih uji — parametrik bila asumsi terpenuhi; non-parametrik bila tidak.
- Eksekusi & laporkan — statistik uji, p-value, effect size, CI 95%.
- Interpretasi & kesimpulan.
Parametrik vs Non-Parametrik
Non-parametrik: ordinal, distribusi miring, outlier ekstrem, atau n kecil.
| Kriteria | Parametrik | Non-Parametrik |
|---|---|---|
| Skala | Interval/Rasio | Nominal/Ordinal/Rasio |
| Distribusi | Normal | Bebas |
| Varians | Homogen | Tidak disyaratkan |
| Sampel | ≥30 / normal | Kecil / outlier |
| Power | Tinggi | Lebih rendah |
Jenis Data: Definisi, Contoh, dan Uji
| Jenis Data | Penjelasan Singkat | Contoh Penelitian | Uji yang Umum |
|---|---|---|---|
| Nominal (biner/multikategori) | Kategori tanpa urutan; hanya beda jenis. | Status vaksin (ya/tidak), jenis kelamin, kelas terapi (A/B/C). | Chi-square, Fisher exact, regresi logistik biner/multinomial. |
| Ordinal | Kategori berurutan, tetapi jarak antarkategori tidak pasti sama. | Skala nyeri ringan-sedang-berat, stadium I-IV, item Likert 1-5. | Mann-Whitney, Wilcoxon, Kruskal-Wallis, Spearman, regresi ordinal. |
| Interval | Data numerik dengan jarak sama, tanpa nol absolut. | Suhu tubuh Celsius, skor psikometrik terstandar tertentu. | t-test/ANOVA (jika asumsi terpenuhi), korelasi Pearson. |
| Rasio | Data numerik dengan jarak sama dan nol absolut. | Usia, berat badan, kadar glukosa, lama rawat inap. | t-test, ANOVA, regresi linier; bila tidak normal gunakan versi non-parametrik. |
| Count (jumlah kejadian) | Bilangan cacah 0,1,2,... sering berdistribusi Poisson/overdispersi. | Jumlah kunjungan IGD, jumlah episode eksaserbasi per tahun. | Regresi Poisson/Negative Binomial; uji rate ratio. |
| Time-to-event (survival) | Waktu sampai kejadian; dapat tersensor (censored). | Waktu kekambuhan, waktu kematian, waktu gagal terapi. | Kaplan-Meier + log-rank, regresi Cox proportional hazards. |
Contoh Data Kuesioner (Penelitian Populer)
| Tipe Data Kuesioner | Contoh Instrumen | Cara Perlakuan Data | Uji yang Disarankan |
|---|---|---|---|
| Item Likert tunggal (1-5/1-7) | Kepuasan layanan 1 pertanyaan, nyeri skala verbal. | Umumnya diperlakukan sebagai ordinal. | Mann-Whitney, Wilcoxon, Kruskal-Wallis, Spearman. |
| Skor total multi-item | SUS, PHQ-9, GAD-7, PSS-10, SF-36 (domain/total). | Sering diperlakukan mendekati interval jika item cukup banyak dan reliabel. | t-test/ANOVA/Pearson jika asumsi terpenuhi; alternatif non-parametrik bila tidak. |
| Kategori hasil kuesioner | PHQ-9: minimal/ringan/sedang/berat. | Dikategorikan menjadi ordinal atau biner (mis. depresi ya/tidak). | Chi-square/Fisher (biner), regresi ordinal/logistik sesuai outcome. |
Tips praktis: tentukan dulu apakah yang dianalisis adalah item per pertanyaan (ordinal) atau skor total instrumen (sering diperlakukan numerik). Sertakan alasan metodologisnya di bagian metode penelitian.
Kesalahan Umum Data Kuesioner
| Kesalahan yang Sering Terjadi | Mengapa Keliru | Perbaikan yang Disarankan |
|---|---|---|
| Memperlakukan 1 item Likert sebagai data interval tanpa pertimbangan. | Item tunggal umumnya ordinal, jarak antar skor belum tentu setara. | Gunakan uji ordinal (Mann-Whitney/Wilcoxon/Kruskal-Wallis) atau jelaskan alasan jika memakai pendekatan parametrik. |
| Menggabungkan skor total tanpa cek reliabilitas instrumen. | Skor total kurang bermakna bila konsistensi internal rendah. | Laporkan reliabilitas (mis. Cronbach alpha/omega), lalu pilih uji sesuai distribusi skor total. |
| Hanya melaporkan p-value tanpa effect size dan CI 95%. | Signifikansi statistik tidak selalu berarti signifikansi klinis/praktis. | Tambahkan effect size (r, d, OR/HR) dan CI 95% untuk interpretasi yang lebih kuat. |
| Memaksakan uji parametrik padahal data sangat skewed/outlier ekstrem. | Asumsi uji dapat dilanggar sehingga kesimpulan bias. | Cek normalitas/outlier, pertimbangkan transformasi atau uji non-parametrik. |
Checklist cepat: tentukan unit analisis (item vs skor total), cek distribusi dan reliabilitas, lalu pilih uji yang sejalan dengan tujuan penelitian.
Cheat-Sheet Cepat
| Tujuan | Parametrik | Non-Parametrik | Aksi Simulasi |
|---|---|---|---|
| 1 sampel vs nilai | One-sample t | Wilcoxon 1-sampel | |
| 2 grup independen | Independent t | Mann-Whitney U | |
| 2 grup berpasangan | Paired t | Wilcoxon signed-rank | |
| ≥3 independen | One-way ANOVA | Kruskal-Wallis | |
| ≥3 berpasangan | RM-ANOVA | Friedman | |
| Korelasi | Pearson | Spearman / Kendall | |
| Asosiasi kategorik | — | Chi-square, Fisher | |
| Prediksi numerik | Regresi linier | Regresi kuantil | |
| Prediksi biner | Regresi logistik | — | |
| Survival | Cox PH | KM + Log-rank |
Univariat • Bivariat • Multivariat
Bivariat: 2 variabel.
Multivariat: ≥3 variabel atau ≥2 outcome.
- UNI Frekuensi, mean, histogram, one-sample t, χ² goodness-of-fit
- BI t-test, ANOVA, χ², korelasi, regresi sederhana
- MULTI Regresi berganda, MANOVA, ANCOVA, Cox, PCA, faktor, cluster
EDA
1. Statistik Deskriptif
- Numerik: mean, median, SD, IQR, skewness, kurtosis
- Kategorik: frekuensi, proporsi, modus
2. Visualisasi
- Histogram / density plot
- Boxplot — outlier
- Scatter — hubungan 2 variabel
- Q-Q plot — normalitas visual
3. Cek Asumsi
- Normalitas: Shapiro-Wilk, K-S
- Homogenitas: Levene, Bartlett
- Independensi: Durbin-Watson
- Multikolinearitas: VIF>10
4. Penanganan
- Missing: imputasi (mean/median/MICE)
- Outlier: winsorize, log-transform
- Non-normal: transformasi / non-parametrik
Demo EDA Interaktif
Pilih contoh data lalu klik Analisis. Sistem menampilkan ringkasan + 3 visualisasi untuk membantu membaca pola data.
🧭 Diagram Algoritma — Pemilihan Uji Statistik
📚 Katalog Uji + 2 Contoh Kasus per Uji
Klik judul untuk membuka detail, kasus data, dan cara pembacaan.
🛠 Tools / Software Analisis
📊 SPSS
GUI paling umum untuk riset klinis dan skripsi kesehatan.
BerbayarGUI
- Kapan dipakai: saat butuh analisis cepat tanpa coding (t-test, ANOVA, Chi-square, regresi).
- Kelebihan: menu terstruktur, output tabel siap dilaporkan.
- Catatan: dokumentasikan langkah menu agar analisis mudah direplikasi.
📈 Stata
Kuat untuk epidemiologi, panel data, dan workflow berbasis do-file.
Berbayar
- Kapan dipakai: kohort/kasus-kontrol, survival, regresi multivariat.
- Kelebihan: sintaks ringkas, manajemen data kuat, output konsisten.
- Catatan: simpan do-file untuk audit analisis dan reproducibility.
🧮 R
Ekosistem statistik paling lengkap untuk analisis dan visualisasi publikasi.
Gratis
- Kapan dipakai: analisis lanjutan, model kompleks, custom report otomatis.
- Kelebihan: paket sangat banyak (stats, car, survival, ggplot2).
- Catatan: ideal dipadukan dengan R Markdown/Quarto untuk laporan akhir.
🐍 Python
Fleksibel untuk analitik end-to-end: pembersihan data, statistik, sampai ML.
Gratis
- Kapan dipakai: dataset besar, pipeline otomatis, integrasi dashboard/aplikasi.
- Kelebihan: kombinasi SciPy, statsmodels, pandas, lifelines.
- Catatan: pastikan validasi statistik tetap setara referensi R/SPSS.
🟢 JASP / Jamovi
GUI gratis berbasis R, cocok untuk belajar statistik inferensial.
Gratis
- Kapan dipakai: praktikum, kelas metodologi, analisis cepat tanpa coding.
- Kelebihan: antarmuka sederhana, beberapa output Bayesian tersedia.
- Catatan: bagus sebagai jembatan sebelum masuk R/Python.
📋 Excel
Tool cepat untuk input data, ringkasan awal, dan grafik dasar.
Umum
- Kapan dipakai: cleaning awal, tabulasi sederhana, cek konsistensi data.
- Kelebihan: mudah dipakai hampir semua pengguna.
- Catatan: hindari analisis inferensial kompleks sebagai tool utama.
🧬 GraphPad Prism
Sangat populer di biomedis untuk grafik ilmiah dan analisis lab.
Berbayar
- Kapan dipakai: eksperimen biologis/farmakologi dengan fokus visualisasi.
- Kelebihan: kurva dosis-respons, graph publication-ready cepat.
- Catatan: cocok untuk manuskrip yang butuh figure berkualitas tinggi.
🩺 MedCalc
Spesifik medis: akurasi diagnostik, ROC, agreement, survival.
Berbayar
- Kapan dipakai: studi diagnostik, evaluasi biomarker, analisis klinis.
- Kelebihan: fitur klinis siap pakai (sensitivitas, spesifisitas, AUC).
- Catatan: kuat untuk laporan klinik yang fokus interpretasi medis.
📐 Minitab
Andalan quality improvement, Six Sigma, dan design of experiments.
Berbayar
- Kapan dipakai: perbaikan proses, kontrol kualitas, analisis industri kesehatan.
- Kelebihan: DOE, control chart, capability analysis kuat.
- Catatan: lebih cocok untuk konteks mutu proses daripada riset klinis murni.
Sintaks Singkat per Tools
Independent t-test
R: t.test(y ~ group, data=df, var.equal=TRUE) Python: from scipy import stats; stats.ttest_ind(g1, g2) SPSS: Analyze → Compare Means → Independent-Samples T Test Stata: ttest y, by(group)
Mann-Whitney U
R: wilcox.test(y ~ group, data=df) Python: stats.mannwhitneyu(g1, g2) SPSS: Analyze → Nonparametric → 2 Independent Samples Stata: ranksum y, by(group)
One-way ANOVA + post-hoc
R: m=aov(y~group,data=df); summary(m); TukeyHSD(m) Python: stats.f_oneway(a,b,c); pingouin.pairwise_tukey(...) SPSS: Compare Means → One-Way ANOVA → Post Hoc: Tukey Stata: oneway y group, bonferroni
Chi-square / Fisher
R: chisq.test(table(x,y)); fisher.test(table(x,y)) Python: stats.chi2_contingency(); stats.fisher_exact() SPSS: Crosstabs → Statistics → Chi-square / Exact Stata: tabulate x y, chi2 exact
Regresi Linier / Logistik / Cox
R linier: lm(y~x1+x2, data=df) |> summary() R logistik: glm(y~x1+x2, family=binomial, data=df) R Cox: library(survival); coxph(Surv(time,event)~x, data=df) Python: sm.OLS / sm.Logit / lifelines.CoxPHFitter SPSS: Regression → Linear / Binary Logistic / Cox
MANOVA / Faktor / PCA
R MANOVA: m=manova(cbind(y1,y2)~grp); summary(m,test="Wilks") R PCA: prcomp(X, scale.=TRUE) Python: from sklearn.decomposition import PCA SPSS: GLM → Multivariate; Data Reduction → Factor
🧮 Kalkulator Mini Uji Statistik
📈 Visualisasi Simulasi
📁 Dataset Cepat ke Kalkulator
Tombol "Gunakan" otomatis mengisi kalkulator.