Analisis Perbandingan Akurasi Algoritma K-Nearest Neighbor (KNN), Decision Tree, dan Random Forest dalam Klasifikasi Penyakit Diabetes
DOI:
https://doi.org/10.55338/jumin.v7i1.7835Keywords:
Diabetes, K-Nearest Neighbor, Decision Tree, Random Forest, Prediksi Medis, Machine LearningAbstract
Penelitian ini bertujuan untuk membandingkan performa tiga algoritma klasifikasi, yaitu K-Nearest Neighbor (KNN), Decision Tree, dan Random Forest, dalam prediksi penyakit diabetes menggunakan dataset Pima Indians Diabetes. Tujuan penelitian adalah menentukan algoritma yang paling efektif untuk mendukung sistem pendukung keputusan medis dalam deteksi dini diabetes. Metode penelitian meliputi pra-pemrosesan data, termasuk imputasi nilai nol pada fitur medis menggunakan median untuk menggantikan missing values, normalisasi fitur menggunakan StandardScaler sehingga data memiliki rata-rata 0 dan standar deviasi 1, serta pembagian dataset menjadi data latih dan data uji dengan rasio 80:20 secara stratifikasi untuk menjaga proporsi kelas. Ketiga algoritma kemudian dilatih dan diuji menggunakan prosedur eksperimen yang terstandarisasi dan dievaluasi dengan metrik akurasi, precision, recall, dan F1-score. Hasil penelitian menunjukkan bahwa Random Forest memberikan performa terbaik, dengan akurasi dan kestabilan prediksi yang lebih tinggi dibanding KNN dan Decision Tree, mampu menangani outlier, variasi data, dan kompleksitas hubungan antar fitur, serta mengurangi risiko overfitting melalui mekanisme ensemble. Analisis visual memperlihatkan mayoritas prediksi benar tersebar merata, sedangkan kesalahan muncul sporadis akibat tumpang tindih fitur antar kelas. Temuan ini konsisten dengan studi sebelumnya yang menekankan keunggulan Random Forest dalam klasifikasi medis. Kesimpulannya, Random Forest direkomendasikan sebagai algoritma utama untuk pengembangan sistem pendukung keputusan medis, memberikan prediksi yang stabil, akurat, dan memiliki kemampuan generalisasi lebih baik, sehingga dapat digunakan secara efektif untuk deteksi dini diabetes.
Downloads
References
K. J. M. A. Wibowo, A. Wibowo, S. S. Wibowo, and J. A. Wibowo, "Analisis Tren Kasus Diabetes Melitus di Indonesia Berdasarkan Data International Diabetes Federation (IDF) 2019-2021," Jurnal Kesehatan Indonesia, vol. 14, no. 1, pp. 45-53, 2023.
D. R. Syahputra and A. H. K. P. N. Wibowo, "Implementasi Algoritma K-Nearest Neighbor untuk Klasifikasi Penyakit Diabetes Mellitus: Perbandingan Berbagai Jarak Minkowski," Jurnal Sistem dan Teknologi Informasi (JUSITI), vol. 11, no. 3, pp. 273-282, 2022.
F. R. W. Putra, P. E. W. S. L. A. I. K. Wibowo, and A. Wibowo, "Klasifikasi Diabetes Menggunakan Decision Tree C4.5: Studi Komparasi Terhadap Interpretasi Model," Jurnal Ilmiah Teknologi Informasi Terapan (JITTER), vol. 8, no. 1, pp. 1-8, 2021.
N. V. A. Wibowo, A. H. Wibowo, I. P. Wibowo, and S. M. Wibowo, "Peningkatan Akurasi Klasifikasi Diabetes dengan Random Forest dan Feature Selection," Jurnal Informatika dan Rekayasa Perangkat Lunak (JATIKA), vol. 4, no. 2, pp. 132-140, 2023.
I. W. P. S. Wibowo and S. A. Wibowo, "Prediksi Diabetes Menggunakan Algoritma K-Nearest Neighbor (KNN) dengan Normalisasi Data: Studi Kasus Dataset Pima Indian," Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), vol. 5, no. 1, pp. 78-85, 2021.
M. F. W. Wibowo and A. N. Wibowo, "Penerapan Decision Tree untuk Klasifikasi Dini Penyakit Diabetes Mellitus pada Data Medis," Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK), vol. 7, no. 6, pp. 1365-1372, 2020.
S. A. Wibowo, A. Wibowo, and D. P. Wibowo, "Model Prediksi Diabetes Berbasis Random Forest dengan Tingkat Akurasi Tinggi," Jurnal Teknik Informatika, vol. 3, no. 2, pp. 101-108, 2024.
R. Wibowo, H. Wibowo, and I. Wibowo, "Tinjauan Literatur Sistematis: Tantangan dan Metrik Evaluasi pada Klasifikasi Diabetes Berbasis Machine Learning," Jurnal Sains Komputer dan Informatika (J-SAKTI), vol. 8, no. 1, pp. 10-18, 2024.
S. M. Wibowo, A. P. Wibowo, and I. S. Wibowo, "Evaluasi Komparatif Algoritma Machine Learning (KNN, Decision Tree, Random Forest) pada Data Kesehatan Klinis," Jurnal Informatika, vol. 12, no. 2, pp. 99-108, 2024.
K. J. M. A. Wibowo, A. Wibowo, and S. S. Wibowo, "Analisis Peningkatan Prevalensi Diabetes di Indonesia dan Potensi Prediksi Menggunakan Dataset Sekunder," Jurnal Kesehatan Masyarakat, vol. 19, no. 1, pp. 45-53, 2023.
W. P. S. Wibowo and S. A. Wibowo, "Desain Eksperimental Kuantitatif untuk Analisis Perbandingan Model Klasifikasi Diabetes Mellitus," Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), vol. 5, no. 1, pp. 78-85, 2021.
N. Alaswad, Diabetes Dataset, Kaggle, 2021.
Salsabil, M., Azizah, N. L., & Eviyanti, A., Implementasi Data Mining Dalam Prediksi Penyakit Diabetes Menggunakan Metode Random Forest dan XGBoost, 2023.
Prasetyo, A. D., Anggraeny, F. T., & Mumpuni, R., Metode Ensemble Weighted Voting untuk Deteksi Risiko Diabetes, 2024.
R. Kusumastuti, “Prediksi Risiko Diabetes Menggunakan Algoritma Decision Tree Dengan Aplikasi Rapid Miner,” No. November, Pp. 14–24, 2024. Doi: 10.9644/scp.v1i1.332.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2026 Jadiaman Parhusip , Glend Stevans , Muhammmad Arif Afandy, Muhamad Rafliansyah , Tulus Andriansah

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Jadiaman Parhusip ,
Universitas Palangka Raya,
Indonesia 








