A Indonesia
Perbandingan Kinerja Klasifikasi Data Mining untuk Diagnosis Diabetes
Keywords:
Data Mining, Klasifikasi, Random Forest, Decision Tree, Prediksi Diabetes, SMOTEAbstract
Sebagai penyakit metabolik yang bersifat kronis, Diabetes Melitus memerlukan upaya deteksi sejak dini untuk menekan kemungkinan terjadinya komplikasi. Mengingat proses diagnosis manual masih menghadapi keterbatasan waktu dan biaya, penelitian ini dilakukan untuk mengembangkan model prediksi berbasis data dengan memanfaatkan Diabetes Health Indicators Dataset. Fokus utama penelitian ini adalah membandingkan kinerja dua algoritma Machine Learning, yaitu Random Forest dan Decision Tree. Pendekatan klasifikasi diterapkan melalui tahapan pra-pemrosesan data yang sistematis untuk mencegah terjadinya kebocoran informasi (data leakage). Tahapan tersebut meliputi standarisasi fitur, pengkodean variabel, serta penanganan ketidakseimbangan kelas menggunakan metode SMOTE pada data pelatihan. Model dikembangkan dengan skema pembagian data sebesar 80:20 dan dievaluasi menggunakan metrik Akurasi, Presisi, Recall dan F1-Score. Hasil eksperimen menunjukkan bahwa kedua algoritma memiliki performa yang relatif sebanding. Random Forest menunjukkan keunggulan tipis dengan nilai Akurasi sebesar 91,98% dan F1-Score sebesar 92,84%. Nilai tersebut sedikit lebih tinggi dibandingkan Decision Tree yang memperoleh Akurasi 91,84% dan F1-Score 92, 74%. Analisis fitur lebih lanjut menunjukkan bahwa HbA1c dan kadar glukosa darah merupakan variabel yang paling dominan dalam proses prediksi. Dengan demikian, dapat disimpulkan bahwa meskipun kedua algoritma menunjukkan kinerja yang reliabel, Random Forest menawarkan stabilitas prediksi yang lebih baik pada kasus ini.
Downloads
References
N. L. Desmita, S. Lonang, and D. T. Kumoro, “COMPARATIVE ANALYSIS OF DECISION TREE AND RANDOM FOREST ALGORITHMS FOR PREDICTING DIABETES MELLITUS,” 2025.
P. Bintoro, Ratnasari, E. Wiharjo, I. P. Putri, and A. Asari, Pengantar Machine Learning, 1st ed. Mafy Media Literasi Indonesia, 2024.
A. F. Fadhlullah and T. Widiyaningtyas, “Comparative Analysis of Decision Tree and Random Forest Algorithms for Diabetes Prediction,” JTAM (Jurnal Teori dan Aplikasi Matematika), vol. 8, no. 4, p. 1121, Oct. 2024, doi: 10.31764/jtam.v8i4.24388.
H. Esmaily, M. Tayefi, H. Doosti, M. Ghayour-Mobarhan, H. Nezami, and A. Amirabadizadeh, “A Comparison between Decision Tree and Random Forest in Determining the Risk Factors Associated with Type 2 Diabetes,” 2018.
B. Siswoyo and M. Iqbal Nurhafidz, “Penerapan Algoritma Random Forest Untuk Prediksi Risiko Diabetes Berdasarkan Data Kesehatan Pasien,” Jurnal Teknologi Informasi Digital (JTID), vol. 1, no. 1, 2025, Accessed: Nov. 01, 2025. [Online]. Available: https://jurnal.ipdig.id/index.php/jtid
A. Wantoro, Zulkifli, A. F. Yulia, Y. A. Dwi, and S. Mustofa, “EVALUASI KINERJA ALGORITMA MACHINE LEARNING (ML) MENGGUNAKAN SELEKSI FITUR PADA KLASIFIKASI DIABETES,” JIP (Jurnal Informatika Polinema), vol. 11, 2025.
M. C. Ibrahim, Fachruddin, and Nurhadi, “Comparison of Diabetes Prediction Data Using Machine Learning Perbandingan Data Prediksi Diabetes Menggunakan Machine Learning,” MALCOM: Indonesian Journal of Machine Learning and Computer Science, vol. 5, pp. 1423–1436, 2025, doi: 10.57152/malcom.v5i4.2301.
A. Ekrinifda, S. A. Ramadhan, S. Marvella, and M. Fansyuri, “Analisis Perbandingan Algoritma Random Forest Dan Decision Tree Pada Prediksi Penyakit Diabetes,” JRIIN : Jurnal Riset Informatika dan Inovasi, 2025.
A. Setiawan, Z. H. Nst, Z. Khairi, Rahmaddeni, and L. Efrizoni, “KLASIFIKASI TINGKAT RISIKO DIABETES MENGGUNAKAN ALGORITMA RANDOM FOREST,” JIRE (Jurnal Informatika & Rekayasa Elektronika), vol. 7, no. 2, 2024, [Online]. Available: http://e-journal.stmiklombok.ac.id/index.php/jireISSN.2620-6900
Mohan Krishna Thalla, “Diabetes Health Indicators Dataset,” Kaggle. Accessed: Oct. 10, 2025. [Online]. Available: https://www.kaggle.com/datasets/mohankrishnathalla/diabetes-health-indicators-dataset
M. Salsabil, N. L. Azizah, and A. Eviyanti, “Implementasi Data Mining Dalam Melakukan Prediksi Penyakit Diabetes Menggunakan Metode Random Forest Dan Xgboost,” Jurnal Ilmiah Komputasi, vol. 23, no. 1, Mar. 2024, doi: 10.32409/jikstik.23.1.3507.
A. A. Abu-Shareha, H. Qutaishat, and A. Al-Khayat, “A Framework for Diabetes Detection Using Machine Learning and Data Preprocessing,” Journal of Applied Data Sciences, vol. 5, no. 4, pp. 1654–1667, Dec. 2024, doi: 10.47738/jads.v5i4.363.
B. N. Azmi, A. Hermawan, and D. Avianto, “Analisis Pengaruh Komposisi Data Training dan Data Testing pada Penggunaan PCA dan Algoritma Decision Tree untuk Klasifikasi Penderita Penyakit Liver,” JTIM : Jurnal Teknologi Informasi dan Multimedia, vol. 4, no. 4, pp. 281–290, Feb. 2023, doi: 10.35746/jtim.v4i4.298.
E. R. Susanto, M. R. Inzaghi, Amarudin, and Neneng, “Evaluasi Kinerja Model Random Forest Dalam Memprediksi Diabetes Berdasarkan Dataset Kesehatan di Indonesia,” Jurnal Pendidikan dan Teknologi Indonesia, vol. 5, no. 7, pp. 1857–1866, Jul. 2025, doi: 10.52436/1.jpti.871.
D. Ismafillah, T. Rohana, and Y. Cahyana, “Analisis algoritma pohon keputusan untuk memprediksi penyakit diabetes menggunakan oversampling smote,” INFOTECH : Jurnal Informatika & Teknologi, vol. 4, no. 1, pp. 27–36, Jun. 2023, doi: 10.37373/infotech.v4i1.452.
D. R. Damayanti and A. Purwinarko, “Application of C4.5 Algorithm Using Synthetic Minority Oversampling Technique (SMOTE) and Particle Swarm Optimization (PSO) for Diabetes Prediction,” Recursive Journal of Informatics, vol. 2, no. 1, pp. 18–27, Mar. 2024, doi: 10.15294/rji.v2i1.64928.
Y. N. Aini, A. Faqih, and G. Dwilestari, “Penerapan Metode Decision Tree dalam Penentuan Jurusan Siswa,” Jurnal Ilmiah Informatika (JIF), vol. 13 No 1, Mar. 2025.
S. Danil, N. Rahaningsih, R. D. Dana, and . M., “PENINGKATAN KLASIFIKASI KEMISKINAN INDONESIA MENGGUNAKAN METODE DECISION TREE,” Jurnal Informatika dan Teknik Elektro Terapan (JITET), vol. 13, no. 2, Apr. 2025, doi: 10.23960/jitet.v13i2.6336.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2026 Salma Pudjiati, Andhika Nur Fachmi, Reihan Dwi Patria, Ferdinan Restu Ramadhan, Anisa Permata Sari

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Similar Articles
- Wahyu Hafizh Hilhamd Fatiha, Kurniawan D Irianto, Perancangan Dan Penerapan Database Terpusat Berbasis Online Pada Sistem Informasi Pengelolaan Data Desa , Jurnal Media Informatika: Vol. 7 No. 1 (2026): Edisi Januari - Februari IN PROGRESS
You may also start an advanced similarity search for this article.
Salma Pudjiati,
Universitas Bina Sarana Informatika,
Indonesia 







