A Indonesia

Perbandingan Kinerja Klasifikasi Data Mining untuk Diagnosis Diabetes

Authors

  • Salma Pudjiati, Universitas Bina Sarana Informatika,  Indonesia
  • Andhika Nur Fachmi, Universitas Bina Sarana Informatika,  Indonesia
  • Reihan Dwi Patria, Universitas Bina Sarana Informatika,  Indonesia
  • Ferdinan Restu Ramadhan, Universitas Bina Sarana Informatika,  Indonesia
  • Anisa Permata Sari, Universitas Bina Sarana Informatika,  Indonesia

Keywords:

Data Mining, Klasifikasi, Random Forest, Decision Tree, Prediksi Diabetes, SMOTE

Abstract

Sebagai penyakit metabolik yang bersifat kronis, Diabetes Melitus memerlukan upaya deteksi sejak dini untuk menekan kemungkinan terjadinya komplikasi. Mengingat proses diagnosis manual masih menghadapi keterbatasan waktu dan biaya, penelitian ini dilakukan untuk mengembangkan model prediksi berbasis data dengan memanfaatkan Diabetes Health Indicators Dataset. Fokus utama penelitian ini adalah membandingkan kinerja dua algoritma Machine Learning, yaitu Random Forest dan Decision Tree. Pendekatan klasifikasi diterapkan melalui tahapan pra-pemrosesan data yang sistematis untuk mencegah terjadinya kebocoran informasi (data leakage). Tahapan tersebut meliputi standarisasi fitur, pengkodean variabel, serta penanganan ketidakseimbangan kelas menggunakan metode SMOTE pada data pelatihan. Model dikembangkan dengan skema pembagian data sebesar 80:20 dan dievaluasi menggunakan metrik Akurasi, Presisi, Recall dan F1-Score. Hasil eksperimen menunjukkan bahwa kedua algoritma memiliki performa yang relatif sebanding. Random Forest menunjukkan keunggulan tipis dengan nilai Akurasi sebesar 91,98% dan F1-Score sebesar 92,84%. Nilai tersebut sedikit lebih tinggi dibandingkan Decision Tree yang memperoleh Akurasi 91,84% dan F1-Score 92, 74%. Analisis fitur lebih lanjut menunjukkan bahwa HbA1c dan kadar glukosa darah merupakan variabel yang paling dominan dalam proses prediksi. Dengan demikian, dapat disimpulkan bahwa meskipun kedua algoritma menunjukkan kinerja yang reliabel, Random Forest menawarkan stabilitas prediksi yang lebih baik pada kasus ini.

Downloads

Download data is not yet available.

References

N. L. Desmita, S. Lonang, and D. T. Kumoro, “COMPARATIVE ANALYSIS OF DECISION TREE AND RANDOM FOREST ALGORITHMS FOR PREDICTING DIABETES MELLITUS,” 2025.

P. Bintoro, Ratnasari, E. Wiharjo, I. P. Putri, and A. Asari, Pengantar Machine Learning, 1st ed. Mafy Media Literasi Indonesia, 2024.

A. F. Fadhlullah and T. Widiyaningtyas, “Comparative Analysis of Decision Tree and Random Forest Algorithms for Diabetes Prediction,” JTAM (Jurnal Teori dan Aplikasi Matematika), vol. 8, no. 4, p. 1121, Oct. 2024, doi: 10.31764/jtam.v8i4.24388.

H. Esmaily, M. Tayefi, H. Doosti, M. Ghayour-Mobarhan, H. Nezami, and A. Amirabadizadeh, “A Comparison between Decision Tree and Random Forest in Determining the Risk Factors Associated with Type 2 Diabetes,” 2018.

B. Siswoyo and M. Iqbal Nurhafidz, “Penerapan Algoritma Random Forest Untuk Prediksi Risiko Diabetes Berdasarkan Data Kesehatan Pasien,” Jurnal Teknologi Informasi Digital (JTID), vol. 1, no. 1, 2025, Accessed: Nov. 01, 2025. [Online]. Available: https://jurnal.ipdig.id/index.php/jtid

A. Wantoro, Zulkifli, A. F. Yulia, Y. A. Dwi, and S. Mustofa, “EVALUASI KINERJA ALGORITMA MACHINE LEARNING (ML) MENGGUNAKAN SELEKSI FITUR PADA KLASIFIKASI DIABETES,” JIP (Jurnal Informatika Polinema), vol. 11, 2025.

M. C. Ibrahim, Fachruddin, and Nurhadi, “Comparison of Diabetes Prediction Data Using Machine Learning Perbandingan Data Prediksi Diabetes Menggunakan Machine Learning,” MALCOM: Indonesian Journal of Machine Learning and Computer Science, vol. 5, pp. 1423–1436, 2025, doi: 10.57152/malcom.v5i4.2301.

A. Ekrinifda, S. A. Ramadhan, S. Marvella, and M. Fansyuri, “Analisis Perbandingan Algoritma Random Forest Dan Decision Tree Pada Prediksi Penyakit Diabetes,” JRIIN : Jurnal Riset Informatika dan Inovasi, 2025.

A. Setiawan, Z. H. Nst, Z. Khairi, Rahmaddeni, and L. Efrizoni, “KLASIFIKASI TINGKAT RISIKO DIABETES MENGGUNAKAN ALGORITMA RANDOM FOREST,” JIRE (Jurnal Informatika & Rekayasa Elektronika), vol. 7, no. 2, 2024, [Online]. Available: http://e-journal.stmiklombok.ac.id/index.php/jireISSN.2620-6900

Mohan Krishna Thalla, “Diabetes Health Indicators Dataset,” Kaggle. Accessed: Oct. 10, 2025. [Online]. Available: https://www.kaggle.com/datasets/mohankrishnathalla/diabetes-health-indicators-dataset

M. Salsabil, N. L. Azizah, and A. Eviyanti, “Implementasi Data Mining Dalam Melakukan Prediksi Penyakit Diabetes Menggunakan Metode Random Forest Dan Xgboost,” Jurnal Ilmiah Komputasi, vol. 23, no. 1, Mar. 2024, doi: 10.32409/jikstik.23.1.3507.

A. A. Abu-Shareha, H. Qutaishat, and A. Al-Khayat, “A Framework for Diabetes Detection Using Machine Learning and Data Preprocessing,” Journal of Applied Data Sciences, vol. 5, no. 4, pp. 1654–1667, Dec. 2024, doi: 10.47738/jads.v5i4.363.

B. N. Azmi, A. Hermawan, and D. Avianto, “Analisis Pengaruh Komposisi Data Training dan Data Testing pada Penggunaan PCA dan Algoritma Decision Tree untuk Klasifikasi Penderita Penyakit Liver,” JTIM : Jurnal Teknologi Informasi dan Multimedia, vol. 4, no. 4, pp. 281–290, Feb. 2023, doi: 10.35746/jtim.v4i4.298.

E. R. Susanto, M. R. Inzaghi, Amarudin, and Neneng, “Evaluasi Kinerja Model Random Forest Dalam Memprediksi Diabetes Berdasarkan Dataset Kesehatan di Indonesia,” Jurnal Pendidikan dan Teknologi Indonesia, vol. 5, no. 7, pp. 1857–1866, Jul. 2025, doi: 10.52436/1.jpti.871.

D. Ismafillah, T. Rohana, and Y. Cahyana, “Analisis algoritma pohon keputusan untuk memprediksi penyakit diabetes menggunakan oversampling smote,” INFOTECH : Jurnal Informatika & Teknologi, vol. 4, no. 1, pp. 27–36, Jun. 2023, doi: 10.37373/infotech.v4i1.452.

D. R. Damayanti and A. Purwinarko, “Application of C4.5 Algorithm Using Synthetic Minority Oversampling Technique (SMOTE) and Particle Swarm Optimization (PSO) for Diabetes Prediction,” Recursive Journal of Informatics, vol. 2, no. 1, pp. 18–27, Mar. 2024, doi: 10.15294/rji.v2i1.64928.

Y. N. Aini, A. Faqih, and G. Dwilestari, “Penerapan Metode Decision Tree dalam Penentuan Jurusan Siswa,” Jurnal Ilmiah Informatika (JIF), vol. 13 No 1, Mar. 2025.

S. Danil, N. Rahaningsih, R. D. Dana, and . M., “PENINGKATAN KLASIFIKASI KEMISKINAN INDONESIA MENGGUNAKAN METODE DECISION TREE,” Jurnal Informatika dan Teknik Elektro Terapan (JITET), vol. 13, no. 2, Apr. 2025, doi: 10.23960/jitet.v13i2.6336.

Downloads

Published

2026-02-03

How to Cite

Pudjiati, S., Fachmi, A. N., Patria, R. D., Ramadhan, F. R., & Sari, A. P. (2026). A Indonesia: Perbandingan Kinerja Klasifikasi Data Mining untuk Diagnosis Diabetes. Jurnal Media Informatika, 7(1), 384-391. Retrieved from https://ejournal.sisfokomtek.org/index.php/jumin/article/view/8024