Perbandingan Linear Regression, K-NN, dan Naive Bayes untuk Prediksi Kategori BMI

Authors

  • Adam Wildan Firdaus, Universitas Bina Sarana Informatika,  Indonesia
  • Mochamad Danu Rizkyarto, Universitas Bina Sarana Informatika,  Indonesia
  • Rizky Rachma Putri, Universitas Bina Sarana Informatika,  Indonesia

DOI:

https://doi.org/10.55338/jumin.v7i1.7842

Keywords:

Indeks Massa Tubuh, Machine Learning, Gaussian Naive Bayes, Linear Regression, K-Nearest Neighbor

Abstract

Penelitian ini bertujuan untuk menganalisis dan membandingkan kinerja tiga algoritma Machine Learning, yaitu Linear Regression, K-Nearest Neighbor, dan Gaussian Naive Bayes dalam memprediksi kategori Indeks Massa Tubuh (BMI) berdasarkan data antropometri. Dataset yang digunakan terdiri dari 111 sampel yang diperoleh dari repositori Zenodo dan diproses melalui tahapan pra-pemrosesan, standarisasi fitur numerik, serta evaluasi menggunakan metode Stratified K-Fold Cross Validation. Hasil pengujian menunjukkan adanya perbedaan karakteristik pada masing-masing algoritma. Gaussian Naive Bayes memberikan akurasi tertinggi dalam klasifikasi kategori BMI sebesar 75,74%, sedangkan Linear Regression menghasilkan prediksi numerik paling presisi dengan nilai Mean Absolute Error 0,362 kg/m². K-Nearest Neighbor memiliki akurasi lebih rendah pada dataset kecil, namun pada uji data pengguna baru justru memberikan hasil prediksi BMI yang paling mendekati nilai aktual. Temuan ini menegaskan bahwa tidak ada satu algoritma yang unggul di semua aspek, melainkan setiap metode memiliki kelebihan sesuai konteks penggunaannya. Oleh karena itu, pemilihan algoritma sebaiknya mempertimbangkan tujuan aplikasi, apakah menekankan ketepatan angka BMI atau klasifikasi kategori secara cepat dan efisien.

Downloads

Download data is not yet available.

References

E. Asmin et al., “PENYULUHAN PENYAKIT TIDAK MENULAR PADA MASYARAKAT,” Communnity Development Journal, vol. 2, no. 3, pp. 940–944, 2021.

D. Khanna, C. Peltzer, P. Kahar, and M. S. Parmar, “Body Mass Index (BMI): A Screening Tool Analysis,” Cureus, Feb. 2022, doi: 10.7759/cureus.22119.

Badan Kebijakan Pembangunan Kesehatan (BKPK), “Survei Kesehatan Indonesia (SKI) 2023 Dalam Angka,” 2023.

G. Al Raffi and N. Panji Purnomo, “PENGARUH UMUR, JENIS KELAMIN, MEROKOK, DAN NILAI BODY MASS INDEX (BMI) PADA RISIKO SESEORANG TERKENA STROKE MENGGUNAKAN REGRESI LOGISTIK,” Jurnal Inovasi Global, vol. 3, no. 11, 2024, doi: 10.58344/jig.v2i11.

Q. R. Cahyani et al., “Prediksi Risiko Penyakit Diabetes menggunakan Algoritma Regresi Logistik Diabetes Risk Prediction using Logistic Regression Algorithm Article Info ABSTRAK,” JOMLAI: Journal of Machine Learning and Artificial Intelligence, vol. 1, no. 2, pp. 2828–9099, 2022, doi: 10.55123/jomlai.v1i2.598.

J. Hosen, B. S. Engineering, and I. Ahmed, “Comparison of Regression, K-Nearest Neighbors (KNN) and Multi-Layer Perceptron (MLP) Models for the Prediction of Weight, Gender and Body Mass Index Status,” 2023.

A. I. Putri et al., “Implementation of K-Nearest Neighbors, Naïve Bayes Classifier, Support Vector Machine and Decision Tree Algorithms for Obesity Risk Prediction,” Public Research Journal of Engineering, Data Technology and Computer Science, vol. 2, no. 1, pp. 26–33, Apr. 2024, doi: 10.57152/predatecs.v2i1.1110.

T. A. D. Kurniawan, A. Setiawan, and F. Tita, “Perbandingan Kinerja Metode Support Vector Regression dan Metode Regresi Linier Berganda dalam Memprediksi BMI pada Dataset ASTHMA,” Jurnal Sains dan Edukasi Sains, vol. 8, no. 2, pp. 133–142, Aug. 2025, doi: 10.24246/juses.v8i2p133-142.

I. Werdiningsih et al., “Analisis Prediksi Stroke Menggunakan Pendekatan Decision Tree dengan Seleksi Fitur dan Neural Network,” 2023.

J. Lemantara and T. Lusiani, “ANALISIS PREDIKSI PENYAKIT DIABETES PADA WANITA MENGGUNAKAN METODE NAÏVE BAYES DAN K-NEAREST NEIGHBOR,” Jurnal Informatika dan Teknik Elektro Terapan, vol. 12, no. 3, Aug. 2024, doi: 10.23960/jitet.v12i3.4911.

A. Chatterjee, M. W. Gerdes, and S. G. Martinez, “Identification of risk factors associated with obesity and overweight—a machine learning overview,” Sensors (Switzerland), vol. 20, no. 9, May 2020, doi: 10.3390/s20092734.

B. A. Putra, N. Fadilah, H. Mukhtar, M. Fatchiyah Maharani, and A. Addarisalam, “Prediksi Risiko Depresi Pascapersalinan Menggunakan Algoritma K-Nearest Neighbor (KNN),” 2025.

A. Fadli et al., “PENGGUNAAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI KELULUSAN MAHASISWA,” 2024. [Online]. Available: https://www.kaggle.com/datasets/hafizhathallah/kelul

S. Abrori and Z. Fatah, “Implementasi Metode Decission Tree Dalam Mengklasifikasi Depresi Menggunakan Rapidminer,” Journal of Students‘ Research in Computer Science, vol. 5, no. 2, pp. 123–132, Nov. 2024, doi: 10.31599/vgf7xb32.

N. R. Febriyanti, K. Kusrini, and A. D. Hartanto, “Analisis Perbandingan Algoritma SVM, Random Forest dan Logistic Regression untuk Prediksi Stunting Balita,” Edumatic: Jurnal Pendidikan Informatika, vol. 9, no. 1, pp. 149–158, Apr. 2025, doi: 10.29408/edumatic.v9i1.29407.

A. Oktaviana, D. P. Wijaya, A. Pramuntadi, and D. Heksaputra, “Prediksi Penyakit Diabetes Melitus Tipe 2 Menggunakan Algoritma K-Nearest Neighbor (K-NN),” MALCOM: Indonesian Journal of Machine Learning and Computer Science, vol. 4, no. 3, pp. 812–818, May 2024, doi: 10.57152/malcom.v4i3.1268.

Z. A. Sejuti and M. S. Islam, “A hybrid CNN–KNN approach for identification of COVID-19 with 5-fold cross validation,” Sensors International, vol. 4, Jan. 2023, doi: 10.1016/j.sintl.2023.100229.

A. Desiani, D. A. Zayanti, I. Ramayanti, F. F. Ramadhan, and Giovillando, “PERBANDINGAN ALGORITMA SUPPORT VECTOR MACHINE (SVM) DAN LOGISTIC REGRESSION DALAM KLASIFIKASI KANKER PAYUDARA,” Jurnal Kecerdasan Buatan dan Teknologi Informasi, vol. 4, no. 1, pp. 33–42, Jan. 2025, doi: 10.69916/jkbti.v4i1.191.

K. Bartol, D. Bojanić, T. Petković, S. Peharec, and T. Pribanić, “Linear Regression vs. Deep Learning: A Simple Yet Effective Baseline for Human Body Measurement,” Sensors, vol. 22, no. 5, Mar. 2022, doi: 10.3390/s22051885.

A. M. Majid and I. Nawangsih, “Implementasi Machine Learning Menggunakan Adaboost dalam Prediksi Status Gizi Anak di Posyandu Tanjung XXIV,” 2024.

Q. A’yuniyah and M. Reza, “IJIRSE: Indonesian Journal of Informatic Research and Software Engineering Application Of The K-Nearest Neighbor Algorithm For Student Department Classification At 15 Pekanbaru State High School Penerapan Algoritma K-Nearest Neighbor Untuk Klasifikasi Jurusan Siswa Di Sma Negeri 15 Pekanbaru,” 2022.

Downloads

Published

2026-01-15

How to Cite

Firdaus, A. W., Danu Rizkyarto, M., & Rachma Putri, R. (2026). Perbandingan Linear Regression, K-NN, dan Naive Bayes untuk Prediksi Kategori BMI. Jurnal Media Informatika, 7(1), 1-6. https://doi.org/10.55338/jumin.v7i1.7842