Komparasi Penggunaan Information Gain Pada Machine Learning untuk Memprediksi Harga Rumah di Jabodetabek

Authors

  • Nabila Agustina Cahyani Putri Universitas Narotama, Surabaya, Indonesia
  • Dede Brahma Arianto Universitas Islam Indonesia, Yogyakarta, Indonesia

DOI:

https://doi.org/10.55338/saintek.v5i3.2052

Keywords:

Multiple Linear Regression, Random Forest Regression, Information Gain, Prediksi Harga Rumah, CRISP-DM

Abstract

Dengan kepadatan penduduk di Jabodetabek menyebabkan peningkatan kebutuhan akan rumah, baik digunakan untuk kebutuhan dasar maupun dijadikan sebagai investasi. Maka dari itu, perlu dilakukannya penelitian akan analisis dari harga rumah di Jabodetabek untuk mengurangi kerugian dalam berinvestasi. Tujuan dilakukannya penelitian ini adalah untuk memprediksi harga rumah di Jabodetabek sesuai dengan preferensi yang dimiliki oleh pembeli dan membantu para investor dalam memprediksi harga rumah agar dapat mengurangi risiko kerugian. Metode yang digunakan untuk analisis harga rumah di Jabodetabek adalah dengan membandingkan algoritma multiple linear regression dan random forest regression dengan menerapkan metode information gain untuk seleksi fitur. Kerangka kerja yang digunakan pada penelitian ini adalah CRISP-DM (Cross-Industry Standard Process for Data Mining). Hasil penelitian menunjukkan bahwa model terbaik adalah random forest regression dengan 10 variabel bebas yang didasarkan pada RMSE (Root Mean Squared Error) terendah yaitu sebesar 561272163 yang kemudian diaplikasikan ke dalam website dengan menggunakan framework streamlit. Meskipun demikian, hasil menunjukkan RMSE (Root Mean Squared Error) pada model machine learning masih cukup tinggi, sehingga disarankan untuk penelitian selanjutnya mencoba menerapkan model algoritma selain dari multiple linear regression dan random forest regression, serta mencoba menerapkan seleksi fitur selain metode information gain yang diharapkan dapat menurunkan nilai RMSE (Root Mean Squared Error) pada model sistem prediksi harga rumah di Jabodetabek.

Downloads

Download data is not yet available.

References

E. D. Viana, F. Febrianti, and F. R. Dewi, “Literasi Keuangan, Inklusi Keuangan dan Minat Investasi Generasi Z di Jabodetabek,” Jurnal Manajemen dan Organisasi, vol. 12, no. 3, pp. 252–264, Jan. 2022, doi: 10.29244/jmo.v12i3.34207.

S. Ariyanti, “Studi Perencanaan Jaringan Long Term Evolution Area Jabodetabek Studi Kasus PT. Telkomsel,” Buletin Pos dan Telekomunikasi, vol. 12, no. 4, p. 255, Mar. 2015, doi: 10.17933/bpostel.2014.120402.

L. Agustino, F. Manan, and I. Akbar, “Laporan Penelitian BNN RI-IKoTAn 2019”.

InfoJabodetabek.com, “Luas Wilayah dan Jumlah Penduduk Jabodetabek,” InfoJabodetabek.com.

E. Fitri, “Analisis Perbandingan Metode Regresi Linier, Random Forest Regression dan Gradient Boosted Trees Regression Method untuk Prediksi Harga Rumah,” Journal of Applied Computer Science and Technology, vol. 4, no. 1, pp. 58–64, Jul. 2023, doi: 10.52158/jacost.v4i1.491.

S. Utomo and T. Mardiono, “SISTEM PENDUKUNG KEPUTUSAN PEMILIHAN RUMAH PADA PERUMAHAN MENGGUNAKAN METODE ANALYTICAL HIERARCHY PROCESS (STUDI KASUS : KEC. NGAMPRAH KAB. BANDUNG BARAT),” FIKI (Jurnal Teknologi Informasi dan Komunikasi), vol. 9, no. 1, pp. 47–59, May 2018.

M. A. Verdiansyah and Suwanda, “Penerapan Metode Regresi Komponen Utama Kernel untuk Prediksi Harga Rumah,” Bandung Conference Series: Statistics, vol. 3, no. 2, pp. 653–661, Aug. 2023, doi: 10.29313/bcss.v3i2.9084.

S. H. A. Aini, Y. A. Sari, and A. Arwan, “Seleksi Fitur Information Gain untuk Klasifikasi Penyakit Jantung Menggunakan Kombinasi Metode K-Nearest Neighbor dan Na"ive Bayes,” Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol. 2, no. 9, pp. 2546–2554, 2018.

R. A. Azizah, F. Bachtiar, and S. Adinugroho, “Klasifikasi Kinerja Akademik Siswa Menggunakan Neighbor Weighted K-Nearest Neighbor dengan Seleksi Fitur Information Gain,” Jurnal Teknologi Informasi dan Ilmu Komputer, vol. 9, no. 3, pp. 605–614, Jun. 2022, doi: 10.25126/jtiik.2022935751.

I. Maula, L. U. Hasanah, and A. Tholib, “ANALISIS PREDIKSI HARGA RUMAH DI JABODETABEK MENGGUNAKAN MULTIPLE LINEAR REGRESSION,” Jurnal Informatika Kaputama (JIK), vol. 7, no. 2, pp. 216–224, 2023.

R. Tanamal, N. M. K. S. Rasyid Jr, T. Wiradinata, Y. S. Soekamto, and T. R. D. Saputri, “House Price Prediction Model Using Random Forest in Surabaya City,” 2023.

C. Haryanto, N. Rahaningsih, and F. M. Basysyar, “KOMPARASI ALGORITMA MACHINE LEARNING DALAM MEMPREDIKSI HARGA RUMAH,” JATI (Jurnal Mahasiswa Teknik Informatika), vol. 7, no. 1, pp. 533–539, 2023.

W. J. Pranoto, “IMPLEMENTASI SELEKSI FITUR INFORMATION GAIN RATIO PADA ALGORITMA RANDOM FOREST UNTUK MODEL DATA KLASIFIKASI PEMBAYARAN KULIAH,” 2023.

H. Akbar, M. Ayomi, and Y. Haryanto, “ANALISIS PERBANDINGAN MODEL MACHINE LEARNINGDALAM PREDIKSI SUHU PERMUKAAN LAUT MENGGUNAKAN DATA MODEL REANALYSIS ECMWF,” Prosiding Seminar Nasional Hasil Penelitian Kelautan dan Perikanan, pp. 96–100, Mar. 2023.

A. K. Baskara, A. Nazir, M. Irsyad, Y. Yusra, and F. Insani, “Implementasi Data Mining Memprediksi Penjualan Crude Palm Oil Berdasarkan Kapasitas Tangki Menggunakan Multiple Linear Regression,” Jurnal Sistem Komputer dan Informatika (JSON), vol. 4, no. 3, p. 493, Mar. 2023, doi: 10.30865/json.v4i3.5665.

S. Fachid and A. Triayudi, “Perbandingan Algoritma Regresi Linier dan Regresi Random Forest Dalam Memprediksi Kasus Positif Covid-19,” JURNAL MEDIA INFORMATIKA BUDIDARMA, vol. 6, no. 1, p. 68, Jan. 2022, doi: 10.30865/mib.v6i1.3492.

Diana Tri Susetianingtias, Eka Patriya, and Rodiah, “Model Random Forest Regression Untuk Peramalan Penyebaran Covid-19 Di Indonesia,” Decode: Jurnal Pendidikan Teknologi Informasi, vol. 2, no. 2, pp. 84–95, Sep. 2022, doi: 10.51454/decode.v2i2.48.

D. U. Iswavigra, L. E. Zen, H. Hanim, and others, “Marketing Strategy UMKM Dengan CRISP-DM Clustering & Promotion Mix Menggunakan Metode K-Medoids,” Jurnal Informasi dan Teknologi, pp. 45–54, 2023.

Y. Yudiana, A. Y. Agustina, N. Khofifah, and others, “Prediksi Customer Churn Menggunakan Metode CRISP-DM Pada Industri Telekomunikasi Sebagai Implementasi Mempertahankan Pelanggan,” Indonesian Journal of Islamic Economics and Business, vol. 8, no. 1, pp. 1–20, 2023.

H. Halawa, O. J. Harmaja, W. sandi Hulu, and others, “Implementasi Algoritma K-Means Clustering Untuk Pengelompokkan Penyakit Pasien Pada Puskesmas Pulo Brayan,” Jurnal Sains dan Teknologi, vol. 5, no. 1, pp. 150–157, 2023.

A. Rizkiawan and T. Wahyudi, “IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI MEMBER BARU MENGGUNAKAN LINEAR REGRESSION PADA PT. GSI,” Jurnal Tekinkom (Teknik Informasi dan Komputer), vol. 6, no. 1, pp. 118–126, 2023.

M. Fajar, D. Mahdiana, A. Diana, and G. Triyono, “PERAMALAN HARGA SAHAM UBER MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE,” in Prosiding Seminar Nasional Mahasiswa Fakultas Teknologi Informasi (SENAFTI), 2023, pp. 304–308.

S. Sutisna and M. N. Yuniar, “Klasifikasi Kualitas Air Bersih Menggunakan Metode Na"ive baiyes,” Jurnal Sains dan Teknologi, vol. 5, no. 1, pp. 243–246, 2023.

R. Rasiban, S. Bila, and T. Triwahyudi, “Pemilihan Rute Terbaik Dari Lokasi Calon Pelanggan Ke Terminal Akses Menggunakan Metode A* Star PT. Bahtera Anugrah Electical,” Jurnal Sains dan Teknologi, vol. 5, no. 1, pp. 331–335, 2023.

T. M. Khalil and S. Sahid, “Klasifikasi informasi hoaks pada media sosial twitter menggunakan algoritma random forest berbasis particle swarm optimization,” Jurnal Kajian dan Terapan Matematika, vol. 8, no. 3, pp. 199–209, 2022.

Downloads

Published

2024-02-12

How to Cite

Cahyani Putri, N. A. ., & Arianto, D. B. . (2024). Komparasi Penggunaan Information Gain Pada Machine Learning untuk Memprediksi Harga Rumah di Jabodetabek. Jurnal Sains Dan Teknologi, 5(3), 756-762. https://doi.org/10.55338/saintek.v5i3.2052