Implementasi Algoritma XGBOOST Untuk Klasifikasi Kegagalan Pembayaran Kredit Nasabah Bank
Keywords:
XGBoost, Kegagalan Pembayaran Kredit, Klasifikasi, Balancing, SMOTE, Cross-ValidationAbstract
Dengan menggunakan algoritma XGBoost, penelitian ini bertujuan untuk mengimplementasikan algoritma XGBoost sebagai Pembangunan model awal dan model yang diperbaiki menggunakan hyperparameter tuning untuk klasifikasi kegagalan pembayaran kredit nasabah bank, menggunakan data yang berasal dari Kaggle. Proses seleksi fitur dilakukan berdasar nilai information gain dengan nilai variasi batas bawah information gain 0.002, 0.004, 0.006, dan 0.01. Validasi model dilakukan dengan metode K-Fold Cross Validation (dengan nilai K = 3, 5, dan 10). Dilakukan juga penyetelan hiperparameter. Hasil penelitian menunjukan bahwa algoritma XGBoost memiliki akurasi yang cukup baik mencapai 93.10% dengan menggunakan 7 hyperparameter tuning, 14 atribut yang paling relevan berdasarkan hasil penggunaan information gain dengan k-fold 10 setelah data dikenai proses balancing menggunakan teknik SMOTE terhadap data latih dan 88.46% terhadap data uji yang telah melalui tahap preprocessing dengan penggunaan information gain sebagai kriteria seleksi fitur serta 7 nilai hyperparameter tuning terbaik. Hal ini mengindikasikan bahwa XGBoost efektif digunakan dalam klasifikasi kegagalan pembayaran kredit nasabah bank ketika data sudah seimbang dan melalui beberapa proses seperti penggunaan information gain untuk menentukan atribut yang paling informatif atau relevan dalam memprediksi kelas atau label target, dan juga penggunaan 7 hyperparameter tuning yang dapat membantu menaikan akurasi algoritma.
References
A. Nursyahriana, M. Hadjat, and I. Tricahyadinata, “Analisis Faktor Penyebab Terjadinya Kredit Macet,” FORUM EKONOMI, vol. 19, no. 1, 2017.
E. H. Yulianti, O. Soesanto, and Y. Sukmawaty, “Penerapan Metode Extreme Gradient Boosting (XGBOOST) pada Klasifikasi Nasabah Kartu Kredit,” JOMTA Journal of Mathematics: Theory and Applications, vol. 4, no. 1, 2022.
N. Soonthornphisaj, T. Sira-Aksorn, and P. Suksankawanich, “Social media comment management using smote and random forest algorithms,” International Journal of Networked and Distributed Computing, vol. 6, no. 4, pp. 204–209, 2018.
A. Fernández, S. García, F. Herrera, and N. V Chawla, “SMOTE for Learning from Imbalanced Data: Progress and Challenges, Marking the 15-year Anniversary,” 2018.
S. Hidayatul, A. Aini, Y. A. Sari, and A. Arwan, “Seleksi Fitur Information Gain untuk Klasifikasi Penyakit Jantung Menggunakan Kombinasi Metode K-Nearest Neighbor dan Naïve Bayes,” 2018. [Online]. Available: http://j-ptiik.ub.ac.id
S. F. N. Halim and U. Azmi, “Analisis Perbandingan Klasifikasi dan Penerapan SMOTE Dalam Imbalanced Data pada Credit Card Default.”
M. Ibnu and C. Rachmatullah, “Penerapan SMOTE untuk Meningkatan Kinerja Klasifikasi Penilaian Kredit,” Jurnal Riset Komputer), vol. 10, no. 1, pp. 2407–389, 2023, doi: 10.30865/jurikom.v10i1.5612.
A. Yaqin, “Penilaian Kredit Menggunakan Algoritma XGBoost dan Logistic Regression,” Jurnal Informatika: Jurnal Pengembangan IT, vol. 8, no. 1, pp. 4–10, 2023.
C. Zai, “IMPLEMENTASI DATA MINING SEBAGAI PENGOLAHAN DATA,” 2022.
W. Li and Z. Liu, “A method of SVM with normalization in intrusion detection,” in Procedia Environmental Sciences, Elsevier B.V., 2011, pp. 256–262. doi: 10.1016/j.proenv.2011.12.040.
A. Nikmatul Kasanah, Muladi, and U. Pujianto, “Penerapan Teknik SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Objektivitas Berita Online Menggunakan Algoritma KNN,” Terakreditasi SINTA Peringkat 2, vol. 3, pp. 196–201, 2019.
I. Ayu Made Supartini, I. Komang Gde Sukarsa, and I. Gusti Ayu Made Srinadi, “ANALISIS DISKRIMINAN PADA KLASIFIKASI DESA DI KABUPATEN TABANAN MENGGUNAKAN METODE K-FOLD CROSS VALIDATION,” vol. 6, no. 2, pp. 106–115, 2017.
R. D. Mendrofa, M. H. Siallagan, J. Amalia, and D. P. Pakpahan, “Credit Risk Analysis With Extreme Gradient Boosting and Adaptive Boosting Algorithm,” Journal of Information System,Graphics, Hospitality and Technology, vol. 5, no. 1, pp. 1–7, Mar. 2023, doi: 10.37823/insight.v5i1.233.
J. Iskandar, V. C. Mawardi, and J. Hendryli, “Analisis Media Sosial Penyedia Layanan Internet Menggunakan Algoritma XGBOOST,” 2022
M. R. Givari, R. Mochamad, and Y. U. Sulaeman2, “Perbandingan Algoritma SVM, Random Forest Dan XGBoost Untuk Penentuan Persetujuan Pengajuan Kredit,” vol. 16, no. 1, 2022, [Online]. Available: https://journal.uniku.ac.id/index.php/ilkom