Penerapan Metode Random Over-Under sampling dan Random Forest Untuk Klasifikasi Penilaian Kredit

research
  • 05 Feb
  • 2020

Penerapan Metode Random Over-Under sampling dan Random Forest Untuk Klasifikasi Penilaian Kredit

Penilaian kredit telah menjadi salah satu cara utama bagi sebuah lembaga keuangan untuk menilai resiko kredit,  meningkatkan arus kas, mengurangi kemungkinan resiko dan membuat keputusan manajerial. Salah satu permasalahan yang dihadapai pada penilaian kredit yaitu adanya ketidakseimbangan distribusi dataset. Metode untuk mengatasi ketidakseimbangan kelas yaitu dengan metode resampling, seperti menggunakan Oversampling, undersampling dan hibrida yaitu dengan menggabungkan kedua pendekatan sampling. Metode yang diusulkan pada penelitian ini adalah penerapan metode Random Over-Under Sampling Random Forest untuk meningkatkan kinerja akurasi klasifikasi penilaian kredit pada dataset German Credit.  Hasil pengujian menunjukan bahwa klasifikasi tanpa melalui proses resampling menghasilkan kinerja akurasi rata-rata 70 % pada semua classifier. Metode Random Forest memiliki nilai akurasi yang lebih baik dibandingkan dengan beberapa metode lainnya dengan nilai akurasi sebesar 0,76 atau 76%. Sedangkan klasifikasi dengan penerapan metode Random Over-under sampling Random Forest  dapat meningkatkan kinerja akurasi sebesar 14,1% dengan nilai akurasi sebesar 0,901 atau 90,1 %. Hasil penelitian menunjukan bahwa penerapan  resampling dengan metode Random Over-Under Sampling pada algoritma Random Forest dapat meningkatkan kinerja akurasi secara efektif pada klasifikasi  tidak seimbang untuk penilaian kredit pada dataset German Credit.

Unduhan

 

REFERENSI

  1. Agrawal, K., Baweja, Y., Dwivedi, D., Saha, R., Prasad, P., Agrawal, S., … Dutt, V. (2018). A Comparison of Class Imbalance Techniques for Real-World Landslide Predictions. Proceedings - 2017 International Conference on Machine Learning and Data Science, MLDS 2017, 2018–Janua, 1–8. https://doi.org/10.1109/MLDS.2017.21
  2. Dawson, C. W. (2009). Projects in Computing and Information Systems A Student’s Guide (2nd ed.). Pearson Education Limited.
  3. Han, J., Kamber, M., Pei, J., (2012). Data Minning Concept And Techniques. California: Morgan Kaufmann.
  4. He, H., Zhang, W., & Zhang, S. (2018). A novel ensemble method for credit scoring: Adaption of different imbalance ratios. Expert Systems with Applications, 98, 105–117. https://doi.org/10.1016/ j.eswa.2018.01.012
  5. Jian, C., Gao, J., & Ao, Y. (2016). A new sampling method for classifying imbalanced data based on support vector machine ensemble. Neurocomputing, 193, 115–122. https://doi.org/10.1016/j.neucom.2016.02.006
  6. Koutanaei, F. N., Sajedi, H., & Khanbabaei, M. (2015). A hybrid data mining model of feature selection algorithms and ensemble learning classifiers for credit scoring. Journal of Retailing and Consumer Services, 27, 11–23. https://doi.org/10.1016/j.jretconser.2015.07.003
  7. Lin, L., Wang, F., Xie, X., & Zhong, S. (2017). Random forests-based extreme learning machine ensemble for multi-regime time series prediction. Expert Systems with Applications, 83, 164–176. https://doi.org/10.1016/j.eswa.2017.04.013
  8. Rajesh, K. N. V. P. S., & Dhuli, R. (2018). Classification of imbalanced ECG beats using re-sampling techniques and AdaBoost ensemble classifier. Biomedical Signal Processing and Control, 41, 242–254. https://doi.org/ 10.1016/j.bspc.2017.12.004
  9. Ren, F., Cao, P., Li, W., Zhao, D., & Zaiane, O. (2017). Ensemble based adaptive over-sampling method for imbalanced data learning in computer aided detection of microaneurysm. Computerized Medical Imaging and Graphics, 55, 54–67. https://doi.org/ 10.1016/j.compmedimag.2016.07.011
  10. Saifudin, A., Teknik, F., Pamulang, U., Komputer, F. I., Nuswantoro, U. D., & Software, P. C. (2015). Pendekatan Level Data untuk Menangani Ketidakseimbangan Kelas pada Prediksi Cacat Software. Journal of Software Engineering, 1(2), 76–85.
  11. Wang, G., Hao, J., Ma, J., & Jiang, H. (2011). A comparative assessment of ensemble learning for credit scoring. Expert Systems with Applications, 38(1), 223–230. https://doi.org/10.1016/j.eswa.2010. 06.048
  12. Xiao, J., Xie, L., He, C., & Jiang, X. (2012). Dynamic classifier ensemble model for customer classification with imbalanced class distribution. Expert Systems with Applications, 39(3), 3668–3675. https://doi.org/10.1016/j.eswa.2011.09.059
  13. Zhang, X., Yang, Y., & Zhou, Z. (2018). A Novel Credit Scoring Model based on Optimized Random Forest. Computing and Communicating Workshop and Conference (CCWD), 2018 IEEE 8th Annual, 978(1), 60–65.