INTEGRASI SELEKSI FITUR DAN PENDEKATAN LEVEL DATA UNTUK PENANGANAN KETIDAKSEIMBANGAN KELAS PADA PREDIKSI CACAT SOFTWARE

research
  • 17 Oct
  • 2022

INTEGRASI SELEKSI FITUR DAN PENDEKATAN LEVEL DATA UNTUK PENANGANAN KETIDAKSEIMBANGAN KELAS PADA PREDIKSI CACAT SOFTWARE

Dataset dari software metrik secara umum bersifat tidak seimbang (unbalanced). Ketidakseimbangan dalam distribusi kelas dan tidak relevannya atribut-atribut yang ada dalam dataset dapat menurunkan kinerja model prediksi cacat software, karena cenderung menghasilkan prediksi kelas mayoritas daripada kelas minoritas. Penelitian ini menggunakan dataset publik dari NASA (National Aeronautics and Space Administration) MDP (Metrics Data Program) repository. Penelitian ini bertujuan untuk mengurangi pengaruh ketidakseimbangan kelas dalam dataset, agar kinerja pengklasifikasi pada prediksi cacat software dapat meningkat dalam memprediksi cacat software. Model yang diusulkan pada penelitian ini adalah menerapkan teknik seleksi fitur particle swarm optimization (PSO), pendekatan level data Random Under-Sampling (RUS) dan SMOTE (Synthetic Minority Over-sampling Technique), dengan pendekatan level algoritma (ensemble) Bagging dengan pengklasifikasi Naive Bayes. Hasil penelitian menunjukan bahwa model usulan mampu meningkatkan kinerja pengklasifikasi naïve bayes secara keseluruhan dalam memprediksi cacat software dengan nilai AUC mencapai > 0.8. Keunggulan ditunjukan pada model PSO+SMOTE+BG+NB dimana pada dataset MW1 memperoleh nilai AUC 0,806 dan model PSO+RUS+BG+NB dimana dataset PC1 memperoleh nilai 0,869. Uji statistik menunjukan bahwa adanya pengaruh yang signifikan antara model usulan dengan model naive bayes dengan nilai p (0,043) lebih kecil dari nilai alpha (0,05) yang artinya terdapat perbedaan yang siginifkan antara kedua model.

Unduhan

  • TESIS.pdf

    Thesis_Ade Suryadi

    •   diunduh 262x | Ukuran 1,682 KB

 

REFERENSI

Alfaro, E., Gamez, M., & García, N. (2013). adabag: An R Package for Classification with Boosting and Bagging. Journal of Statistical Software, 54(2), 1 - 35. doi: 10.18637/jss.v054.i02.

Arora, I., Tetarwal, V., & Saha, A. (2015). Open Issues in Software Defect Prediction.
Procedia Computer Science, Volume 46, p. 906-912. doi: 10.1016/j.procs.2015.02.161.

Cong jin & Shu-Wei Jin. (2015). Prediction approach of software fault-proneness based on hybrid artificial neural network and quantum particle swarm optimization. Applied Soft Computing

Fitriyani & Wahono, R. S., (2015).Integrasi Bagging dan Greedy Forward Selection pada Prediksi Cacat Software dengan Menggunakan Naïve Bayes. Journal of Software Engineering, Vol. 1, No. 2

Jain, M., & Richariya, V. (2012). An Improved Techniques Based on Naive Bayesian for Attack Detection. International Journal of Emerging Technology and Advanced Engineering, 2(1), 324-331.

Jones, C., & Bonsignour, O. (2012). The Economics of Software Quality. Jones, C. (2013). Software Defect Origins and Removal Methods. Namcook Analytics.

Laradji, I. H., Alshayeb, M., & Ghouti, L. (2015). Software Defect Prediction Using Ensemble Learning on Selected Features. Information and Software Technology, 388-402.

Putri, S. A. & Frieyadie (2017). Combining Integreted Sampling Technique With Feature Selection For Software Defect Prediction, 2017 5th International Conference on Cyber and IT Service Management (CITSM), Denpasar, 2017, pp. 1-6. doi: 10.1109/CITSM.2017.8089264

Putri, S.A & Wahono R.S.(2015). Integrasi SMOTE dan Information Gain pada Naive Bayes untuk Prediksi Cacat Software. Software Engineering, vol. 1, no. 2, pp. 86–91

Sugiyono, 2015. Metode Penelitian Kuantitatif, Kualitatif dan R & D. Alfabeta, Bandung.

Shepperd, M., Song, Q., Sun, Z., & Mair, C. (2013). Data quality: Some comments on the NASA software defect datasets. IEEE Transactions on Software Engineering, 39, 1208–1215. doi: 10.1109/TSE.2013.11

Wahono, R. S. (2015). A Systematic Literature Review of Software Defect Prediction: Research Trends, Datasets, Methods and Frameworks. Journal of Software Engineering, 1-16.

Wahono, R. S., & Suryana, N. (2013). Combining Particle Swarm Optimization based Feature Selection and Bagging Technique for Software Defect. IJSEIA, 153-166.

Wahono, R. S., Suryana, N., & Ahmad, S. (2014). Metaheuristic Optimization based Feature Selection for Software Defect Prediction. Journal of Software, 1324-1333.
 
Wang, S., & Yao, X. (2013). Using Class Imbalance Learning for Software Defect Prediction. IEEE Transactions on Reliability, 434-443.

Yap, B. W., Rani, K. A., Rahman, H. A., Fong, S., Khairudin, Z., & Abdullah, N. N. (2014). An Application of Oversampling, Undersampling, Bagging and Boosting in Handling Imbalanced Datasets. Proceedings of the First International Conference on Advanced Data and Information Engineering (DaEng-2013). 285, pp. 13-22. Singapore: Springer. doi:10.1007/978-9814585-18-7_2