Software berkualitas tinggi adalah software yang tidak ditemukan cacat (defect) baik selama pr oses
pemeriksaan atau pengujian. Masalah utama dalam dataset software metrics adalah imbalance class
yang membuat data menjadi tidak seimbang karena data yang cacat (kelas minoritas) jumlahnya lebih
sedikit dibandingkan dengan data yang tidak cacat (kelas mayoritas), masalah ini dapat menurunkan
kinerja klasifikasi. Pada Penelitian ini, untuk menangani masalah imbalance class dilakukan dengan
integrasi Distribution Based Balance dan Bagging berbasis classifier C4.5 dan Naïve Bayes. Hasil
penelitian menunjukkan bahwa model yang diusulkan mencapai akurasi dan AUC klasifikasi yang lebih
tinggi. Rata-rata akurasi 93.84%, rata-rata nilai AUC 0.939 dengan nilai rata-rata peningkatan
presentase AUC mencapai 0.34. Hasil kinerja Classifier C4.5 lebih baik dibandingkan Naïve Bayes
dengan rata-rata akhir akurasi dari kinerja model klasifikasi 82.42% dan AUC 0.738 lebih baik
dibandingkan kinerja algoritma pembanding Naïve Bayes dengan selisih akurasi 4.4% dan selisih AUC
0.023. Model yang diusulkan merupakan model terbaik dalam penelitian prediksi cacat software
untuk menangani masalah imbalance class.
Metoda Distribution Based Balance dan Bagging C4.5 Untuk Prediksi Cacat Software
Metoda Distribution Based Balance dan Bagging C4.5 Untuk Prediksi Cacat Software
Chiş, M. (2008). Evolutionary Decision Trees and Software Metrics for Module Defects Identification. Program, 2(2), 25–29.
Hall, T., Beecham, S., Bowes, D., Gray, D., & Counsell, S. (2012). A Systematic Literature Review on Fault Prediction Performance in Software Engineering. 38(6), 1276–1304.
Laradji, I. H., Alshayeb, M., & Ghouti, L. (2014). Software defect prediction using ensemble learning on selected features. INFORMATION AND SOFTWARE TECHNOLOGY. https://doi.org/10.1016/j.infsof.2014.07.005
Lehtinen, T. O. A., Mäntylä, M. V, Vanhanen, J., Itkonen, J., & Lassenius, C. (2014). Perceived causes of software project failures – An analysis of their relationships. Information and Software Technology, 56(6), 623–643. https://doi.org/10.1016/j.infsof.2014.01.015
Lessmann, S., Member, S., Baesens, B., Mues, C., & Pietsch, S. (2008). Benchmarking Classification Models for Software Defect Prediction : A Proposed Framework and Novel Findings. 34(4), 485–496.
Mantas, C. J., & Abellán, J. (2014). Expert Systems with Applications Credal-C4 . 5 : Decision tree based on imprecise probabilities to classify noisy data. EXPERT SYSTEMS WITH APPLICATIONS, 41(10), 4625–4637. https://doi.org/10.1016/j.eswa.2014.01.017
Ming, C., Guoqing, W. U., Mengting, Y., & Hongyan, W. A. N. (2016). Semisupervised Software Defect Prediction Using Task-Driven Dictionary Learning ∗. 25(6). https://doi.org/10.1049/cje.2016.08.034
Strate, J. D., & Laplante, P. A. (2013). A Literature Review of Research in Software Defect Reporting. 62(2), 444–454.
Wahono, R. S. (2015). A Systematic Literature Review of Software Defect Prediction : Research Trends , Datasets , Methods and Frameworks. 1(1).
Wu, F., Jing, X., Sun, Y., Sun, J., Huang, L., Cui, F.,… Prediction, A. S. D. (2018). CrossProject and Within-Project Semisupervised Software Defect Prediction : A Unified Approach. 1–17.
Yap, B. W., Rani, K. A., Aryani, H., Rahman, A., Fong, S., Khairudin, Z., & Abdullah, N. N. (2014). An Application of Oversampling , Undersampling , Bagging and Boosting in Handling Imbalanced Datasets. 13–23. https://doi.org/10.1007/978-981-4585-18-7