SOFTWARE DEFECT PREDICTION DENGAN RANDOM OVER SAMPLING DAN RANDOM FOREST LEARNING

research
  • 19 Sep
  • 2022

SOFTWARE DEFECT PREDICTION DENGAN RANDOM OVER SAMPLING DAN RANDOM FOREST LEARNING

Perangkat lunak atau sering disebut dengan aplikasi sangat melekat pada kehidupan khalayak ramai pada akhir-akhir ini. Dalam pengembangannya perangkat lunak didukung oleh berbagai macam metode, bagi sebagian besar pelaku software development mengetahui bagaimana cara membangun perangkat lunak dari perancangan lalu pengujian (testing) dan pemeliharaan (maintenance) sampai aplikasi tersebut dapat digunakan oleh banyak orang. Namun, ada beberapa kasus yang terkuak dan tidak terdeteksi pada proses testing melainkan ketika aplikasi tersebut sudah ditangan penguna. Pengujian demi pengujian telah di lakukan namun tidak dapat memprediksi kecacatan dikemudian hari. Penelitian ini dilakukan untuk menjawab kebutuhan development dimana pengaruh praproses data berpengaruh pada akurasi algoritma, algoritma yang digunakan diantaranya Naïve bayes, C.45, Linear Regression, MLP, RF, KNN dan SVM, fakta yang ditemukan dengan menggunakan SVM pada metode Discretize medapat akurasi 77.3410%, dengan menggunakan Random Forest pada teknik ROS mendapat akurasi 87.7682% dan dengan menggunakan Algoritma C.45 pada seleksi fitur Gain Ratio mendapat akurasi 77.5554%

Unduhan

 

REFERENSI

[1] A. Montella, S. Chiaradonna, G. Criscuolo, and S. De Martino, “Development and evaluation of a web-based software for crash data collection, processing and analysis,” Accid. Anal. Prev., 2019, doi: 10.1016/j.aap.2017.01.013.
[2] S. V. Zykov, Historical Survey: Crises, Crises, Everywhere; Any End to This Nightmare? 2020.
[3] V. Garousi and M. Felderer, “Worlds Apart: Industrial and Academic Focus Areas in Software Testing,” IEEE Softw., 2017, doi: 10.1109/MS.2017.3641116.
[4] G. Fan, X. Diao, H. Yu, K. Yang, and L. Chen, “Software Defect Prediction via Attention-Based Recurrent Neural Network,” Hindawi, vol. 2019, 2019.
[5] A. Iqbal et al., “Performance Analysis of Machine Learning Techniques on Software Defect Prediction using NASA Datasets,” vol. 10, no. 5, pp. 300–308, 2019.
[6] S. Mulyati, Yulianti, and A. Saifudin, “KETIDAKSEIMBANGAN KELAS BERBASIS NAΪVE BAYES PADA PREDIKSI,” vol. 2, no. 4, pp. 190–199, 2017.
[7] H. Rianto and R. S. Wahono, “Resampling Logistic Regression untuk Penanganan Ketidakseimbangan Class pada Prediksi Cacat Software,” IlmuKomputer.com J. Softw. Eng., vol. 1, no. 1, pp. 46–53, 2015.
[8] C. M. L. Florence, “Deep neural network based hybrid approach for software defect prediction using software metrics,” Cluster Comput., 2018, doi: 10.1007/s10586-018-1696-z.
[9] A. Iqbal, S. Aftab, and F. Matloob, “Performance Analysis of Resampling Techniques on Class Imbalance Issue in Software Defect Prediction,” I.J. Inf. Technol. Comput. Sci., no. November, pp. 44–53, 2019, doi: 10.5815/ijitcs.2019.11.05.
[10] R. J. L. Florence, “Software defect prediction techniques using metrics based on neural network classifier,” Cluster Comput., 2018, doi: 10.1007/s10586-018-1730-1.
[11] D. Nofriansyah and G. W. Nurcahyo, Algoritma Data Mining Dan Pengujian. Jakarta, 2015.
[12] S. A. Alasadi and W. S. Bhaya, “Review of Data Preprocessing Techniques,” Journal of Engineering and Applie Sciences, vol. 12, no. 16. pp. 4102–4107, 2017.
[13] Suyanto, Machine Learning Tingkat dasar dan Lanjut. Penerbit Informatika, 2018.
[14] D. Firdaus, “Penggunaan Data Mining dalam Kegiatan Sistem Pembelajaran Berbantuan Komputer,” J. Format, vol. 6, no. 2, pp. 91–97, 2017.
[15] H. N. Firqiani, “Seleksi Fitur Menggunakan Fast Correlation Based Filter Pada Algoritma Voting Feature Intervals 5,” Institut Pertanian Bogor (IPB), 2007.
[16] J. Lever, M. Krzywinski, and N. Altman, “Points of Significance: Principal component analysis,” Nat. Methods, vol. 14, no. 7, pp. 641–642, 2017, doi: 10.1038/nmeth.4346.
[17] S. J. Wetzel, “Unsupervised learning of phase transitions: From principal component analysis to variational autoencoders,” Phys. Rev. E, vol. 96, no. 2, pp. 1–11, 2017, doi: 10.1103/PhysRevE.96.022140.
[18] Y. M. S., “Random Forest,” 2018. https://machinelearning.mipa.ugm.ac.id/2018/07/28/random-forest/ (accessed Jan. 19, 2021).
[19] A. Syukron and A. Subekti, “Penerapan Metode Random Over-Under Sampling dan Random Forest Untuk Klasifikasi Penilaian Kredit,” J. Inform., vol. 5, no. 2, pp. 175–185, 2018, doi: 10.31311/ji.v5i2.4158.
[20] F. Tempola, M. Muhammad, and A. Khairan, “Perbandingan Klasifikasi Antara KNN dan Naive Bayes pada Penentuan Status Gunung Berapi dengan K-Fold Cross Validation,” J. Teknol. Inf. dan Ilmu Komput., vol. 5, no. 5, p. 577, 2018, doi: 10.25126/jtiik.201855983.
[21] I. A. M. SUPARTINI, I. K. G. SUKARSA, and I. G. A. M. SRINADI,