OPTIMALISASI KINERJA ALGORITMA RANDOM FOREST PADA MODEL DETEKSI TINGKAT CACAT PERANGKAT LUNAK

research
  • 05 Apr
  • 2023

OPTIMALISASI KINERJA ALGORITMA RANDOM FOREST PADA MODEL DETEKSI TINGKAT CACAT PERANGKAT LUNAK

Dataset dari software matrik secara umum bersifat tidak seimbang (Imbalanced).
Ketidak seimbangan kelas yang ada dalam
Dataset dapat menurunkan kinerja model
prediksi cacat software, karena cenderung menghasilkan prediksi kelas mayoritas dari
kelas minoritas,
Dataset yang digunakan pada penelitian ini menggunakan dataset
National Aeronautics and Space Administration (
NASA) Metrics Data Program
(MDP), Dari Tahapan pra pemrosesan diusulkan metode Particle Swarm
Optimization
(PSO) untuk mengatasi masalah attribute pada data training dan metode
Resampling Random Over Sampling (ROS). untuk menangani ketidak seimbangan
kelas. Penelitian ini mengusulkan metode
Random Forest yang dikombinasikan
dengan
Adaboost dapat mengestimasi tingkat kecacatan suatu Software melalui data
training, Dari Hasil penelitian ini menunjukan bahwa algoritma
Resampling+
Adaboost+Random Forest dapat digunakan untuk memprediksi cacat
software dengan rata-rata akurasi 94,70% dan nilai AUC 0,939. Sementara algoritma
PSO+
Random Forest hanya memiliki rata rata akurasi 89,60% dan AUC 0,636
perbedaan akurasi dari kedua model tersebut 5,10% dan AUC 0,303. Uji statistik
menunjukan bahwa adanya pengaruh yang signifikan antara model usulan dengan
model
Random Forest dengan nilai p (0,036) lebih kecil dari nilai alpha (0,05) yang
artinya terdapat perbedaan yang siginifkan antara kedua model.

Kata Kunci: Imbalanced Class, Resample, Particle Swarm Optimization, Random Forest, Adaboost, Kecacatan Software

Unduhan

  • tesis.pdf

    Thesis

    •   diunduh 251x | Ukuran 4,253 KB

 

REFERENSI

DAFTAR REFERENSI
Alfaro, E., Gamez, M., & García, N. (2013). adabag: An R Package for Classification
with Boosting and Bagging. Journal of Statistical Software, 54
(2), 1 - 35. doi:
10.18637/jss.v054.i02.
Arora, I., Tetarwal, V., & Saha, A. (2015). Open Issues in Software Defect
Prediction. Procedia Computer Science, Volume 46, p. 906-912.
doi: 10.1016/j.procs.2015.02.161.
Cong jin & Shu-Wei Jin. (2015). Prediction approach of software fault-proneness
based on hybrid artificial neural network and quantum particle swarm
optimization. Applied Soft Computing
Jain, M., & Richariya, V. (2012). An Improved Techniques Based on Naive Bayesian
for Attack Detection. International Journal of Emerging Technology and
Advanced Engineering, 2(1), 324-331.
Jones, C., & Bonsignour, O. (2012). The Economics of Software Quality.
Jones, C. (2013). Software Defect Origins and Removal Methods. Namcook
Analytics.
Laradji, I. H., Alshayeb, M., & Ghouti, L. (2015). Software Defect Prediction Using
Ensemble Learning on Selected Features. Information and Software
Technology, 388-402.
Lifeng Zhou, Hong Wang(2012), Loan Default Prediction on Large Imbalanced Data
Using Random Forests
Putri, S. A. & Frieyadie (2017). Combining Integreted Sampling Technique With
Feature Selection For Software Defect Prediction,
2017 5th International
Conference on Cyber and IT Service Management (CITSM)
, Denpasar, 2017,
pp. 1-6. doi: 10.1109/CITSM.2017.8089264
Putri, S.A & Wahono R.S.(2015). Integrasi SMOTE dan Information Gain pada
Naive Bayes untuk Prediksi Cacat Software. Software Engineering, vol. 1, no.
2, pp. 86–91
Reshma C. Bhagat & Sachin S. Patil (2015) Enhanced SMOTE Algorithm for
Classification of Imbalanced Big-Data using Random Forest, 978-1-
4799-8047-5/15/
Sugiyono, 2015. Metode Penelitian Kuantitatif, Kualitatif dan R & D. Alfabeta,
Bandung.
Shepperd, M., Song, Q., Sun, Z., & Mair, C. (2013). Data quality: Some comments
on the NASA software defect datasets. IEEE Transactions on Software
Engineering, 39, 1208–1215. doi: 10.1109/TSE.2013.11
Syukron, A., & Subekti, A. (2018). Penerapan Metode Random Over-Under
Sampling dan Random Forest Untuk Klasifikasi Penilaian Kredit.
Jurnal
Informatika
, 5(2), 175–185. https://doi.org/10.31311/ji.v5i2.4158
Wahono, R. S. (2015). A Systematic Literature Review of Software Defect
Prediction: Research Trends, Datasets, Methods and Frameworks. Journal of
Software Engineering, 1-16.

60
Wahono, R. S., & Suryana, N. (2013). Combining Particle Swarm Optimization
based Feature Selection and Bagging Technique for Software Defect. IJSEIA,
153-166.
Wahono, R. S., Suryana, N., & Ahmad, S. (2014). Metaheuristic Optimization based
Feature Selection for Software Defect Prediction. Journal of Software, 1324-
1333.
Wang, S., & Yao, X. (2013). Using Class Imbalance Learning for Software Defect
Prediction.
IEEE Transactions on Reliability, 434-443.
Yap, B. W., Rani, K. A., Rahman, H. A., Fong, S., Khairudin, Z., & Abdullah, N. N.
(2014). An Application of Oversampling, Undersampling, Bagging and
Boosting in Handling Imbalanced Datasets. Proceedings of the First
International Conference on Advanced Data and Information Engineering
(DaEng-2013). 285, pp. 13-22. Singapore: Springer. doi:10.1007/978-
9814585-18-7_2