Metoda Distribution Based Balance dan Bagging C4.5 Untuk Prediksi Cacat Software

research
  • 11 Mar
  • 2020

Metoda Distribution Based Balance dan Bagging C4.5 Untuk Prediksi Cacat Software

Software  berkualitas  tinggi  adalah  software  yang  tidak  ditemukan  cacat  (defect)  baik  selama  pr oses 

pemeriksaan atau pengujian. Masalah utama dalam dataset software metrics adalah imbalance class 

yang membuat data menjadi tidak seimbang karena data yang cacat (kelas minoritas)  jumlahnya lebih 

sedikit dibandingkan dengan data  yang tidak cacat  (kelas mayoritas), masalah ini dapat menurunkan 

kinerja  klasifikasi.  Pada  Penelitian  ini,  untuk  menangani  masalah  imbalance  class  dilakukan  dengan 

integrasi  Distribution  Based  Balance  dan  Bagging  berbasis  classifier  C4.5  dan  Naïve  Bayes.  Hasil 

penelitian menunjukkan bahwa model yang diusulkan mencapai akurasi dan AUC klasifikasi yang lebih 

tinggi.  Rata-rata  akurasi  93.84%,  rata-rata  nilai  AUC  0.939  dengan  nilai  rata-rata  peningkatan 

presentase  AUC  mencapai  0.34.  Hasil  kinerja  Classifier  C4.5  lebih  baik  dibandingkan  Naïve  Bayes 

dengan  rata-rata  akhir  akurasi  dari  kinerja  model  klasifikasi  82.42%  dan  AUC  0.738  lebih  baik 

dibandingkan kinerja algoritma pembanding Naïve Bayes dengan selisih akurasi 4.4% dan selisih AUC 

0.023.  Model  yang  diusulkan  merupakan   model   terbaik   dalam   penelitian  prediksi  cacat  software 

untuk menangani masalah imbalance class.

Unduhan

 

REFERENSI

Chiş, M. (2008). Evolutionary Decision Trees and Software  Metrics  for  Module Defects Identification. Program, 2(2), 25–29.

Hall,  T.,  Beecham,  S.,  Bowes,  D.,  Gray,  D.,  & Counsell,  S.  (2012).  A  Systematic Literature  Review  on  Fault  Prediction Performance  in  Software  Engineering. 38(6), 1276–1304.

Laradji, I. H., Alshayeb, M., & Ghouti, L.  (2014). Software  defect  prediction  using ensemble  learning  on  selected  features. INFORMATION  AND  SOFTWARE TECHNOLOGY. https://doi.org/10.1016/j.infsof.2014.07.005

Lehtinen, T. O. A., Mäntylä, M. V, Vanhanen, J., Itkonen,  J.,  &  Lassenius,  C.  (2014). Perceived  causes  of  software  project failures  –  An  analysis  of  their relationships.  Information  and  Software Technology,  56(6),  623–643. https://doi.org/10.1016/j.infsof.2014.01.015

Lessmann, S., Member, S., Baesens, B., Mues, C., &  Pietsch,  S.  (2008).  Benchmarking Classification Models for Software Defect Prediction :  A  Proposed  Framework  and Novel Findings. 34(4), 485–496.

Mantas,  C.  J.,  &  Abellán,  J.  (2014).  Expert Systems with Applications Credal-C4 . 5 : Decision  tree  based  on  imprecise probabilities  to  classify  noisy  data. EXPERT  SYSTEMS  WITH  APPLICATIONS, 41(10),  4625–4637. https://doi.org/10.1016/j.eswa.2014.01.017

Ming,  C.,  Guoqing,  W.  U.,  Mengting,  Y.,  & Hongyan,  W.  A.  N.  (2016).  Semisupervised  Software  Defect  Prediction Using  Task-Driven  Dictionary  Learning ∗. 25(6). https://doi.org/10.1049/cje.2016.08.034

Strate,  J.  D.,  &  Laplante,  P.  A.  (2013).  A Literature Review of Research in Software Defect Reporting. 62(2), 444–454.

Wahono,  R.  S.  (2015).  A  Systematic  Literature Review  of  Software  Defect  Prediction : Research Trends , Datasets , Methods and Frameworks. 1(1).

Wu, F., Jing, X., Sun, Y., Sun, J., Huang, L., Cui, F.,…  Prediction,  A.  S.  D.  (2018).  CrossProject  and  Within-Project Semisupervised  Software  Defect Prediction : A Unified Approach. 1–17.

Yap,  B.  W.,  Rani,  K.  A.,  Aryani,  H.,  Rahman,  A., Fong, S.,  Khairudin, Z., & Abdullah, N. N. (2014).  An  Application  of  Oversampling  , Undersampling , Bagging and Boosting in Handling  Imbalanced  Datasets.  13–23. https://doi.org/10.1007/978-981-4585-18-7