KLASIFIKASI DATA CUACA DENGAN OPTIMASI DECISION TREE BERBASIS PARTICLE SWARM OPTIMIZATION DAN ADABOOST

research
  • 27 Dec
  • 2021

KLASIFIKASI DATA CUACA DENGAN OPTIMASI DECISION TREE BERBASIS PARTICLE SWARM OPTIMIZATION DAN ADABOOST

Cuaca adalah keadaan udara pada saat tertentu dan pada wilayah tertentu yang relatif sempit dan pada jangka waktu yang singkat. Permasalahan yang terdapat pada prakiraan cuaca yaitu banyaknya atribut dan parameter penentu cuaca yang akan mengurangi kinerja dari algoritma dan menyebabkan akurasi menjadi rendah Hal ini disebut dengan curse of dimensionality. Hal lain yang dapat menyebabkan akurasi sebuah algoritma tidak maksimal yaitu adanya ketidakseimbangan kelas antara kelas mayoritas dan kelas minoritas. Hal ini disebut dengan imbalance class. Data penelitian yang digunakan didapat dari situs World Weather Online untuk data historis wilayah Bekasi dari tahun 2015 sampai dengan tahun 2016 yang diambil setiap 3 jam sekali setiap harinya. Datasets terdiri dari 11 atribut dan 1 kelas (multinomial) dengan jumlah data sebanyak 5848 record data. Algoritma klasifikasi data mining yang digunakan pada penelitian yaitu algoritma decision tree C4.5 dimana algoritma tersebut digunakan untuk mendapatkan pola klasifikasi cuaca. Metode Particle Swarm Optimization (PSO) digunakan untuk mengoptimalkan fitur yang ada pada datasets dan penggunaan metode AdaBoost digunakan untuk mengatasi ketidakseimbangan kelas yang terjadi di dalam datasets. Pengujian model algoritma menggunakan model validasi 10-fold cross validation menghasilkan akurasi algoritma decision tree C4.5 yang cukup baik yaitu 71.29%, setelah dioptimasikan dan di-boosting meningkat menjadi kurang lebih sebesar 72.50%. Nilai koefisien kappa untuk keseluruhan algoritma termasuk ke dalam kategori kuat dikarenakan memiliki nilai lebih dari 0.60. 

Unduhan

 

REFERENSI

  1. Altman, D. G. (1991). Practical Statistics for Medical Research - Douglas G. Altman - Google Books. Chapman and Hall/CRC.
  2. Breinman, L. (2001). Random forests. Machine Learning (Vol. 45). https://doi.org/10.1186/1478-7954-9-29
  3. Criminisi, A, Shotton, J. (2013). Decision Forests for Computer Vision and Medical Image Analysis. Decision Forests for Computer Vision and Medical Image Analysis. London: Springer-verlag. https://doi.org/10.1007/978-1-4471-4929-3
  4. Eberhart, R. C., & Shi, Y. (2001). Particle Swarm Optimization: Developments, Application and Resources. IEEE.
  5. Efrain Turban, J. E. A. & T.-P. L. (2005). Decision Support Systems and Intelligent Systems ( Sistem Pendukung Keputusan dan Sistem Cerdas. Yogyakarta: Penerbit Andi.
  6. Goronescu, F. (2011). Data Mining: Concepts, Models and Techniques. Verlag Berlin Heidel: Springer.
  7. Han, J., Kamber, M., & Pei, J. (2012). Data Mining Concepts and Techniques 3rd Edition. USA: Morgan Kauffman.
  8. Joshi, A., Kamble, B., Joshi, V., Kajale, K., & Dhange, N. (2015). Weather Forecasting and Climate Changing Using Data Mining Application Rain Effects on Speed. International Journal Of Advanced Research in Computer and Communication Engineering, 4(3), 19–21.
  9. Kennedy, J., & Eberhart, R. (1995). Particle swarm optimization. Neural Networks, 1995. Proceedings., IEEE International Conference on, 4, 1942–1948 vol.4. https://doi.org/10.1109/ICNN.1995.488968
  10. Kotsiantis, S., Kanellopoulos, D., & Pintelas, P. (2006). Handling imbalanced datasetss : A review. Science, 30(1), 25–36. https://doi.org/10.1007/978-0-387- 09823-4_45 Kusrini, E. T. L. (2009). Algoritma Data Mining. Yogyakarta: Penerbit Andi.
  11. Larose, D. T. (2005). Discovering knowledge in data. A John Wiley & Sons, Inc. New Jersey.
  12. Larose, D. T. (2006). Data Mining Methods and Models. A John Wiley & Sons, Inc. New Jersey.
  13. Mittal, P., & Gill, N. S. (2014). a Comparative Analysis of Classification Techniques on Medical Data Sets. International Journal of Research in Engineering and Technology, 3, 454–460.
  14. Mujiasih, S. (2011). Utilization Of Data Mining For Weather Forecasting. Jurnal Meteorologi Dan Geofisika, 12(2), 189–195.
  15. Prasetio, R. T. (2015). Penerapan Teknik Bagging Pada Algoritma Klasifikasi Untuk Mengatasi Ketidakseimbangan Kelas Datasets Medis. Informatika, II(2), 395– 403.
  16. Santosa, Budi & Willy, P. (2011). Metode Metaheuristik, Konsep dan Implementasi. Penerbit Guna Widya.
  17. Wahono, R. S., Herman, N. S., & Ahmad, S. (2014). A comparison framework of classification models for software defect prediction. Advanced Science Letters, 20(10–12), 1945–1950.
  18. Winarso, P. (2003). Pengelolaan Bencana Cuaca dan Iklim untuk masa mendatang. Indonesia: KLH. Xindong, W. K. V. (2009). The Top Ten Algorithms in Data Mining. USA: Taylor & Francis Group, LLC