Cuaca adalah keadaan udara pada saat tertentu dan pada wilayah tertentu yang relatif sempit dan pada jangka waktu yang singkat. Permasalahan yang terdapat pada prakiraan cuaca yaitu banyaknya atribut dan parameter penentu cuaca yang akan mengurangi kinerja dari algoritma dan menyebabkan akurasi menjadi rendah Hal ini disebut dengan curse of dimensionality. Hal lain yang dapat menyebabkan akurasi sebuah algoritma tidak maksimal yaitu adanya ketidakseimbangan kelas antara kelas mayoritas dan kelas minoritas. Hal ini disebut dengan imbalance class. Data penelitian yang digunakan didapat dari situs World Weather Online untuk data historis wilayah Bekasi dari tahun 2015 sampai dengan tahun 2016 yang diambil setiap 3 jam sekali setiap harinya. Datasets terdiri dari 11 atribut dan 1 kelas (multinomial) dengan jumlah data sebanyak 5848 record data. Algoritma klasifikasi data mining yang digunakan pada penelitian yaitu algoritma decision tree C4.5 dimana algoritma tersebut digunakan untuk mendapatkan pola klasifikasi cuaca. Metode Particle Swarm Optimization (PSO) digunakan untuk mengoptimalkan fitur yang ada pada datasets dan penggunaan metode AdaBoost digunakan untuk mengatasi ketidakseimbangan kelas yang terjadi di dalam datasets. Pengujian model algoritma menggunakan model validasi 10-fold cross validation menghasilkan akurasi algoritma decision tree C4.5 yang cukup baik yaitu 71.29%, setelah dioptimasikan dan di-boosting meningkat menjadi kurang lebih sebesar 72.50%. Nilai koefisien kappa untuk keseluruhan algoritma termasuk ke dalam kategori kuat dikarenakan memiliki nilai lebih dari 0.60.
7. Full Thesis Adhika