Data mining merupakan sebuah proses untuk menganalisa sebuah kasus untuk menemukan performa terbaik dari algoritma yang diuji. Salah satu cara untuk mendapatkan informasi atau pola dari kumpulan data yang besar adalah dengan menggunakan teknik-teknik dalam data mining. Ada banyak metode klasifikasi yang di gunakan untuk menghasilkan nilai akurasi yang akurat. Terdapat 5 algoritma klasifikasi yang digunakan dalam mengklasifikasi dataset blogger yaitu decision tree, Naïve bayes, k-nearest neighbour, ID3, dan CHAID. Dataset menggunakan data blogger dari UCI Machine Learning Repository.Blog adalah media yang bergantung pada teknologi informasi dan kemajuan teknologi. Penelitian ini diuji Dengan menggunakan validasi 10-fold cross validation dan uji t-test. Sehingga hasil tertinggi dari nilai akurasi yang didapat adalah sebesar 85.00% untuk algoritma KNN. Sedangkan untuk nilai AUC algoritma CHAID yang memiliki hasil tertinggi yaitu sebesar 0.758. dan dari asil uji t-test yang dilakukan bahwa algoritma ID3,CHAID dan Naive Bayes merupakan algoritma dengan performa terbaik yang diterapkan pada dataset blogger. Sedangkan untuk algoritma KNN dan C45 merupakan algoritma dengan performa yang kurang baik dengan nilai AUC 0,500%.
ANALISIS PERBANDINGAN ALGORITMA KLASIFIKASI DATA MINING UNTUK DATASET BLOGGER DENGAN RAPID MINER
Adip Alkaromi M. Komparasi Algoritma
Klasifikasi untuk Dataset Iris dengan Repid Miner. 2012.
D. Widiastuti, “Analisa Perbandingan
AlgoritmaSVM, Naive Bayes, dan Decision Tree dalam Mengklasifikasikan Serangan
(Attacks) pada Sistem Pendeteksi Intrusi,” 2012.
D. T. Larose, Discovering Knowledge in
Data: an Introduction to Data Mining. John Wiley & Sons, 2005.
E. Prasetyo, Data Mining Konsep dan
Aplikasi menggunakan Matlab.Yogyakarta: Andi Offset, 2012, p. 353.
Florin Gorunescu, Data Mining: Concepts,
Model and Techniques, Prof. Janusz Kacprzyk and Prof. Lakhmi C. Jain, Eds.
Berlin,
Gallacgher, CA. 2000. An Iterative
Approach to Classification Analysis. I. H. Witten, E. Frank, and M. A. Hall,
Data Mining: Practical Machine Learning Tools and Techniques 3rd Edition.
Elsevier, 2011.
J. Han and M. Kamber, Data Mining:
Concepts and Techniques Second Edition. Elsevier, 2006.
J. Awwalu, A. Ghazvini, and A. A. Bakar, “Performance
Comparison of Data Mining
Algorithms: A Case Study on Car Evaluation
Dataset.”
Juffinger,A., Lex, E., 2009, Cross
language Blog Mining and Trend Visualization ,WWW 2009, 2009, Madrid,
Spain.1149-1150.
Khafiizh Hastuti. Analisa Komparasi
Algoritma Klasifikasi Data Mining untuk Prediksi
Mahasiswa Non Aktif. ISBN 979-26-0255-0,2012.
Obbie, "Penerapan Algoritma
Klasifikasi Data Mining ID3 untuk Menentukan Penjurusan Siswa SMAN 6 Semarang Rizal
Amegia Saputra, “komparasi algoritma
klasifikasi data mining untuk memprediksi penyakit
tuberculosis (tb),” semin. nas. inov. dan tren snit, 2014.
Soleimanian Gharehchopogh, F., & Reza
Khaze, S. (2012). Data Mining Application for Cyber Space Users Tendency in
Blog Writing: A Case Study. International Journal of Computer Applications, 47(18),
975–888. https://doi.org/10.5120/7291-0509
Wyld,D., 2007, The Blogging Revolution: Government in the Age of Web 2.0 ,IBM
Center for The Business of Government.
Wahono, R. S., Herman, N. S., & Ahmad,
S. (2014). A comparison framework of classification models for software defect
prediction. Advanced Science Letters, 20(10–12), 1945–1950. http://doi.org/10.1166/asl.2014.5640
X. Wu, V. Kumar, J. R. Quinlan, J. Ghosh,
Q. Yang, H. Motoda, G. J. Mclachlan, A. Ng, B. Liu, P. S.Yu, Z. Z. Michael, S.
David, and J. H. Dan, Top 10 algorithms in data mining. 2007, pp. 1–37.
Zafarani,R, Jashki, M.A, Baghi,H.R ,
Ghorbani,A., 2008, A Novel Approach for Social Behavior Analysis of the
Blogosphere, springer-Verlag Berlin Heidelberg, S. Bergler (Ed.): Canadian AI,
356–367.