Banyak instansi yang bergerak dalam penyaluran informasi atau berita sudah mulai menggunakan sistem berbasis web untuk menyampaikan berita secara up to date. Namun, dalam membagi berita ke dalam kategori-kategori tersebut untuk saat ini masih dilakukkan secara manual, sehingga sangat merepotkan dan juga dapat memakan waktu yang lama. Dari beberapan teknik tersebut yang paling sering digunakan untuk klasifikasi konten berita adalah Support Vector Machine (SVM). SVM memiliki kelebihan yaitu mampu mengidentifikasi hyperplane terpisah yang memaksimalkan margin antara dua kelas atau lebih yang berbeda. Pemilihan fitur sekaligus penyetingan parameter di SVM secara signifikan mempengaruhi hasil akurasi klasifikasi. Oleh karena itu, dalam penelitian ini digunakan penggabungan metode pemilihan fitur, yaitu Particle Swarm Optimization agar bisa meningkatkan akurasi pengklasifikasi Support Vector Machine. Penelitian ini menghasilkan klasifikasi teks dalam bentuk kategori ekonomi, otomotif, teknologi dan olahraga dari konten berita digital. Pengukuran berdasarkan akurasi Support Vector Machine sebelum dan sesudah penambahan metode pemilihan fitur. Evaluasi dilakukan menggunakan 10 fold cross validation. Sedangkan pengukuran akurasi diukur dengan confusion matrix. Hasil penelitian menunjukan peningkatan akurasi Support Vector Machine dari 68.47% menjadi 95.50%
Full Tesis
Alsaleem, S. (2011). Automated Arabic
Text Categorization Using SVM and NB. Int. Arab J. E-Technol., 2(2),
124–128.
Al-tahrawi, M. M. (2015). Arabic Text
Categorization Using Logistic Regression, (May), 71–78.
Azrifah, M., & Murad, A. (2007). Word
Similarity for Document Grouping using Soft Computing, 7(8), 20–28.
Basari, A. S. H., Hussin, B., Ananta, I. G.
P., & Zeniarja, J. (2013). Opinion mining of movie review using hybrid
method of support vector machine and particle swarm optimization. Procedia
Engineering, 53, 453–462.
Chou, J. S., Cheng, M. Y., Wu, Y. W., &
Pham, A. D. (2014). Optimizing parameters of support vector machine using fast
messy genetic algorithm for dispute classification. Expert Systems with
Applications, 41(8), 3955–3964.
Cios,
K. J., Pedrycz, W., Swiniarski, R. W., & Kurgan, L. A. (2007). Data Mining
A Knowledge
Discovery Approach. Springer.
Feldman, R.,
& Sanger, J.
(2007). The Text
Mining Handbook Advanced
Approaches in
Analyzing Unstructured Data.
Cambridge: Cambridge
University Press.
Gorunescu, F. (2011). Data Mining Concept
Model Technique.
Han, J., & Kamber, M. (2006). Data
Mining: Concepts and Techniques. Soft Computing (Vol. 54).
Haupt, S. E. (2004). Practical Genetic
Algorithms.
Janpla, S. (2014). The Effectiveness Of
Automated Thai Documents Categorization Based On Machine, 66(1).
Kaizhu Huang, Haiqin Yang, Irwin King, M. L.
(2008). Advanced Topics in Science and Technology in China.
Kaur, H. (2013). Online News Classification :
A Review, 7–9.
Krishnalal, G., Rengarajan, S. B., &
Srinivasagan, K. G. (2010). A New Text Mining Approach Based on HMM-SVM for Web
News Classification. International Journal of Computer Applications, 1(19),
103–109.
Lee, C.-H., & Yang, H.-C. (2009).
Construction of supervised and unsupervised learning systems for multilingual
text categorization. Expert Systems with Applications, 36(2),
2400–2410.
Lin, S.-W., Ying, K.-C., Chen, S.-C., &
Lee, Z.-J. (2008). Particle swarm optimization for parameter determination and
feature selection of support vector machines. Expert Systems with
Applications, 35(4), 1817–1824.
Liu, Y., Wang, G., Chen, H., & Dong, H.
(2011). An improved particle swarm optimization for feature selection. Journal
of Bionic …, 8, 392–397.
Mahinovs, A. Tiwarigton, a. (2007). Text
Classification Method Review. Decision Engineering Report Series,
(April).
Maimon, O. (2010). Data Mining And Knowledge Discovery Handbook. New York Dordrecht
Heidelberg London: Springer.
Manning, C. D., Ragnavan, P., & Schutze,
H. (2008). An Introduction to Information Retreival. IEEE Photonics
Technology Letters, 21(8), C3–C3.
Polettini, N.
(2004). The Vector
Space Model in
Information Retrieval - Term
Weighting Problem. 1-9.
Sebastiani, F. (2001). Machine Learning in
Automated Text Categorization.
W.Berry, Michael(University of Tennessee, U.,
& Kogan, Jacob(University of Maryland Baltimore Country, U. (2010). Text
Mining Application and Theory.
Witten, I. H., Frank, E., & Hall, M. a.
(2011). Data Mining Practical Machine Learning Tools and Techniques.