PENERAPAN PARTICLE SWARM OPTIMIZATION (PSO) UNTUK SELEKSI FITUR PADA KLASIFIKASI KONTEN BERITA DIGITAL BAHASA INDONESIA MENGGUNAKAN SUPPORT VECTOR MACHINES (SVM)

research
  • 12 Nov
  • 2021

PENERAPAN PARTICLE SWARM OPTIMIZATION (PSO) UNTUK SELEKSI FITUR PADA KLASIFIKASI KONTEN BERITA DIGITAL BAHASA INDONESIA MENGGUNAKAN SUPPORT VECTOR MACHINES (SVM)

Banyak instansi yang bergerak dalam penyaluran informasi atau berita sudah mulai menggunakan sistem berbasis web untuk menyampaikan berita secara up to date. Namun, dalam membagi berita ke dalam kategori-kategori tersebut untuk saat ini masih dilakukkan secara manual, sehingga sangat merepotkan dan juga dapat memakan waktu yang lama. Dari beberapan teknik tersebut yang paling sering digunakan untuk klasifikasi konten berita adalah Support Vector Machine (SVM). SVM memiliki kelebihan yaitu mampu mengidentifikasi hyperplane terpisah yang memaksimalkan margin antara dua kelas atau lebih yang berbeda. Pemilihan fitur sekaligus penyetingan parameter di SVM secara signifikan mempengaruhi hasil akurasi klasifikasi. Oleh karena itu, dalam penelitian ini digunakan penggabungan metode pemilihan fitur, yaitu Particle Swarm Optimization agar bisa meningkatkan akurasi pengklasifikasi Support Vector Machine. Penelitian ini menghasilkan klasifikasi teks dalam bentuk kategori ekonomi, otomotif, teknologi dan olahraga dari konten berita digital. Pengukuran berdasarkan akurasi Support Vector Machine sebelum dan sesudah penambahan metode pemilihan fitur. Evaluasi dilakukan menggunakan 10 fold cross validation. Sedangkan pengukuran akurasi diukur dengan confusion matrix. Hasil penelitian menunjukan peningkatan akurasi Support Vector Machine dari 68.47% menjadi 95.50% 

Unduhan

 

REFERENSI

Alsaleem, S. (2011). Automated Arabic Text Categorization Using SVM and NB. Int. Arab J. E-Technol., 2(2), 124–128.

Al-tahrawi, M. M. (2015). Arabic Text Categorization Using Logistic Regression, (May), 71–78.

Azrifah, M., & Murad, A. (2007). Word Similarity for Document Grouping using Soft Computing, 7(8), 20–28.

Basari, A. S. H., Hussin, B., Ananta, I. G. P., & Zeniarja, J. (2013). Opinion mining of movie review using hybrid method of support vector machine and particle swarm optimization. Procedia Engineering, 53, 453–462.

Chou, J. S., Cheng, M. Y., Wu, Y. W., & Pham, A. D. (2014). Optimizing parameters of support vector machine using fast messy genetic algorithm for dispute classification. Expert Systems with Applications, 41(8), 3955–3964.

Cios, K. J., Pedrycz, W., Swiniarski, R. W., & Kurgan, L. A. (2007). Data Mining

A Knowledge Discovery Approach. Springer.

 

Feldman,  R.,  &  Sanger,  J.  (2007).  The  Text  Mining  Handbook  Advanced

Approaches  in  Analyzing  Unstructured  Data.  Cambridge:  Cambridge

University Press.

Gorunescu, F. (2011). Data Mining Concept Model Technique.

Han, J., & Kamber, M. (2006). Data Mining: Concepts and Techniques. Soft Computing (Vol. 54).

Haupt, S. E. (2004). Practical Genetic Algorithms.

Janpla, S. (2014). The Effectiveness Of Automated Thai Documents Categorization Based On Machine, 66(1).

Kaizhu Huang, Haiqin Yang, Irwin King, M. L. (2008). Advanced Topics in Science and Technology in China.

Kaur, H. (2013). Online News Classification : A Review, 7–9.

Krishnalal, G., Rengarajan, S. B., & Srinivasagan, K. G. (2010). A New Text Mining Approach Based on HMM-SVM for Web News Classification. International Journal of Computer Applications, 1(19), 103–109.

Lee, C.-H., & Yang, H.-C. (2009). Construction of supervised and unsupervised learning systems for multilingual text categorization. Expert Systems with Applications, 36(2), 2400–2410.

Lin, S.-W., Ying, K.-C., Chen, S.-C., & Lee, Z.-J. (2008). Particle swarm optimization for parameter determination and feature selection of support vector machines. Expert Systems with Applications, 35(4), 1817–1824.

Liu, Y., Wang, G., Chen, H., & Dong, H. (2011). An improved particle swarm optimization for feature selection. Journal of Bionic …, 8, 392–397.

Mahinovs, A. Tiwarigton, a. (2007). Text Classification Method Review. Decision Engineering Report Series, (April).

Maimon, O. (2010). Data Mining And Knowledge Discovery Handbook. New York Dordrecht Heidelberg London: Springer.

Manning, C. D., Ragnavan, P., & Schutze, H. (2008). An Introduction to Information Retreival. IEEE Photonics Technology Letters, 21(8), C3–C3.

Polettini,  N.  (2004).  The  Vector  Space  Model  in  Information  Retrieval  -  Term Weighting Problem. 1-9.

Sebastiani, F. (2001). Machine Learning in Automated Text Categorization.

W.Berry, Michael(University of Tennessee, U., & Kogan, Jacob(University of Maryland Baltimore Country, U. (2010). Text Mining Application and Theory.

Witten, I. H., Frank, E., & Hall, M. a. (2011). Data Mining Practical Machine Learning Tools and Techniques.