KOMPARASI ALGORITMA NAIVE BAYES DAN ALGORITMA SUPPORT VECTOR MACHINES UNTUK SENTIMENT ANALYSIS REVIEW HOTEL MENGGUNAKAN CHARACTER N-GRAM

research
  • 29 Dec
  • 2021

KOMPARASI ALGORITMA NAIVE BAYES DAN ALGORITMA SUPPORT VECTOR MACHINES UNTUK SENTIMENT ANALYSIS REVIEW HOTEL MENGGUNAKAN CHARACTER N-GRAM

Pariwisata merupakan salah satu objek yang berpeluang besar untuk dikembangkan dan dipromosikan melalui website. Hotel merupakan salah satu produk pariwisata yang sangat penting untuk dipertimbangkan baik dari segi fasilitas, pelayanan ataupun jarak tempuh perjalanan wisata. Saat ini sudah banyak website wisata yang menyediakan fasilitas untuk pengguna internet menuliskan opini dan pengalaman pribadinya secara online. Sebelum memutuskan untuk menentukan hotel yang akan dipilih, sebaiknya pengunjung membaca opini atau hasil review dari pengalaman pengunjung lain. Hal ini tentu membutuhkan waktu yang cukup lama. Analisa sentimen atau opinion mining merupakan salah satu solusi mengatasi masalah untuk mengelompokan opini atau review menjadi opini positif atau negatif secara otomatis. Teknik yang digunakan dalam penelitian ini adalah Naive Bayes dan Support Vector Machines (SVM). Naive Bayes memiliki kelebihan yaitu sederhana, cepat dan memiliki akurasi yang tinggi. Sedangkan SVM mampu mengidentifikasi hyperplane terpisah yang memaksimalkan margin antara dua kelas yang berbeda. Penerapan fitur character n-gram pada penelitian ini diharapkan dapat meningkatkan nilai akurasi kedua metode tersebut. N-gram dianggap dapat mengurangi selisih antara klasifikasi kelas positif dan negatif sehingga dapat meningkatkan rata-rata akurasi akhir suatu algoritma. Hasil klasifikasi sentimen pada penelitian ini terdiri dari dua label class, yaitu positif dan negatif. Nilai akurasi yang dihasilkan akan menjadi tolak ukur untuk mencari model pengujian terbaik untuk kasus klasifikasi sentimen. Evaluasi dilakukan menggunakan 10 fold cross validation. Pengukuran akurasi diukur dengan confusion matrix dan kurva ROC. Hasil penelitian menunjukkan peningkatan akurasi sebesar 2% untuk algoritma Naive Bayes dari 82.67% menjadi 84,67% setelah penerapan fitur character n-gram. Sedangkan nilai akurasi SVM mengalami peningkatan dari 91.33% menjadi 92%.

Unduhan

 

REFERENSI

Basari, A. S. H., Hussin, B., Ananta, I. G. P., dan Zeniarja, J. (2013). Opinion Mining of     Movie Review using Hybrid Method of Support Vector Machine and Particle Swarm     Optimization. Procedia Engineering, 53, 453–462. doi:10.1016/j.proeng.2013.02.059

Dhande, L. L., dan Patnaik, G. K., (2014). Analyzing Sentiment of Movie Review Data     using Naive Bayes Neural Classifier. International Journal of Emerging Trends &     Technology in Computer Science (IJETTCS), vol (3) Issue 4. ISSN 2278-6856.

Fawcett, Tom. (2005). An introduction to ROC Analysis. Pattern Recognition Letters,     27, 861-874. doi:10.1016/j.patrec.2005.10.010

Gencosman, B. C., Ozmutlu, H. C.,  dan Ozmutlu, S. (2014). Character n-gram     application for automatic new topic identification. Information Processing and     Management, 50, 821-856. doi:10.1016/j.ipm.2014.06.005

Ghiassi, M., Skinner, J., dan Zimbra, D. (2013). Twitter brand sentiment analysis: A     hybrid system using n-gram analysis and dynamic artificial neural network. Expert     Systems with Applications, 40, 6266-6282. doi:10.1016/j.eswa.2013.05.057

Haddi, E., Liu, X., dan Shi, Y. (2013). The Role of Text Pre-processing in Sentiment     Analysis. Procedia Computer Science, 17, 26-32. doi:10.1016/j.procs.2013.05.005

Han, J., & Kamber, M. (2007). Data Mining Concepts and Techniques. San Francisco:     Diane Cerra.

Kang, H., Yoo, J.S., dan Han, D. (2012). Senti-lexicon and improved Naive Bayes     algorithms for sentiment analysis of restaurant reviews. Expert Systems with     Applications, 39, 6000-6010. doi:10.1016/j.eswa.2011.11.107

Kontopoulos, E., Berberidis, C., Dergiades, T., dan Bassiliades, N. (2013).                   Ontology-  based sentiment analysis of twitter post. Expert Systems with     Applications, 40, 4065-4074. doi:10.1016/j.eswa.2013.01.001

Martinez, I. P., Sanchez, F. G., Garcia, R. V., Moreno, V., Fraga, A., Cervantez, J. L. S.     (2014). Feature-based opinion mining through ontologies. Expert Systems with     Applications, 41, 5995-6008. doi:10.1016/j.eswa.2014.03.022

Medhat, W., Hassan, A., dan Korashy, H. (2014). Sentiment analysis algorithms and     applications: A survey. Ain Shams Engineering Journal.     doi:10.1016/j.asej.2014.04.011 

Mitra, V., Wang, C. J., dan Banerjee, S. (2007). Text classification: A least square     support vector machine approach. Applied Soft Computing, 7, 908-914.     doi:10.1016/j.asoc.2006.04.002

Maimon, O. (2010). Data Mining And Knowledge Discovery Handbook. New York     Dordrecht Heidelberg London: Springer.

Moraes, R., Valiati, J. F., dan Gavião Neto, W. P. (2013). Document-level sentiment     classification: An empirical comparison between SVM and ANN. Expert Systems     with Applications, 40(2), 621–633. doi:10.1016/j.eswa.2012.07.059

Patil, G., Galande, V., Kekan, V., dan Dange, K. (2014). Sentiment Analysis using     Support Vector Machine. International Journal of Innovative Research in Computer     and Communication Engineering.

Taylor, E. M., Velasquez, J. D., Marquez, F. B., dan Matsuo, Y., (2013). Indentifying     Customer Preferences about Tourism Products using an AspectBased Opinion     Mining Approach. Procedia Computer Science, 22, 182-191.     doi:10.1016/j.procs.2013.09.094

Witten, H. I., Frank, E., & Hall, M. A. (2011). Data Mining Practical Machine Learning     Tools And Technique. Burlington: Elsevier Inc

Ye, Q., Zhang, Z., dan Law, R. (2009). Sentiment classification of online reviews to     travel destinations by supervised machine learning approaches. Expert Systems     with Applications, 36(3), 6527–6535. doi:10.1016/j.eswa.2008.07.035

Zhang, L., Hua, K., Wang, H., Qian, G., dan Zhang, L. (2014). Sentiment Analysis on     Reviews of Mobile Users. Procedia Computer Science, 34, 458– 465.     doi:10.1016/j.procs.2014.07.013