KLASIFIKASI EMOSI TEKS PENGGUNA TWITTER MENGGUNAKAN METODE SVM
PDF

Keywords

Klasifikasi
Twitter
SVM
PCA
SMOTE
FastText

How to Cite

KLASIFIKASI EMOSI TEKS PENGGUNA TWITTER MENGGUNAKAN METODE SVM. (2025). Prosiding SEMNAS INOTEK (Seminar Nasional Inovasi Teknologi), 9(3), 1999-2007. https://doi.org/10.29407/hq9jyy12

Abstract

Media sosial seperti Twitter telah berkembang menjadi sumber data penting untuk mengidentifikasi emosi pengguna. Dengan menggunakan algoritma Support Vector Machine (SVM), penelitian ini bertujuan untuk membangun sistem klasifikasi emosi teks pengguna Twitter. Dataset yang digunakan berasal dari Kaggle dan memiliki delapan label emosi. Setelah itu, tahapan preprocessing teks, representasi kata menggunakan FastText, penyederhanaan dimensi menggunakan Principal Component Analysis (PCA), dan penyeimbangan data dengan Synthetic Minority Oversampling Technique (SMOTE) dilakukan. Setelah itu, data dibagi secara stratified untuk menjaga proporsi label, lalu dilakukan pelatihan model dengan SVM dan pengaturan hyperparameter dengan GridSearchCV. Hasil evaluasi menunjukkan bahwa, dibandingkan dengan kernel linear dan polynomial, kernel Radial Basis Function (RBF) memiliki akurasi tertinggi sebesar 85% dengan skor macro F1 yang juga tinggi. Penelitian menunjukkan bahwa kombinasi metode FastText, PCA, SMOTE, dan SVM meningkatkan kinerja klasifikasi. Penelitian ini membantu mengembangkan sistem analisis emosi berbasis teks dan menunjukkan bagaimana hal itu dapat digunakan untuk berbagai kebutuhan analitik media sosial.

PDF

References

[1] K. Arifin and S. I. Al Idrus, ‘Klasifikasi Emosi Pengguna Twitter Terhadap Bakal Calon Presiden Pada Pemilu 2024 Menggunakan Algoritma Naïve Bayes’, Februari, vol. 23, no. 1, pp. 37–45, Feb. 2024, doi: 10.53513/jis.v23i1.9558.

[2] A. N. Sutranggono, ‘KLASIFIKASI EMOSI PADA CUITAN DI TWITTER DENGAN PRINCIPAL COMPONENT ANALYSIS DAN SUPPORT VECTOR MACHINE’, Jurnal Ilmiah Matematika, vol. 10, no. 1, pp. 13–20, 2022.

[3] F. Abdullah, S. F. Pane, and R. Habibi, ‘DETEKSI EMOSI PADA TEKS BERBAHASA INDONESIA MENGGUNAKAN PENDEKATAN ENSEMBLE’, JTT (Jurnal Teknologi Terapan), vol. 10, no. 2, pp. 80–90, Sep. 2024, doi: 10.31884/jtt.v10i2.551.

[4] J. Ranganathan and A. Tzacheva, ‘Emotion Mining in Social Media Data’, Procedia Comput Sci, vol. 159, pp. 58–66, 2019, doi: 10.1016/j.procs.2019.09.160.

[5] E. Junianto, M. Puspitasari, S. I. Zakaria, T. Arifin, and I. W. P. Agung, ‘Klasifikasi Emosi pada Teks Berbahasa Inggris Menggunakan Pendekatan Ensemble Bagging’, Jurnal Nasional Teknik Elektro dan Teknologi Informasi, vol. 13, no. 4, pp. 272–281, Nov. 2024, doi: 10.22146/jnteti.v13i4.14440.

[6] D. Ardiada, M. Sudarma, and D. Giriantari, ‘Text Mining pada Sosial Media untuk Mendeteksi Emosi Pengguna Menggunakan Metode Support Vector Machine dan K-Nearest Neighbour’, Majalah Ilmiah Teknologi Elektro, vol. 18, no. 1, pp. 55–60, Mar. 2019, doi: 10.24843/MITE.2019.v18i01.P08.

[7] A. N. Rohman, E. Utami, and S. Raharjo, ‘Deteksi Kondisi Emosi pada Media Sosial Menggunakan Pendekatan Leksikon dan Natural Language Processing’, Eksplora Informatika, vol. 9, no. 1, pp. 70–76, Sep. 2019, doi: 10.30864/eksplora.v9i1.277.

[8] N. I. Raharko and Y. Yamasari, ‘Klasifikasi Emosi Ulasan Produk E-Commerce Menggunakan Support Vector Machine’, Journal of Informatics and Computer Science, vol. 6, no. 2, pp. 606–616, 2024, doi: 10.26740/jinacs.v6n03.p606-616.

[9] A. Ristyawan, A. Nugroho, and T. K. Amarya, ‘Optimasi Preprocessing Model Random Forest Untuk Prediksi Stroke’, Jurnal Teknik Informatika dan Sistem Informasi, vol. 12, no. 1, pp. 29–44, Mar. 2025, doi: 10.35957/jatisi.v12i1.9587.

[10] A. Putri et al., ‘Komparasi Algoritma K-NN, Naive Bayes dan SVM untuk Prediksi Kelulusan Mahasiswa Tingkat Akhir’, Institut Riset dan Publikasi Indonesia (IRPI) MALCOM: Indonesian Journal of Machine Learning and Computer Science Journal Homepage, vol. 3, no. 1, pp. 20–26, Apr. 2023, doi: 10.57152/malcom.v3i1.610.

[11] M. M. Kusairi and S. Agustian, ‘SVM Method with FastText Representation Feature for Classification of Twitter Sentiments Regarding the Covid-19 Vaccination Program’, Jurnal Teknologi Informasi & Komunikasi Digital Zone, vol. 13, no. 2, pp. 140–150, May 2022, doi: 10.31849/digitalzone.v13i2.

[12] A. S. Ritonga and I. Muhandhis, ‘TEKNIK DATA MINING UNTUK MENGKLASIFIKASIKAN DATA ULASAN DESTINASI WISATA MENGGUNAKAN REDUKSI DATA PRINCIPAL COMPONENT ANALYSIS (PCA)’, Jurnal Ilmiah Edutic, vol. 7, no. 2, pp. 124–133, 2021, doi: 10.21107/edutic.v7i2.9247.

[13] M. Sulistiyono, Y. Pristyanto, S. Adi, and G. Gumelar, ‘Implementasi Algoritma Synthetic Minority Over-Sampling Technique untuk Menangani Ketidakseimbangan Kelas pada Dataset Klasifikasi’, SISTEMASI: Jurnal Sistem Informasi, vol. 10, no. 2, pp. 445–459, Jun. 2021, doi: 10.32520/stmsi.v10i2.1303.

[14] Derisma and F. Febrian, ‘Perbandingan Teknik Klasifikasi Neural Network, Support Vector Machine, dan Naive Bayes dalam Mendeteksi Kanker Payudara’, BINA INSANI ICT JOURNAL, vol. 7, no. 1, pp. 53–62, Jun. 2020, doi: 10.51211/biict.v7i1.1343.

[15] Z. M. E. Darmawan and A. F. Dianta, ‘Implementasi Optimasi Hyperparameter GridSearchCV Pada Sistem Prediksi Serangan Jantung Menggunakan SVM’, Teknologi: Jurnal Ilmiah Sistem Informasi, vol. 13, no. 1, pp. 8–15, Jan. 2023, doi: 10.26594/teknologi.v13i1.3098.

Creative Commons License

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Copyright (c) 2025 Anita Fatmawati, Umul Latifah, Arinda Sekar Bilbina Suryadi, Tasbi Khatuz Zuhriya