Klasifikasi Pesan SMS Menggunakan Metode TF-IDF dan Support Vector Machine
DOI:
https://doi.org/10.29407/9y2vn411Keywords:
Sms Spam, TF-IDF, Support Vector Machine, Klasifikasi TeksAbstract
Perkembangan teknologi komunikasi digital membuat layanan pesan singkat (SMS) tetap banyak digunakan karena sifatnya yang sederhana dan tidak memerlukan koneksi internet, namun tingginya penyebaran pesan spam seperti penipuan dan promosi yang tidak diinginkan menimbulkan risiko keamanan bagi pengguna. Pesan-pesan tersebut sering memanfaatkan variasi bahasa sehingga sulit disaring secara manual, sehingga diperlukan sistem deteksi otomatis yang mampu mengidentifikasi pola teks secara akurat. Penelitian ini menawarkan solusi dengan membangun sistem deteksi SMS spam menggunakan metode Term Frequency–Inverse Document Frequency (TF-IDF) untuk mengekstraksi fitur penting dari teks dan algoritma Support Vector Machine (SVM) sebagai model klasifikasi utama. Dataset yang digunakan terdiri dari 1.143 pesan SMS berbahasa Indonesia yang terbagi dalam tiga kategori, yaitu Normal, Penipuan, dan Promo. Proses penelitian meliputi tahapan praproses teks, pembobotan TF-IDF, pelatihan model SVM, serta evaluasi performa menggunakan metrik precision, recall, F1-score, dan akurasi. Hasil pengujian menunjukkan bahwa model SVM mampu mengklasifikasikan pesan dengan akurasi 92%, dengan precision, recall, dan F1-score berada pada kisaran 0.84 hingga 0.95 pada ketiga kelas. Sistem ini kemudian diimplementasikan dalam bentuk aplikasi web yang mudah digunakan, sehingga dapat membantu masyarakat mendeteksi pesan berbahaya secara cepat, akurat, dan praktis
Downloads
References
[1] T. Fajriah and E. R. Ningsih, “Pengaruh Teknologi Komunikasi Terhadap Interaksi Sosial di Era Digital,” Merdeka Indonesia Journal International (MIJI), vol. 4, no. 1, pp. 149–158, 2024, [Online]. Available: (PDF lokal)
[2] R. Deddy, H. Lumbantobing, E. Melati Manalu, D. Sartika, P. Sitinjak, and T. W. Manurung, “Roy Deddy Hasiholan Lumban Tobing: Rancangan Aplikasi Mobile Pendeteksi Spam… Sejarah penerimaan,” 2021.
[3] L. Mamoto, “PERANAN HUKUM PIDANA DALAM MENANGGULANGI PENIPUAN LEWAT SMS SERTA PENEGAKAN HUKUMNYA 1 Oleh: Lavinia Mamoto 2,” 2016. [Online]. Available: www.gebyartelkomsel.com
[4] M. Spam et al., “Understanding Spam on the Digitalization of the Sei Balai Plantation Village Community, Sei Balai District, Batubara Regency,” 2023. [Online]. Available: https://jurnal.unity-academy.sch.id/index.php/japamas151
[5] M. B. M. Amin et al., “Deteksi Spam Berbahasa Indonesia Berbasis Teks Menggunakan Model Bert,” Jurnal Teknologi Informasi dan Ilmu Komputer, vol. 11, no. 6, pp. 1291–1302, Dec. 2024, doi: 10.25126/jtiik.2024118121.
[6] E. I. Hanif et al., “Malay SMS Spam Detection Tool Using Keyword Filtering Technique,” in Journal of Physics: Conference Series, IOP Publishing Ltd, Mar. 2021. doi: 10.1088/1742-6596/1793/1/012064.
[7] A. Wahid, M. Baharulloh, R. Kahfiansyah, T. Abrilianto, A. Saifudin, and S. Mulyati, “Identifikasi SMS Spam Menggunakan Metode Naive Bayes,” vol. 6, no. 3, pp. 536–539, 2021, doi: 10.32493/informatika.v6i3.11558.
[8] I. Fitriyanto, T. Radillah, L. Tambunan, and A. Fauziyyah, “IMPLEMENTASI METODE RANDOM FOREST PADA TEXT MINING UNTUK KLASIFIKASI SMS SPAM MENGGUNAKAN PYTHON,” Manajemen dan Komputer, vol. 17, no. 1, pp. 2580–3042, 2025.
[9] D. Irawan, E. B. Perkasa, Y. Yurindra, D. Wahyuningsih, and E. Helmud, “Perbandingan Klassifikasi SMS Berbasis Support Vector Machine, Naive Bayes Classifier, Random Forest dan Bagging Classifier,” Jurnal Sisfokom (Sistem Informasi dan Komputer), vol. 10, no. 3, pp. 432–437, Dec. 2021, doi: 10.32736/sisfokom.v10i3.1302.
[10] G. Sai Sravya and G. Pradeepini, “Mobile Sms Spam Filter Techniques Using Machine Learning Techniques,” 2020, [Online]. Available: www.ijstr.org
[11] “PENERAPAN METODE NAÏVE BAYES UNTUK SISTEM KLASIFIKASI SMS PADA SMARTPHONE ANDROID.”
[12] N. Arifin, U. Enri, and N. Sulistiyowati, “STRING (Satuan Tulisan Riset dan Inovasi Teknologi) PENERAPAN ALGORITMA SUPPORT VECTOR MACHINE (SVM) DENGAN TF-IDF N-GRAM UNTUK TEXT CLASSIFICATION,” 2021.
[13] L. N. Lota and B. M. M. Hossain, “A Systematic Literature Review on SMS Spam Detection Techniques,” International Journal of Information Technology and Computer Science, vol. 9, no. 7, pp. 42–50, Jul. 2017, doi: 10.5815/ijitcs.2017.07.05.
[14] A. M. Argina, “Indonesian Journal of Data and Science Penerapan Metode Klasifikasi K-Nearest Neigbor pada Dataset Penderita Penyakit Diabetes,” vol. 1, no. 2, pp. 29–33, 2020.
[15] W. P. Anggraini and M. S. Utami, “KLASIFIKASI SENTIMEN MASYARAKAT TERHADAP KEBIJAKAN KARTU PEKERJA DI INDONESIA,” Faktor Exacta, vol. 13, no. 4, p. 255, Feb. 2021, doi: 10.30998/faktorexacta.v13i4.7964.
Downloads
Published
Issue
Section
License
Copyright (c) 2026 M. Nabil Pratama, Danny Putra Ardianto

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Authors who publish with this journal agree to the following terms:
- Copyright on any article is retained by the author(s).
- The author grants the journal, right of first publication with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgment of the work’s authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal’s published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgment of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work.
- The article and any associated published material is distributed under the Creative Commons Attribution-ShareAlike 4.0 International License





