Klasifikasi Pesan SMS Menggunakan Metode TF-IDF dan Support Vector Machine

Authors

  • M. Nabil Pratama Universitas Nusantara PGRI Kediri
  • Danny Putra Ardianto Universitas Nusantara PGRI Kediri

DOI:

https://doi.org/10.29407/9y2vn411

Keywords:

Sms Spam, TF-IDF, Support Vector Machine, Klasifikasi Teks

Abstract

Perkembangan teknologi komunikasi digital membuat layanan pesan singkat (SMS) tetap banyak digunakan karena sifatnya yang sederhana dan tidak memerlukan koneksi internet, namun tingginya penyebaran pesan spam seperti penipuan dan promosi yang tidak diinginkan menimbulkan risiko keamanan bagi pengguna. Pesan-pesan tersebut sering memanfaatkan variasi bahasa sehingga sulit disaring secara manual, sehingga diperlukan sistem deteksi otomatis yang mampu mengidentifikasi pola teks secara akurat. Penelitian ini menawarkan solusi dengan membangun sistem deteksi SMS spam menggunakan metode Term Frequency–Inverse Document Frequency (TF-IDF) untuk mengekstraksi fitur penting dari teks dan algoritma Support Vector Machine (SVM) sebagai model klasifikasi utama. Dataset yang digunakan terdiri dari 1.143 pesan SMS berbahasa Indonesia yang terbagi dalam tiga kategori, yaitu Normal, Penipuan, dan Promo. Proses penelitian meliputi tahapan praproses teks, pembobotan TF-IDF, pelatihan model SVM, serta evaluasi performa menggunakan metrik precision, recall, F1-score, dan akurasi. Hasil pengujian menunjukkan bahwa model SVM mampu mengklasifikasikan pesan dengan akurasi 92%, dengan precision, recall, dan F1-score berada pada kisaran 0.84 hingga 0.95 pada ketiga kelas. Sistem ini kemudian diimplementasikan dalam bentuk aplikasi web yang mudah digunakan, sehingga dapat membantu masyarakat mendeteksi pesan berbahaya secara cepat, akurat, dan praktis

Downloads

Download data is not yet available.

References

[1] T. Fajriah and E. R. Ningsih, “Pengaruh Teknologi Komunikasi Terhadap Interaksi Sosial di Era Digital,” Merdeka Indonesia Journal International (MIJI), vol. 4, no. 1, pp. 149–158, 2024, [Online]. Available: (PDF lokal)

[2] R. Deddy, H. Lumbantobing, E. Melati Manalu, D. Sartika, P. Sitinjak, and T. W. Manurung, “Roy Deddy Hasiholan Lumban Tobing: Rancangan Aplikasi Mobile Pendeteksi Spam… Sejarah penerimaan,” 2021.

[3] L. Mamoto, “PERANAN HUKUM PIDANA DALAM MENANGGULANGI PENIPUAN LEWAT SMS SERTA PENEGAKAN HUKUMNYA 1 Oleh: Lavinia Mamoto 2,” 2016. [Online]. Available: www.gebyartelkomsel.com

[4] M. Spam et al., “Understanding Spam on the Digitalization of the Sei Balai Plantation Village Community, Sei Balai District, Batubara Regency,” 2023. [Online]. Available: https://jurnal.unity-academy.sch.id/index.php/japamas151

[5] M. B. M. Amin et al., “Deteksi Spam Berbahasa Indonesia Berbasis Teks Menggunakan Model Bert,” Jurnal Teknologi Informasi dan Ilmu Komputer, vol. 11, no. 6, pp. 1291–1302, Dec. 2024, doi: 10.25126/jtiik.2024118121.

[6] E. I. Hanif et al., “Malay SMS Spam Detection Tool Using Keyword Filtering Technique,” in Journal of Physics: Conference Series, IOP Publishing Ltd, Mar. 2021. doi: 10.1088/1742-6596/1793/1/012064.

[7] A. Wahid, M. Baharulloh, R. Kahfiansyah, T. Abrilianto, A. Saifudin, and S. Mulyati, “Identifikasi SMS Spam Menggunakan Metode Naive Bayes,” vol. 6, no. 3, pp. 536–539, 2021, doi: 10.32493/informatika.v6i3.11558.

[8] I. Fitriyanto, T. Radillah, L. Tambunan, and A. Fauziyyah, “IMPLEMENTASI METODE RANDOM FOREST PADA TEXT MINING UNTUK KLASIFIKASI SMS SPAM MENGGUNAKAN PYTHON,” Manajemen dan Komputer, vol. 17, no. 1, pp. 2580–3042, 2025.

[9] D. Irawan, E. B. Perkasa, Y. Yurindra, D. Wahyuningsih, and E. Helmud, “Perbandingan Klassifikasi SMS Berbasis Support Vector Machine, Naive Bayes Classifier, Random Forest dan Bagging Classifier,” Jurnal Sisfokom (Sistem Informasi dan Komputer), vol. 10, no. 3, pp. 432–437, Dec. 2021, doi: 10.32736/sisfokom.v10i3.1302.

[10] G. Sai Sravya and G. Pradeepini, “Mobile Sms Spam Filter Techniques Using Machine Learning Techniques,” 2020, [Online]. Available: www.ijstr.org

[11] “PENERAPAN METODE NAÏVE BAYES UNTUK SISTEM KLASIFIKASI SMS PADA SMARTPHONE ANDROID.”

[12] N. Arifin, U. Enri, and N. Sulistiyowati, “STRING (Satuan Tulisan Riset dan Inovasi Teknologi) PENERAPAN ALGORITMA SUPPORT VECTOR MACHINE (SVM) DENGAN TF-IDF N-GRAM UNTUK TEXT CLASSIFICATION,” 2021.

[13] L. N. Lota and B. M. M. Hossain, “A Systematic Literature Review on SMS Spam Detection Techniques,” International Journal of Information Technology and Computer Science, vol. 9, no. 7, pp. 42–50, Jul. 2017, doi: 10.5815/ijitcs.2017.07.05.

[14] A. M. Argina, “Indonesian Journal of Data and Science Penerapan Metode Klasifikasi K-Nearest Neigbor pada Dataset Penderita Penyakit Diabetes,” vol. 1, no. 2, pp. 29–33, 2020.

[15] W. P. Anggraini and M. S. Utami, “KLASIFIKASI SENTIMEN MASYARAKAT TERHADAP KEBIJAKAN KARTU PEKERJA DI INDONESIA,” Faktor Exacta, vol. 13, no. 4, p. 255, Feb. 2021, doi: 10.30998/faktorexacta.v13i4.7964.

Downloads

Published

2026-01-24

How to Cite

Klasifikasi Pesan SMS Menggunakan Metode TF-IDF dan Support Vector Machine. (2026). Seminar Nasional Teknologi & Sains, 5(1), 151-160. https://doi.org/10.29407/9y2vn411

Similar Articles

11-20 of 155

You may also start an advanced similarity search for this article.