Implementasi Algoritma Regresi Logistik untuk Binary Classification dalam Spam SMS dan WhatsApp
PDF

Keywords

Algoritma Logistik Regresi
Klasifikasi Biner
Pembelajaran Mesin
Pesan Spam dan Ham
Python

How to Cite

Hasanah, A. N. R. ., Krestianti, R. A. ., & Wati, S. . (2023). Implementasi Algoritma Regresi Logistik untuk Binary Classification dalam Spam SMS dan WhatsApp. Prosiding SEMNAS INOTEK (Seminar Nasional Inovasi Teknologi), 7(1), 80–93. https://doi.org/10.29407/inotek.v7i1.3413

Abstract

WhatsApp merupakan layanan seperti pengiriman pesan; panggilan suara dan video; serta pengiriman dokumen dan media; telah menjadi pilihan yang sangat digemari oleh masyarakat di seluruh dunia. Meskipun demikian; aplikasi ini juga seringkali menjadi tempat penyebaran spam; yang dapat berupa penipuan; promosi; atau bentuk negatif lainnya. Meskipun terdapat berbagai upaya untuk mengklasifikasikan spam SMS berbahasa Inggris dengan menggunakan algoritma regresi logistik; namun masih sangat jarang ditemukan SMS dan WA dalam bahasa Indonesia. Oleh karena itu; penelitian ini bertujuan untuk melakukan klasifikasi biner pada data ham  dan spam menggunakan metode algoritma regresi logistik pada 10793 data; dengan 10038 ham  dan 775 spam. Penelitian ini juga menghasilkan lima matriks evaluasi yang dapat membantu memvisualisasikan hasil model yang telah dihasilkan; serta beberapa dekomposisi data untuk menemukan hasil terbaik selama proses pembuatan model; berdasarkan penelitian sebelumnya.; menghasilkan Accuracy = 7525 (0;9703593923675435); Precision = 5050 (0;9753694581280288); Recall = 8020 (0;6385542168674698); F1-score = 8020 (0;7653429602888085) dan ROC dengan nilai AUC = 7525 (0;987168100907698).

https://doi.org/10.29407/inotek.v7i1.3413
PDF

References

H. Yandhi; "Prototype E-Polling Berbasis Sms Gateway Pada Pemilihan Ketua Rw. 06 Perum. Bugel Mas Indah;" Ict Learning; vol. 3; no. 1; pp. 45-64; 2017.

A. Febriyanti; "Analisis Sentimen Persepsi Pengguna Jne Menggunakan Algoritma Naïve Bayes Classifier;" 16522259; 2018.

R. Kumari and S. K. Srivastava; "Machine Learning: A Review On Binary Classification;" International Journal Of Computer Applications; vol. 160; no. 7; 2017.

F. Syadid; "Analisis Sentimen Komentar Netizen Terhadap Calon Presiden Indonesia 2019 Dari Twitter Menggunakan Algoritma Term Frequency-Invers Document Frequency (Tf-Idf) Dan Metode Multi Layer Perceptron (Mlp) Neural Network;" BS thesis; Fakultas Sains Dan Teknologi Universitas Islam Negeri Syarif Hidayatullah Jakarta; 2019.

T. E. Sutanto; "Deteksi Berita Hoax Pada Website Turnbackhoax Dengan Menggunakan Machine Learning;" BS thesis; Fakultas Sains Dan Teknologi UIN Syarif Hidayatullah Jakarta.

S. S. Septiani; "Klasifikasi Mengkudu Berdasarkan Warna Dan Tekstur Menggunakan Metode Support Vector Machine (SVM);" dissertation; Universitas Muhammadiyah Gresik; 2016.

K. W. Patunduk et al.; "Pemodelan Pasien Covid-19 Di Kota Palopo Dengan Regresi Logistik (Studi Perbandingan Regresi Logistik Dan Analisis Survival);" Proximal: Jurnal Penelitian Matematika Dan Pendidikan Matematika; vol. 5; no. 2; pp. 260-269; 2022.

H. Yan et al.; "Mfe-Net: Multi-Type Feature Enhancement Net For Retinal Blood Vessel Segmentation;" in 2022 5th International Conference On Artificial Intelligence And Big Data (Icaibd); 2022.

N. A. Gusti; "Analisis Sentimen Terhadap Perkuliahan Jarak Jauh Di Masa Pandemi Covid-19 Pada Media Sosial Twitter Menggunakan Textblob Dan Algoritma Support Vector Machine (SVM);" BS thesis; Fakultas Sains Dan Teknologi UIN Syarif Hidayatullah Jakarta.

S. W. Sidehabi; "Implementasi Mesin Pemilah Buah Markisa Berdasarkan Tingkat Kematangan Berbasis Visi Komputer;" dissertation; Universitas Hasanuddin; 2019.

F. W. Giffary; "Text Classification Untuk Mendeteksi Spam Di Media Sosial Twitter Menggunakan Tf-Idf Dan Algoritma Multilayer Perceptron;" dissertation; Universitas Pembangunan Nasional "Veteran" Yogyakarta; 2022.

Z. M. Yusuf and R. M. Awangga; "Deteksi Spam Sms Menggunakan Naive Bayes;" Penerbit Buku Pedia; 2023.

B. N. Azmi; A. Hermawan; and D. Avianto; "Analisis Pengaruh Komposisi Data Training Dan Data Testing Pada Penggunaan Pca Dan Algoritma Decision Tree Untuk Klasifikasi Penderita Penyakit Liver;" JTIM: Jurnal Teknologi Informasi Dan Multimedia; vol. 4; no. 4; pp. 281-290; 2023.

R. M. Pradhana; "Analisis Sentimen Publik Terhadap Kebijakan Pemberlakuan Pembatasan Kegiatan Masyarakat Skala Mikro Menggunakan Algoritma Support Vector Machine Studi Kasus Twitter;" dissertation; Universitas Dinamika; 2021.

N. I. Putri; "Deep Learning Dan Teknologi Big Data Untuk Keamanan Iot;" Computing| Jurnal Informatika; vol. 7; no. 1; pp. 48-73; 2020.

Creative Commons License

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Copyright (c) 2023 Ana Nur Rani Hasanah, Rr. Artiana Krestianti, Sutresna Wati

Downloads

Download data is not yet available.