Sistem Pendeteksi Berita Hoax Berbasis Word2Vec dan Logistic Regression

Authors

  • Balqis Salsabila Nurul Huda Universitas Nusantara PGRI Kediri
  • Fadya Nur Ayni Universitas Nusantara PGRI Kediri
  • Deys Aishara Angelina Universitas Nusantara PGRI Kediri

DOI:

https://doi.org/10.29407/y6et8s42

Keywords:

Berita hoax, Logistic Regression, Word2Vec, RSS, Klasifikasi teks.

Abstract

Penyebaran berita hoaks di media digital menjadi permasalahan serius karena dapat menyesatkan masyarakat dan mempengaruhi opini publik. Penelitian ini bertujuan untuk membangun sistem deteksi berita hoax berbahasa Indonesia menggunakan algoritma Logistic Regression dengan representasi fitur berbasis Word2Vec. Dataset diperoleh dari platform Kaggle dan dikombinasikan dengan berita dari media resmi serta situs pemeriksa fakta. Tahapan penelitian meliputi pra pemrosesan teks, pembentukan vektor dokumen menggunakan Word2Vec, proses klasifikasi berita, serta integrasi RSS untuk menampilkan rekomendasi berita resmi apabila berita terdeteksi valid. Hasil pengujian menunjukkan bahwa model yang diusulkan mampu mengklasifikasikan berita hoaks dan valid dengan akurasi sebesar 99%, serta nilai precision dan recall yang seimbang pada kedua kelas. Selain itu, sistem memberikan nilai tambah berupa rekomendasi berita dari sumber resmi sebagai pendukung verifikasi informasi.

Downloads

Download data is not yet available.

References

[1] Ramadhan, N. F., dkk. 2022. Deteksi Berita Palsu Menggunakan Metode Random Forest dan Logistic Regression. JURKOM Jurnal Riset Komputer, Vol. 9, No. 2, hal. 251–256.

[2] Nurohisanah, M., dkk. 2024. Deteksi Berita Palsu Menggunakan Metode Random Forest dan Logistic Regression. Jurnal Mahasiswa Teknik Informatika, Vol. 8, No. 1, hal. 422–428.

[3] Rasya, A., dkk. 2023. Implementasi Algoritma Convolutional Neural Network untuk Mengidentifikasi Berita Hoaks Berbahasa Indonesia. Jurnal Informatika.

[4] Tobing, L. J., dkk. 2025. Perbandingan Kinerja IndoBERT dan MBERT untuk Deteksi Berita Hoaks Politik dalam Bahasa Indonesia. Jurnal Sains dan Teknologi, Vol. 14, No. 1.

[5] Hidayat, R. N., dkk. 2023. Sistem Deteksi Berita Hoaks Berbasis Algoritma Natural Language Processing (NLP) Menggunakan BERT. Jurnal Informatika.

[6] Ramadhan, S. F., dkk. 2022. Perbandingan Model Klasifikasi untuk Deteksi Berita Hoaks Menggunakan LSTM, Naive Bayes, Random Forest, K-Means, dan Word2Vec. Prosiding Seminar Nasional Inovasi Teknologi (SEMNAS INOTEK).

[7] Liebenlito, M., dkk. 2024. Deteksi Clickbait pada Judul Berita Online Berbahasa Indonesia Menggunakan FastText. Journal of Applied Computer Science and Technology, Vol. 5, No. 1.

[8] Muzakir, A., dan Surianti, D. 2023. Model Deteksi Berita Palsu Menggunakan Pendekatan Bidirectional Long Short-Term Memory (BiLSTM). Journal of Computer and Information Systems Ampera, Vol. 4, No. 2.

[9] Agustina, N., dkk. 2021. Implementasi Algoritma Naïve Bayes Classifier untuk Deteksi Berita Palsu Berbahasa Indonesia. Faktor Exacta, Vol. 14, No. 4.

[10] Pratama, R., dkk. 2023. Deteksi Berita Hoaks dengan Perbandingan Website Menggunakan Pendekatan Deep Learning Algoritma BERT. Jurnal Teknologi Informasi.

[11] Hidayah, S., dkk. 2022. Deteksi Teks Promosi Judi Online Menggunakan AI dengan Kombinasi NLP dan Deep Learning. Jurnal Informatika dan Sistem Informasi.

[12] Prasetyo, D., dkk. 2022. Indonesian Hoax News Detection Using One-Dimensional Convolutional Neural Network. International Journal of Advanced Computer Science and Applications.

Downloads

Published

2026-01-24

How to Cite

Sistem Pendeteksi Berita Hoax Berbasis Word2Vec dan Logistic Regression. (2026). Seminar Nasional Teknologi & Sains, 5(1), 620-625. https://doi.org/10.29407/y6et8s42

Similar Articles

1-10 of 144

You may also start an advanced similarity search for this article.