Sistem Pendeteksi Berita Hoax Berbasis Word2Vec dan Logistic Regression

Balqis Salsabila Nurul Huda; Fadya Nur Ayni; Deys Aishara Angelina

doi:10.29407/y6et8s42

Sistem Pendeteksi Berita Hoax Berbasis Word2Vec dan Logistic Regression

Authors

Balqis Salsabila Nurul Huda Universitas Nusantara PGRI Kediri
Fadya Nur Ayni Universitas Nusantara PGRI Kediri
Deys Aishara Angelina Universitas Nusantara PGRI Kediri

DOI:

https://doi.org/10.29407/y6et8s42

Keywords:

Berita hoax, Logistic Regression, Word2Vec, RSS, Klasifikasi teks.

Abstract

Penyebaran berita hoaks di media digital menjadi permasalahan serius karena dapat menyesatkan masyarakat dan mempengaruhi opini publik. Penelitian ini bertujuan untuk membangun sistem deteksi berita hoax berbahasa Indonesia menggunakan algoritma Logistic Regression dengan representasi fitur berbasis Word2Vec. Dataset diperoleh dari platform Kaggle dan dikombinasikan dengan berita dari media resmi serta situs pemeriksa fakta. Tahapan penelitian meliputi pra pemrosesan teks, pembentukan vektor dokumen menggunakan Word2Vec, proses klasifikasi berita, serta integrasi RSS untuk menampilkan rekomendasi berita resmi apabila berita terdeteksi valid. Hasil pengujian menunjukkan bahwa model yang diusulkan mampu mengklasifikasikan berita hoaks dan valid dengan akurasi sebesar 99%, serta nilai precision dan recall yang seimbang pada kedua kelas. Selain itu, sistem memberikan nilai tambah berupa rekomendasi berita dari sumber resmi sebagai pendukung verifikasi informasi.

Downloads

Download data is not yet available.

References

[1] Ramadhan, N. F., dkk. 2022. Deteksi Berita Palsu Menggunakan Metode Random Forest dan Logistic Regression. JURKOM Jurnal Riset Komputer, Vol. 9, No. 2, hal. 251–256.

[2] Nurohisanah, M., dkk. 2024. Deteksi Berita Palsu Menggunakan Metode Random Forest dan Logistic Regression. Jurnal Mahasiswa Teknik Informatika, Vol. 8, No. 1, hal. 422–428.

[3] Rasya, A., dkk. 2023. Implementasi Algoritma Convolutional Neural Network untuk Mengidentifikasi Berita Hoaks Berbahasa Indonesia. Jurnal Informatika.

[4] Tobing, L. J., dkk. 2025. Perbandingan Kinerja IndoBERT dan MBERT untuk Deteksi Berita Hoaks Politik dalam Bahasa Indonesia. Jurnal Sains dan Teknologi, Vol. 14, No. 1.

[5] Hidayat, R. N., dkk. 2023. Sistem Deteksi Berita Hoaks Berbasis Algoritma Natural Language Processing (NLP) Menggunakan BERT. Jurnal Informatika.

[6] Ramadhan, S. F., dkk. 2022. Perbandingan Model Klasifikasi untuk Deteksi Berita Hoaks Menggunakan LSTM, Naive Bayes, Random Forest, K-Means, dan Word2Vec. Prosiding Seminar Nasional Inovasi Teknologi (SEMNAS INOTEK).

[7] Liebenlito, M., dkk. 2024. Deteksi Clickbait pada Judul Berita Online Berbahasa Indonesia Menggunakan FastText. Journal of Applied Computer Science and Technology, Vol. 5, No. 1.

[8] Muzakir, A., dan Surianti, D. 2023. Model Deteksi Berita Palsu Menggunakan Pendekatan Bidirectional Long Short-Term Memory (BiLSTM). Journal of Computer and Information Systems Ampera, Vol. 4, No. 2.

[9] Agustina, N., dkk. 2021. Implementasi Algoritma Naïve Bayes Classifier untuk Deteksi Berita Palsu Berbahasa Indonesia. Faktor Exacta, Vol. 14, No. 4.

[10] Pratama, R., dkk. 2023. Deteksi Berita Hoaks dengan Perbandingan Website Menggunakan Pendekatan Deep Learning Algoritma BERT. Jurnal Teknologi Informasi.

[11] Hidayah, S., dkk. 2022. Deteksi Teks Promosi Judi Online Menggunakan AI dengan Kombinasi NLP dan Deep Learning. Jurnal Informatika dan Sistem Informasi.

[12] Prasetyo, D., dkk. 2022. Indonesian Hoax News Detection Using One-Dimensional Convolutional Neural Network. International Journal of Advanced Computer Science and Applications.

Downloads

Published

2026-01-24

Issue

Vol. 5 No. 1 (2026): Seminar Nasional Teknologi & Sains (STAINS)

Section

Articles

License

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Authors who publish with this journal agree to the following terms:

Copyright on any article is retained by the author(s).
The author grants the journal, right of first publication with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgment of the work’s authorship and initial publication in this journal.
Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal’s published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgment of its initial publication in this journal.
Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work.
The article and any associated published material is distributed under the Creative Commons Attribution-ShareAlike 4.0 International License

How to Cite

Sistem Pendeteksi Berita Hoax Berbasis Word2Vec dan Logistic Regression. (2026). Seminar Nasional Teknologi & Sains, 5(1), 620-625. https://doi.org/10.29407/y6et8s42

Download Citation

Sistem Pendeteksi Berita Hoax Berbasis Word2Vec dan Logistic Regression

Authors

DOI:

Keywords:

Abstract

Downloads

References

Downloads

Published

Issue

Section

License

How to Cite

Similar Articles

Latest publications

issn

menu

GRUP PEMAKALAH STAINS 2026

Submissions

menu3

INDEX BY

Information

Language

Browse