Klasifikasi Berita Hoaks Bencana Alam Menggunakan Representasi IndoBERT dan Algoritma XGBoost
PDF

Keywords

Berita Palsu
Deteksi Hoaks
IndoBERT
Pemrosesan Bahasa Alami
XGBoost

How to Cite

Klasifikasi Berita Hoaks Bencana Alam Menggunakan Representasi IndoBERT dan Algoritma XGBoost. (2025). Prosiding SEMNAS INOTEK (Seminar Nasional Inovasi Teknologi), 9(2), 894-902. https://doi.org/10.29407/canq4d79

Abstract

Penyebaran berita hoaks saat bencana alam dapat menimbulkan kepanikan dan mengganggu penanganan darurat. Penelitian ini mengembangkan sistem klasifikasi otomatis untuk mendeteksi berita hoaks berbahasa Indonesia bertema bencana alam. Dataset diperoleh melalui web scraping dari situs turnbackhoax.id untuk berita hoaks dan detik.com untuk berita valid, yang dibagi menjadi data latih, validasi, dan uji. Sistem menggunakan IndoBERT untuk ekstraksi fitur semantik dan XGBoost sebagai algoritma klasifikasi. Hasil pengujian evaluasi dari model menunjukkan akurasi sebesar 99,11%, f1-score sebesar 0,99 pada kedua kelas, serta recall 0,98 untuk hoaks dan 1,00 untuk valid. Sistem ini dikembangkan dalam antarmuka web berbasis React.js dan Flask, serta menunjukkan hasil klasifikasi yang konsisten dan cepat. Pendekatan ini terbukti efektif dalam mengenali pola linguistik berita hoaks, serta berpotensi diterapkan dalam platform verifikasi informasi pada situasi bencana di Indonesia.

PDF

References

A. R. I. Fauzy and E. B. Setiawan, “Detecting Fake News on Social Media Combined with the CNN Methods,” J. RESTI, vol. 7, no. 2, pp. 271–277, 2023.

B. Wilie et al., “IndoNLU: Benchmark and Resources for Evaluating Indonesian Natural Language Understanding,” arXiv preprint arXiv:2009.05387, 2020.

I. Ginting, “Pentingnya Daya Kritis Masyarakat Tangkal HOAX,” babelprov.go.id, 2024.

J. Amalia et al., “Model Klasifikasi Berita Palsu Menggunakan Bidirectional LSTM dan Word2Vec Sebagai Vektorisasi,” J. Tek. Inform. dan Sist. Inform., vol. 9, no. 4, 2022.

J. Devlin, M.-W. Chang, K. Lee, and K. Toutanova, “BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding,” arXiv preprint arXiv:1810.04805, 2018.

K. Shu, A. Sliva, S. Wang, J. Tang, and H. Liu, “Fake News Detection on Social Media: A Data Mining Perspective,” ACM SIGKDD Explor. Newsl., vol. 19, no. 1, pp. 22–36, 2017.

Kementerian Komunikasi dan Informatika Republik Indonesia, “Kominfo Tangani Ribuan Isu Hoaks,” kominfo.go.id, 2024. [Online]. Available: https://www.kominfo.go.id.

R. Juarto and I. Yulianto, “Deteksi Berita Hoaks Bahasa Indonesia Menggunakan IndoBERT,” J. Ilmu Komput., vol. 12, no. 1, pp. 45–54, 2023.

R. S. H. Pratama, D. I. Ardiyanto, and A. Ayu, “Klasifikasi Hoax Vs Non-Hoax pada Berita Bencana Alam Berbahasa Indonesia Menggunakan Word Embedding,” J. RESTI, vol. 6, no. 6, pp. 1084–1091, 2022.

T. Chen and C. Guestrin, “XGBoost: A Scalable Tree Boosting System,” in Proc. 22nd ACM SIGKDD Int. Conf. Knowledge Discovery and Data Mining, 2016, pp. 785–794.

Creative Commons License

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Copyright (c) 2025 Musthofa Ilmi, ARDI SANJAYA, S.Kom, M.Kom, Dr.. RISKY ASWI RAMADHANI, S.Kom, M.Kom