Sistem Deteksi Dan Koreksi Otomatis Penulisan Bahasa Indonesia Menggunakan Dictionary Lookup dan Fuzzy Logic
DOI:
https://doi.org/10.29407/rq18zk15Keywords:
Fuzzy Logic, Normalisasi Teks, Dictionary Lookup, Koreksi OtomatisAbstract
Ketidakbakuan dalam penulisan bahasa Indonesia di media digital mencakup spektrum yang luas, mulai dari penggunaan bahasa gaul (slang), singkatan, kesalahan penulisan karakter (typo), hingga kesalahan tata bahasa pada kata depan (preposisi). Alat bantu pengecekan ejaan (spell checker) yang ada saat ini seringkali memiliki keterbatasan kosakata, sehingga gagal mengenali kata non-baku yang berkembang di masyarakat maupun entitas spesifik seperti nama daerah. Penelitian ini bertujuan membangun sistem normalisasi teks yang mampu menangani keseluruhan aspek kesalahan ejaan bahasa Indonesia secara otomatis. Metode yang digunakan adalah pendekatan Hybrid yang menggabungkan kecepatan Dictionary Lookup dan fleksibilitas Fuzzy Logic berbasis Levenshtein Distance. Sistem ini didukung oleh korpus data masif berjumlah 633.350 entri, yang terdiri dari dataset kosakata umum dan slang (347.416 kata), dataset entitas wilayah administratif (285.851 kata), serta aturan preposisi. Hasil pengujian menunjukkan sistem mampu memperbaiki ejaan pada berbagai konteks kalimat, baik itu bahasa santai, formal, maupun kalimat yang memuat nama lokasi spesifik, dengan tingkat akurasi yang tinggi dan waktu proses yang efisien.
Downloads
References
[1] Badan Pengembangan dan Pembinaan Bahasa, Pedoman Umum Ejaan Bahasa Indonesia (PUEBI), 4th ed. Jakarta: Kementerian Pendidikan dan Kebudayaan, 2016.
[2] B. Liu, Sentiment Analysis: Mining Opinions, Sentiments, and Emotions. New York: Cambridge University Press, 2015.
[3] M. D. Etsa, H. Sujaini, and N. Safriadi, “Pengaruh Metode Dictionary Lookup pada Cleaning Korpus Terhadap Akurasi Mesin Penerjemah Statistik Indonesia–Melayu Pontianak,” J. Edukasi dan Penelit. Inform., vol. 4, no. 1, p. 49, Jun. 2018, doi: 10.26418/JP.V4I1.24595.
[4] A. R. Wibowo and H. S. Sholihin, “Normalisasi Teks Bahasa Indonesia Berbasis Kamus untuk Penanganan Singkatan dan Kata Gaul di Media Sosial,” J. Teknol. Inf., vol. 15, no. 2, pp. 120–129, 2021.
[5] V. I. Levenshtein, “Binary Codes Capable of Correcting Deletions, Insertions and Reversals,” Sov. Phys. Dokl., vol. 10, no. 8, pp. 707–710, 1966.
[6] M. R. Arifuddin, I. A. Rafiq, and R. Mubarok, “Sistem Cerdas Penilaian Ujian Essay Menggunakan Metode Cosine Similarity,” Gener. J., vol. 7, no. 1, pp. 31–38, 2023, doi: 10.29407/gj.v7i1.18318.
[7] Badan Pusat Statistik, “Master File Wilayah Provinsi/Kabupaten/Kecamatan/Desa Tahun 2024,” 2024, Jakarta.
[8] R. Danar, D. M. Kom, M. M. Kom, A. Bahtiar, M. Kom, and I. Ali, Dasar Dasar Natural Language Processing (NLP). Tangerang: Minhaj Pustaka, 2024. Accessed: Dec. 13, 2025. [Online]. Available: https://repository.minhajpustaka.id/publications/593976/
[9] V. S. Aryadi, R. Wulanningrum, and P. Kasih, “Implementasi Fuzzy Logic Identifikasi Gesture Tangan Untuk Deteksi Kerusuhan,” Semin. Nas. Teknol. Sains, vol. 1, no. 1, pp. 44–50, Feb. 2022, doi: 10.29407/STAINS.V1I1.1487.
[10] T. Richards, Getting Started with Streamlit for Data Science. Birmingham, UK: Packt Publishing, 2021.
Downloads
Published
Issue
Section
License
Copyright (c) 2026 Willy Rahma Wijaya

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Authors who publish with this journal agree to the following terms:
- Copyright on any article is retained by the author(s).
- The author grants the journal, right of first publication with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgment of the work’s authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal’s published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgment of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work.
- The article and any associated published material is distributed under the Creative Commons Attribution-ShareAlike 4.0 International License





