Sistem Deteksi Dan Koreksi Otomatis Penulisan Bahasa Indonesia Menggunakan Dictionary Lookup dan Fuzzy Logic

Authors

  • Willy Rahma Wijaya Universitas Nusantara PGRI Kediri

DOI:

https://doi.org/10.29407/rq18zk15

Keywords:

Fuzzy Logic, Normalisasi Teks, Dictionary Lookup, Koreksi Otomatis

Abstract

Ketidakbakuan dalam penulisan bahasa Indonesia di media digital mencakup spektrum yang luas, mulai dari penggunaan bahasa gaul (slang), singkatan, kesalahan penulisan karakter (typo), hingga kesalahan tata bahasa pada kata depan (preposisi). Alat bantu pengecekan ejaan (spell checker) yang ada saat ini seringkali memiliki keterbatasan kosakata, sehingga gagal mengenali kata non-baku yang berkembang di masyarakat maupun entitas spesifik seperti nama daerah. Penelitian ini bertujuan membangun sistem normalisasi teks yang mampu menangani keseluruhan aspek kesalahan ejaan bahasa Indonesia secara otomatis. Metode yang digunakan adalah pendekatan Hybrid yang menggabungkan kecepatan Dictionary Lookup dan fleksibilitas Fuzzy Logic berbasis Levenshtein Distance. Sistem ini didukung oleh korpus data masif berjumlah 633.350 entri, yang terdiri dari dataset kosakata umum dan slang (347.416 kata), dataset entitas wilayah administratif (285.851 kata), serta aturan preposisi. Hasil pengujian menunjukkan sistem mampu memperbaiki ejaan pada berbagai konteks kalimat, baik itu bahasa santai, formal, maupun kalimat yang memuat nama lokasi spesifik, dengan tingkat akurasi yang tinggi dan waktu proses yang efisien.

Downloads

Download data is not yet available.

References

[1] Badan Pengembangan dan Pembinaan Bahasa, Pedoman Umum Ejaan Bahasa Indonesia (PUEBI), 4th ed. Jakarta: Kementerian Pendidikan dan Kebudayaan, 2016.

[2] B. Liu, Sentiment Analysis: Mining Opinions, Sentiments, and Emotions. New York: Cambridge University Press, 2015.

[3] M. D. Etsa, H. Sujaini, and N. Safriadi, “Pengaruh Metode Dictionary Lookup pada Cleaning Korpus Terhadap Akurasi Mesin Penerjemah Statistik Indonesia–Melayu Pontianak,” J. Edukasi dan Penelit. Inform., vol. 4, no. 1, p. 49, Jun. 2018, doi: 10.26418/JP.V4I1.24595.

[4] A. R. Wibowo and H. S. Sholihin, “Normalisasi Teks Bahasa Indonesia Berbasis Kamus untuk Penanganan Singkatan dan Kata Gaul di Media Sosial,” J. Teknol. Inf., vol. 15, no. 2, pp. 120–129, 2021.

[5] V. I. Levenshtein, “Binary Codes Capable of Correcting Deletions, Insertions and Reversals,” Sov. Phys. Dokl., vol. 10, no. 8, pp. 707–710, 1966.

[6] M. R. Arifuddin, I. A. Rafiq, and R. Mubarok, “Sistem Cerdas Penilaian Ujian Essay Menggunakan Metode Cosine Similarity,” Gener. J., vol. 7, no. 1, pp. 31–38, 2023, doi: 10.29407/gj.v7i1.18318.

[7] Badan Pusat Statistik, “Master File Wilayah Provinsi/Kabupaten/Kecamatan/Desa Tahun 2024,” 2024, Jakarta.

[8] R. Danar, D. M. Kom, M. M. Kom, A. Bahtiar, M. Kom, and I. Ali, Dasar Dasar Natural Language Processing (NLP). Tangerang: Minhaj Pustaka, 2024. Accessed: Dec. 13, 2025. [Online]. Available: https://repository.minhajpustaka.id/publications/593976/

[9] V. S. Aryadi, R. Wulanningrum, and P. Kasih, “Implementasi Fuzzy Logic Identifikasi Gesture Tangan Untuk Deteksi Kerusuhan,” Semin. Nas. Teknol. Sains, vol. 1, no. 1, pp. 44–50, Feb. 2022, doi: 10.29407/STAINS.V1I1.1487.

[10] T. Richards, Getting Started with Streamlit for Data Science. Birmingham, UK: Packt Publishing, 2021.

Downloads

Published

2026-01-24

How to Cite

Sistem Deteksi Dan Koreksi Otomatis Penulisan Bahasa Indonesia Menggunakan Dictionary Lookup dan Fuzzy Logic. (2026). Seminar Nasional Teknologi & Sains, 5(1), 114-121. https://doi.org/10.29407/rq18zk15

Similar Articles

1-10 of 153

You may also start an advanced similarity search for this article.