Penentuan Kalimat Utama Berbasis Pembobotan Kemiripan Makna
DOI:
https://doi.org/10.29407/p99jy481Keywords:
NLP , TF-IDF, Kemiripan Makna, Kalimat Utama, Cosine SimilarityAbstract
Identifikasi jenis paragraf berdasarkan letak kalimat utama merupakan bagian penting dalam analisis struktur teks bahasa Indonesia. Paragraf deduktif ditandai dengan kalimat utama di awal paragraf, sedangkan paragraf induktif memiliki kalimat utama di akhir paragraf. Proses identifikasi tersebut masih banyak dilakukan secara manual dan bersifat subjektif, sehingga diperlukan pendekatan otomatis berbasis Natural Language Processing. Penelitian ini mengusulkan metode deteksi kalimat utama untuk klasifikasi paragraf deduktif dan induktif dengan memanfaatkan pembobotan kemiripan makna menggunakan TF-IDF dan pengukuran kemiripan menggunakan Cosine Similarity. Setiap paragraf dipecah menjadi beberapa kalimat, kemudian dihitung nilai rata-rata kemiripan antar kalimat untuk menentukan kalimat utama berdasarkan nilai tertinggi. Pengujian dilakukan terhadap 220 paragraf yang terdiri dari 110 paragraf deduktif dan 110 paragraf induktif. Hasil evaluasi menunjukkan bahwa pada kelas paragraf deduktif diperoleh nilai precision sebesar 89,90%, recall 84,76%, dan F1-score 87,24%, sedangkan pada paragraf induktif diperoleh precision 88,04%, recall 79,41%, dan F1-score 83,49%. Kesalahan klasifikasi umumnya terjadi pada paragraf dengan struktur yang ambigu atau memiliki kalimat penutup atau pembuka yang bersifat rangkuman. Dapat disimpulkan bahwa pendekatan berbasis kemiripan makna antar kalimat efektif digunakan untuk mendeteksi kalimat utama dan mengklasifikasikan paragraf deduktif serta induktif dalam bahasa Indonesia.
Downloads
References
[1] Z. A.-F. Aguslim, Cut Marlini, “Analisis Kemampuan Siswa Menentukan Kalimat Utama dalam Pembelajaran Bahasa Indonesia Kelas 4 SD Negeri 49 Kota Banda Aceh,” J. Ilm. Mhs. Univ. Bina Bangsa Getsempena, vol. 2, no. 1, 2021, [Online]. Available: https://jim.bbg.ac.id/pendidikan/article/download/323/160/431
[2] M. Khairat, “IMPLEMENTASI K-MEANS CLUSTERING DAN VECTOR SPACE MODEL UNTUK MENCARI KALIMAT UTAMA TEKS ARTIKEL BERBAHASA INDONESIA,” Universitas Islam Negeri Sultan Syarif Kasim Riau, 2019.
[3] D. A. R. Ariantini, A. S. M. Lumenta, and A. Jacobus, “Pengukuran Kemiripan Dokumen Teks Bahasa Indonesia Menggunakan Metode Cosine Similarity,” J. Tek. Inform., vol. 9, no. 1, pp. 1–8, 2016, doi: 10.35793/jti.9.1.2016.13752.
[4] R. P. Pratama, M. Faisal, and A. Hanani, “Deteksi Plagiarisme pada Dokumen Jurnal Menggunakan Metode Cosine Similarity,” SMARTICS J., vol. 5, no. 1, pp. 22–26, 2019, doi: 10.21067/smartics.v5i1.2848.
[5] E. L. Amalia, A. J. Jumadi, I. A. Mashudi, and D. W. Wibowo, “Analisis Metode Cosine Similarity Pada Aplikasi Ujian Online Otomatis (Studi Kasus JTI POLINEMA),” J. Teknol. Inf. dan Ilmu Komput., vol. 8, no. 2, p. 343, 2021, doi: 10.25126/jtiik.2021824356.
[6] A. Sanjaya, A. B. Setiawan, U. Mahdiyah, I. N. Farida, and A. R. Prasetyo, “Pengukuran Kemiripan Makna Menggunakan Cosine Similarity Measurement of Meaning Similarity Using Cosine Similarity and,” vol. 10, no. 4, pp. 747–752, 2023.
[7] A. Sanjaya and S. D. Sasongko, “UJI KEMIRIPAN KALIMAT MENGGUNAKAN FUNGSI TERBILANG PADA PRE-PROCESSING DAN COSINE SIMILARITY DALAM BAHASA INDONESIA SENTENCES SIMILARITY TEST USING COUNTABLE FUNCTION ON PRE-PROCESSING AND COSINE IN INDONESIAN,” vol. 7, no. 2, pp. 95–104, 2022.
[8] F. Sibarani, “ANALISIS KESULITAN SISWA MENEMUKAN KALIMAT UTAMA DALAM TEKS PARAGRAF PADA MATA PELAJARAN BAHASA INDONESIA KELAS V DI SD NEGERI 101832 PANCUR BATU TAHUN AJARAN 2019/2020,” Universitas Quality, 2020. [Online]. Available: http://portaluniversitasquality.ac.id:55555/949/7/BAB II.pdf
[9] D. Suhartono, “Natural Language Processing.” Accessed: Feb. 07, 2022. [Online]. Available: https://socs.binus.ac.id/2013/06/22/natural-language-processing/
[10] E. L. Steven Bird, Ewan Klien, Natural Language Processing with Python, First Edit. Sebastopol, CA 95472.: O’reilly Media Inc, 2009. Accessed: Feb. 07, 2022. [Online]. Available: http://www.datascienceassn.org/sites/default/files/Natural Language Processing with Python.pdf
[11] J. Han, J.W., Kamber, M. and Pei, Data Mining: Concepts and Techniques (3rd ed.). Waltham: Morgan Kaufmann Publishers, 2012.
[12] I. Mawanta, T. S. Gunawan, and W. Wanayumini, “Uji Kemiripan Kalimat Judul Tugas Akhir dengan Metode Cosine Similarity dan Pembobotan TF-IDF,” J. Media Inform. Budidarma, vol. 5, no. 2, p. 726, 2021, doi: 10.30865/mib.v5i2.2935.
[13] M. A. Salim and Y. Anistyasari, “Pengembangan Aplikasi Penilaian Ujian Essay Berbasis Online Menggunakan Algoritma Nazief Dan Adriani Dengan Metode Cosine Mohammad Agus Salim Yeni Anistyasari Abstrak,” IT-Edu J. Inf. Technol. Educ., vol. 02, no. 1, pp. 126–135, 2017.
[14] M. M. umilasari Syabani reni, “Penerapan Metode Cosine Similarity dan Pembobotan TF/IDF pada Sistem Klasifikasi Sinopsis Buku di Perpustakaan Kejaksaan Negeri Jember,” JUSTINDO (Jurnal Sist. dan Teknol. Inf. Indones., no. Vol 3, No 1 (2018): JUSTINDO, pp. 31–42, 2018, [Online]. Available: http://jurnal.unmuhjember.ac.id/index.php/JUSTINDO/article/view/2345
[15] K. S. Nugroho, “Dasar Text Preprocessing dengan Python.” Accessed: Feb. 07, 2022. [Online]. Available: https://ksnugroho.medium.com/dasar-text-preprocessing-dengan-python-a4fa52608ffe
[16] A. Librian, “High quality stemmer library for Indonesian Language (Bahasa).” Accessed: Feb. 08, 2022. [Online]. Available: https://github.com/sastrawi/
Downloads
Published
Issue
Section
License
Copyright (c) 2026 Ardi Sanjaya, Finsa Nurpandi, Marga Asta Jaya Mulya

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Authors who publish with this journal agree to the following terms:
- Copyright on any article is retained by the author(s).
- The author grants the journal, right of first publication with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgment of the work’s authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal’s published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgment of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work.
- The article and any associated published material is distributed under the Creative Commons Attribution-ShareAlike 4.0 International License





