Abstract
Di seluruh dunia, stroke adalah penyebab kematian dan kecacatan jangka panjang nomor dua. Untuk mengurangi risiko komplikasi dan meningkatkan peluang kesembuhan pasien, deteksi dini stroke sangat penting. Tujuan penelitian ini adalah untuk membuat aplikasi deteksi dini stroke berbasis pembelajaran mesin yang lebih akurat dengan menggunakan algoritma Random Forest dan Adaptive Boosting (AdaBoost). Dataset Kaggle dengan 5.110 sampel dan dua belas fitur digunakan. Implementasi model, pembagian dataset (80 persen pelatihan, 20 persen pengujian), dan pra-pemrosesan data (menangani nilai yang tidak ada, transformasi data, dan penyeimbangan kelas menggunakan SMOTETomek) adalah tahapan penelitian. Hasilnya menunjukkan akurasi sebesar 96% untuk kedua kelas—stroke dan non-stroke—dengan presisi dan recall yang seimbang. Untuk memfasilitasi visualisasi dan prediksi secara real-time, framework Streamlit digunakan dalam pengembangan aplikasi. Hasil penelitian menunjukkan bahwa kombinasi AdaBoost-Random Forest berhasil dalam klasifikasi stroke. Aplikasi berbasis web ini mungkin menjadi alat bantu yang bermanfaat untuk diagnosis stroke cepat.
References
[1] T. Y. Utomo, BUKU AJAR STROKE, 1st ed. Purbalingga: EUREKA MEDIA AKSARA, JUNI 2024 ANGGOTA IKAPI JAWA TENGAH NO. 225/JTE/2021, 2024.
[2] W. Riyadina and E. Rahajeng, “Determinan Penyakit Stroke,” Kesmas Natl. Public Heal. J., vol. 7, no. 7, p. 324, Feb. 2013, doi: 10.21109/kesmas.v7i7.31.
[3] R. Adolph, “Apa itu Stroke ?,” https://p2ptm.kemkes.go.id/infographic-p2ptm/stroke/apa-itu-stroke, 2016. https://p2ptm.kemkes.go.id/infographic-p2ptm/stroke/apa-itu-stroke (accessed Oct. 21, 2024).
[4] E. Daniati, R. Firliana, and A. S. Wardani, Dukungan Keputusan Dengan Pendekatan Machine Learning. Kediri: Universitas Nusantara PGRI Kediri, 2024. doi: https://doi.org/10.29407/punp.vi.68.
[5] T. K. Amarya, A. C. A. Galuh, R. Achmad, E. Daniati, and A. Ristyawan, “Analisa Perbandingan Algoritma Classification Berdasarkan Komposisi Label,” Pros. SEMNAS INOTEK, vol. 8, no. 1, pp. 32–40, Aug. 2024, doi: https://doi.org/10.29407/inotek.v8i1.4906.
[6] A. Ristyawan, A. Nugroho, and T. K. Amarya, “Optimasi Preprocessing Model Random Forest Untuk Prediksi Stroke,” J. Tek. Inform. dan Sist. Inf., vol. 12, no. 1, pp. 29–44, 2025, doi: https://doi.org/10.35957/jatisi.v12i1.9587.
[7] L. Breiman, “Random Forests,” 2001.
[8] A. Byna and M. Basit, “PENERAPAN METODE ADABOOST UNTUK MENGOPTIMASI PREDIKSI PENYAKIT STROKE DENGAN ALGORITMA NAÏVE BAYES,” J. Sisfokom (Sistem Inf. dan Komputer), vol. 9, no. 3, pp. 407–411, Nov. 2020, doi: 10.32736/sisfokom.v9i3.1023.
[9] M. Ilham, T. Siswanto, and D. Sugiarto, “Design of Study Program Performance Dashboard using Streamlit,” INTELMATICS, vol. 4, no. 2, pp. 96–100, 2024, doi: https://doi.org/10.25105/v4i2.20643.
[10] R. Yadav and H. Raheman, “Machine learning-based estimation of agricultural tyre sinkage: A streamlit web application,” J. Terramechanics, vol. 119, no. December 2024, 2025, doi: 10.1016/j.jterra.2025.101055.
[11] Y. Akkem, B. S. Kumar, and A. Varanasi, “Streamlit Application for Advanced Ensemble Learning Methods in Crop Recommendation Systems – A Review and Implementation,” Indian J. Sci. Technol., vol. 16, no. 48, pp. 4688–4702, 2023, doi: 10.17485/ijst/v16i48.2850.
[12] M. K. Warbhe, J. J. Bore, and S. N. Chaudari, “A Deep Learning Based System to Predict the Plant Disease Using Streamlit,” Int. Conf. Sentim. Anal. Deep Learn., 2025, doi: https://doi.org/10.1109/ICSADL65848.2025.10933389.
[13] S. Patil and V. Lokesha, “Live Twitter Sentiment Analysis Using Streamlit Framework,” SSRN Electron. J., 2022, doi: 10.2139/ssrn.4119949.
[14] X. Huang et al., “Novel Insights on Establishing Machine Learning-Based Stroke Prediction Models Among Hypertensive Adults,” Front. Cardiovasc. Med., vol. 9, no. May, pp. 1–11, 2022, doi: 10.3389/fcvm.2022.901240.
[15] K. Abdullah et al., Metodologi Penelitian Kuantitatif. Yayasan Penerbit Muhammad Zaini, 2022. [Online]. Available: https://penerbitzaini.com/
[16] Fedesoriano, “Stroke Prediction Dataset,” https://www.kaggle.com/fedesoriano, 2020. https://www.kaggle.com/datasets/fedesoriano/stroke-prediction-dataset (accessed Oct. 04, 2024).
[17] M. S. Pathan, Z. Jianbiao, D. John, A. Nag, and S. Dev, “Identifying Stroke Indicators Using Rough Sets,” IEEE Access, vol. 8, pp. 210318–210327, Nov. 2020, doi: 10.1109/ACCESS.2020.3039439.
[18] M. Schonlau and R. Y. Zou, “The random forest algorithm for statistical learning,” Stata J., vol. 20, no. 1, pp. 3–29, 2020, doi: 10.1177/1536867X20909688.

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Copyright (c) 2025 Theo Krisna Amarya, Rina Firliana, Aidina Ristyawan
