Jurnal
troke merupakan salah satu penyakit yang berdampak besar terhadap kesehatan masyarakat,
karena dapat menyebabkan kematian maupun kecacatan permanen. Oleh karena itu, identifikasi
dini terhadap risiko stroke menjadi sangat penting dalam upaya pencegahan. Penelitian ini
dilakukan untuk membandingkan kinerja tiga algoritma klasifikasi, yaitu Naive Bayes, K-Nearest
Neighbors (KNN), dan Decision Tree, dalam memprediksi kejadian stroke berdasarkan data rekam
medis pasien. Dataset yang digunakan terdiri dari 5.110 entri dengan sejumlah fitur seperti usia,
jenis kelamin, tekanan darah, kadar glukosa, dan status merokok. Teknik SMOTE-Tomek diterapkan
untuk menyeimbangkan jumlah antara data pasien stroke dan non-stroke. Selanjutnya, model
dievaluasi menggunakan pengujian validasi silang lima lipatan dan diukur menggunakan akurasi,
precision, recall, serta f1-score. Hasil pengujian menunjukkan bahwa model Decision Tree
memberikan performa terbaik dengan nilai f1-score yang paling tinggi yakni 91%, setelah
penyeimbangan data dilakukan. Berdasarkan hasil pengujian, algoritma Decision Tree
menunjukkan performa terbaik dengan nilai f1-score sebesar 91% setelah penyeimbangan data
menggunakan SMOTE-Tomek. Hal ini membuktikan bahwa kombinasi teknik balancing SMOTE
Tomek dan pemilihan algoritma klasifikasi yang sesuai sangat efektif dalam meningkatkan akurasi
prediksi resiko stroke pada data tidak seimbang.