Perbandingan Algoritma K-Nearest Neighbor Dan Logistic Regression Dalam Klasifikasi Penyakit Kanker Serviks
Comparison of K-Nearest Neighbor Algorithm and Logistic Regression in the Classification of Cervical Cancer Disease
Abstract
Kanker serviks adalah masalah serius dalam kesehatan wanita secara global, dengan tingkat insiden dan kematian yang tinggi. Deteksi dini sangat penting karena perkembangannya yang lambat dan seringkali tanpa gejala pada tahap awal. Salah satu metode yang digunakan untuk mendeteksi kanker serviks adalah klasifikasi melalui pendekatan data mining. Penelitian ini bertujuan untuk menerapkan algoritma K-Nearest Neighbor (K-NN) dan Regresi Logistik dalam klasifikasi deteksi dini kanker serviks, dengan menggunakan teknik pengujian percentage spilt dan k-fold cross validation. Tujuannya adalah untuk membandingkan dan menentukan metode klasifikasi kanker serviks yang paling tepat. Evaluasi dilakukan dengan menggunakan parameter presisi, recall, dan akurasi. Hasil penelitian menunjukkan bahwa hasil pengujian menggunakan validasi silang k-fold mampu bekerja lebih baik daripada persentase spilt. Berdasarkan kinerja algoritma, Regresi Logistik dalam penggunaannya dapat bekerja dengan baik dibandingkan dengan K-NN, dengan nilai presisi, recall dan akurasi masing-masing sebesar 83%, 82,5% dan 96%. Dengan demikian, dapat disimpulkan bahwa Regresi Logistik dengan teknik k-fold cross validation testing lebih efektif dalam mengklasifikasikan kanker serviks.