Perbandingan Kinerja Algoritma C4.5 dan Naive Bayes untuk Klasifikasi Penerima Beasiswa

  • Choirul Anam Magister Teknik Informatika, Universitas AMIKOM Yogyakarta
  • Harry Budi Santoso Universitas AMIKOM Yogyakarta

Abstract

Penentuan penerima beasiswa harus mempertimbangkan multifaktor sebagai penentu untuk memastikan bahwa pihak penerima memang layak mendapatkan beasiswa. Metode data mining untuk klasifikasi dapat digunakan untuk membantu meningkatkan kecepatan dan ketepatan dalam penentuan penerima beasiswa. Perbandingan kinerja algoritma C4.5 dan Naive Bayes bertujuan untuk mengukur tingkat akurasi dan lama waktu proses (execution time) dari masing-masing algoritma untuk mendapatkan algoritma terbaik yang akan diterapkan dalam membantu proses penentuan penerima beasiswa. Penelitian menggunakan data sekunder berupa daftar pemohon dan penerima beasiswa sebagai data set yang memiliki enam faktor penentu, yaitu semester, IPK, prestasi ko/ekstra kurikuler, penghasilan orang tua, beban biaya listrik dan jumlah tanggungan orang tua. Pengujian dengan 10-fold cross validation sekaligus evaluasi kinerja model menggunakan tool RapidMiner. Hasil penelitian menunjukkan tingkat akurasi model algoritma C4. 5sebesar 96.40% lebih baik dari tingkat akurasi model algoritma Naive Bayes sebesar 95.11%, sedangkan waktu proses dari kedua model algoritma yang diteliti menunjukkan hasil 0 s. Hal ini disebabkan jumlah data set yang terlalu sedikit untuk dapat mengidentifikasi perbedaan waktu proses antar kedua model algoritma.
Kata Kunci: klasifikasi data mining, C4.5, Naive Bayes

Published
2018-05-20