AUTOMATIC TEXT SUMMARIZATION DOKUMEN BAHASA DAERAH MENGGUNAKAN METODE TERM FREQUENCY – INVERSE DOCUMENT FREQUENCY (TF-IDF) BERBASIS WEB
Abstract
Salah satu cara untuk melestarikan bahasa daerah ialah membuat dan membaca teks berbahasa daerah. Untuk memahami suatu bacaan secara keseluruhan akan sangat melelahkan. Apabila terdapat hasil ringkasan dari sebuah teks atau dokumen, maka akan dapat membantu pembaca untuk mendapatkan intisari dari sebuah teks dan dapat mempercepat waktu membaca, untuk itu sistem peringkasan otomatis perlu dilakukan karena meringkas secara manual membutuhkan waktu yang cukup banyak. Pada penelitian ini metode yang digunakan adalah TF-IDF, pada metode ini dilakukan perhitungan dengan cara membobot setiap kata dalam kalimat. Sehingga kata yang kemunculan paling banyak adalah sebuah kalimat yang penting. selanjutnya akan menghasilkan kumpulan teks yang berisi kalimat penting dari keseluruhan teks. Dari hasil pengujian sistem yang telah dilakukan dengan memberikan kuesioner kepada seorang ahli bahasa, menghasilkan nilai rata-rata akurasi sebesar 20% untuk dokumen cerpen bahasa Madura pada dengan tingkat kompresi 10%, 20%, 30%, 40% dan 50%, karena isi dari cerpen merupakan kalimat naratif. Dalam dokumen naratif setiap kalimat memiliki makna yang saling berhubungan, apabila beberapa kalimat dihilangkan dari sebuah cerita maka jalan cerita menjadi tidak bagus.