Klasifikasi Pertanyaan Sistem Question Answering Menggunakan Supportvector Machine
Isi Artikel Utama
Abstrak
Orang lebih cenderung bertanya kepada pakar (ustadz atau ulama) melalui internet daripada membaca buku. Sedangkan, pakar yang tersedia jumlahnya terbatas. Dalam kondisi seperti ini dibutuhkan suatu sistem yang dapat memberikan jawaban secara otomatis. Sistem Question Answering (QA) merupakan suatu system yang dapat memberikan jawaban secara otomatis, tepat dan ringkas. Penelitian ini mengusulkan pendekatan machine learning untuk melakukan klasifikasi pertanyaan, dimana klasifikasi pertanyaan merupakan bagian dari system QA. Algoritma machine learning yang digunakan adalah Support Vector Machine (SVM).
Algoritma SVM merupakan bagian dari komponen klasifikasi pertanyaan yang bertujuan untuk menentukan tipe pertanyaan.Tipe pertanyaan dibagi menjadi 4 tipe, yaitu dalil, deskripsi, hukum, dan definisi. Kombinasi tipe dan target content menghasilkan fokus pertanyaan, sehingga jawaban yang disajikan oleh sistem question answering adalah berdasarkan fokus pertanyaan yang diperoleh.
Berdasarkan hasil pengujian, klasifikasi pertanyaan permasalahan Fiqih Thaharah, diperoleh kernel terbaik adalah linier. Kernel terbaik yang diperoleh kemudian digunakan untuk menguji data untuk mencapai akurasi terbaik dengan menggunakan variasi nilai k-Fold, sehingga diperole akurasi terbaik 87.7% pada k-fold 19.