Abstract

Dalam menyusun penelitian, dokumen ilmiah dibutuhkan sebagai salah satu sumber data yang dapat dipertanggungjawabkan. Namun dalam menentukan informasi utama, pembaca mengalami kesulitan untuk mendapatkan kesimpulan dari beberapa dokumen ilmiah. Peringkasan multi dokumen ilmiah berfungsi untuk memudahkan pembaca dalam memahami dan mendapatkan kesimpulan dari beberapa dokumen ilmiah. Ada banyak metode yang bisa digunakan untuk peringkasan multi dokumen ilmiah, salah satunya adalah metode K-Means dan K-Nearest Neighbors (K-NN). Penelitian ini bertujuan untuk mengetahui dan menganalisa perbandingan kinerja peringkasan multi dokumen ilmiah berbahasa Indonesia menggunakan metode K-Means dan K-Nearest Neighbor (K-NN). Bahan penelitian yang digunakan adalah dokumen ilmiah berbahasa Indonesia sebanyak 30 dokumen dengan topik yang sama tentang “Sistem Informasi Perpustakaan”. Dokumen ilmiah diproses menggunakan tools NLTK dan Sastrawi, kemudian hasil peringkasan metode K-Means dan K-Nearest Neighbors (K-NN) dievaluasi dengan metode ROUGE. Pengujian metode K-Means pada ROUGE-1 dan ROUGE-2 menunjukkan hasil optimal sebanyak 30 dokumen dengan tingkat peringkasan sebanyak 15 kalimat. Pada ROUGE-1 diperoleh nilai presisi 0.391, recall 0.277, dan f-measure 0.324. Kemudian pada ROUGE-2, diperoleh nilai presisi 0.067, recall 0.048, dan f-measure 0.056. Sedangkan pada metode K-Nearest Neighbors (K-NN) pada ROUGE-1 dan ROUGE-2 menunjukkan hasil optimal sebanyak 10 dokumen dengan tingkat peringkasan 15 kalimat. Pada ROUGE-1 diperoleh nilai presisi 0.362, recall 0.296, dan f-measure 0.326. Kemudian pada ROUGE-2, diperoleh nilai presisi 0.045, recall 0.037, dan f-measure 0.045. Dapat disimpulkan bahwa metode K-Means memiliki kinerja yang lebih baik jika dokumen yang digunakan relatif lebih banyak. Sebaliknya, metode K-Nearest Neighbors (K-NN) memiliki kinerja yang lebih baik jika dokumen yang digunakan relatif lebih sedikit.

Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.