Abstract

Teknik klasifikasi teks dalam pemrosesan bahasa alami memegang peranan penting dalam mengelompokkan data digital ke dalam kategori yang telah ditentukan sebelumnya. Khususnya dalam bidang medis, klasifikasi teks klinis sangat penting untuk memahami dokumen medis, terutama teks klinis tentang kanker. Penelitian ini bertujuan untuk membandingkan kinerja tiga varian algoritma Naive Bayes yaitu Multinomial, Bernoulli, dan Gaussian, pada data uji klinis kanker. Untuk mengoptimalkan kinerja algoritma, kami menggunakan pendekatan GridSearch dan cross-validation dengan k-fold (k=10). Pilihan algoritma memiliki pengaruh signifikan terhadap akurasi, presisi, recall, dan metrik kinerja lainnya. Melalui perbandingan varian Naive Bayes, kami dapat mengidentifikasi algoritma terbaik untuk dataset dan tugas klasifikasi teks klinis kanker. Hasil analisis menunjukkan bahwa Bernoulli Naive Bayes mencapai akurasi 0,79, presisi 0,88, dan recall 0,68. Sementara itu, Gaussian Naive Bayes mencapai akurasi 0,76, presisi 0,83, dan recall 0,65. Algoritma Multinomial Naive Bayes berhasil mencapai akurasi 0,80, presisi 0,84, dan recall 0,75. Penelitian ini memberikan panduan dalam memilih algoritma yang sesuai dengan tujuan dan prioritas klasifikasi. Hal ini dapat dikembangkan lebih lanjut dalam bahasa alami medis dan proses pengambilan keputusan medis. Melalui pengetahuan yang diperoleh dari penelitian ini, analisis teks medis dalam konteks klinis dapat dioptimalkan dengan lebih efektif.

Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call