Abstract
Berita online telah berkembang sangat pesat terutama pada waktu yang mendekati pesta politik. Tingginya volume dokumen teks dipicu oleh aktivitas dari berbagai sumber berita. Karena banyaknya jumlah berita yang tertampung ke dalam website, terkadang berita yang diposting tidak sesuai dengan kenyataan atau dapat disebut berita hoax. Deteksi berita hoax menjadi penting agar pengguna tidak terjebak informasi palsu yang terkandung dalam berita hoax. Untuk itu diperlukan sebuah sistem cerdas yang dapat mendeteksi berita hoax bertema politik secara otomatis. Penelitian ini mengevaluasi Teknik deep learning menggunakan LSTM dengan penambahan fitur Word Embedding Global Vector (GloVe) dan membandingkan hasil dari penelitian sebelumnya yang menggunakan beberapa algoritma deep learning tanpa penambahan fitur. Peneliti menggunakan dataset yang terdiri dari 1300 dokumen berita hoax dan 8234 dokumen berita valid. Karena jumlah komposisi antara kelas hoax dan valid tidak seimbang, maka peneliti menerapkan teknik Synthetic Minority Over-Sampling Technique (SMOTE) untuk meningkatkan representasi kelas minoritas. Hasil empiris menunjukan bahwa akurasi klasifikasi dari LSTM dengan fitur tambahan word embedding GloVe didapatkan akurasi sebesar 99.8%, dimana mampu mengungguli hasil penelitian sebelumnya dengan akurasi 95.1% yang tanpa penggunaan word embedding. Peningkatan performa ini tidak lepas dari penambahan fitur word embedding GloVe sebagai inisialisasi bobot untuk lapisan embedding dalam model LSTM, dimana mampu memberikan representasi yang lebih baik pada kata-kata dalam dataset.
Talk to us
Join us for a 30 min session where you can share your feedback and ask us any queries you have
Similar Papers
Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.