Abstract
In social media, it is found that hate speech is conveyed in the form of text, images and videos, as a result it can provoke certain people to do things that are against the law and harm other person. Therefore, it is necessary to make early detection of hate speech by utilizing machine learning algorithms. This study is to analyze the level of accuracy, precision, recall and F1-Score of 3 kinds of algorithms (SVM, XGBoost, and Neural Network) in the classification of hate speech, using datasets sourced from public hate speech on Twitter in Indonesian. The results of the analysis show that the SVM algorithm has a level of accuracy (83.2%), precision (83%), recall (83%) and F1-score (83%), SVM occupies the highest level compared to XGBoost and Neural Network, so the SVM algorithm can be considered for use in hate speech classification
Highlights
In social media, it is found that hate speech is conveyed in the form of text, images and videos, as a result it can provoke certain people to do things that are against the law and harm other person
Hasil analisis menunjukkan algoritma Support Vector Machine (SVM) memiliki tingkat accuracy (83.2%), precision (83%), recall (83%) dan F1-score (83%), SVM menduduki tertinggi dibanding XGBoost dan Neural Network, sehingga algoritma SVM dapat dipertimbangkan untuk digunakan dalam klasifikasi ujaran kebencian
Model akan melakukan klasifikasi hate speech berdasarkan teks tersebut dengan menggunakan model Support Vector Machine (SVM) yang sebelumnya dikonversi dalam bentuk .joblib
Summary
Banyak orang mengungkapkan pendapat di depan umum. Hal ini dikarenakan pemerintah Indonesia menjamin bahwa setiap warga negaranya memiliki hak kebebasan untuk menyuarakan pendapatnya [1]. Data Dari penelitian yang telah disebutkan diatas, tinjauan audio perlu diubah menjadi data teks, yang kemudian penelitian terdahulu dapat disimpulkan ke dalam Tabel digunakan untuk klasifikasi. Dilakukan stemming untuk teks-teks yang telah Penelitian ini menganalisis tiga algoritma yang optimal bersufiks dengan menggunakan Perpustakaan Sastrawi dalam melakukan klasifikasi ujaran kebencian. Penelitian yang dilakukan oleh [12] menunjukkan akan diubah menjadi teks, penulis akan menggunakan bahwa dengan adanya persebaran distribusi data dalam salah satu model pembelajaran mesin (SVM, setiap kelas akan mempengaruhi hasil accuracy model XGBOOST, atau Neural Network) yang memiliki hasil yang akan digunakan. Sehingga perlunya dilakukan terbaik akan digunakan untuk mengklasifikasikan ujaran pemerataan kelas, salah satunya dengan menggunakan kebencian. Memiliki dampak accuracy yang tidak signifikan Natural Language Toolkit (NLTK) digunakan dalam terhadap model dan atribut ini merupakan kata-kata proses ini untuk fungsi tokenisasi kata.
Talk to us
Join us for a 30 min session where you can share your feedback and ask us any queries you have
More From: Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi)
Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.