Abstract

In social media, it is found that hate speech is conveyed in the form of text, images and videos, as a result it can provoke certain people to do things that are against the law and harm other person. Therefore, it is necessary to make early detection of hate speech by utilizing machine learning algorithms. This study is to analyze the level of accuracy, precision, recall and F1-Score of 3 kinds of algorithms (SVM, XGBoost, and Neural Network) in the classification of hate speech, using datasets sourced from public hate speech on Twitter in Indonesian. The results of the analysis show that the SVM algorithm has a level of accuracy (83.2%), precision (83%), recall (83%) and F1-score (83%), SVM occupies the highest level compared to XGBoost and Neural Network, so the SVM algorithm can be considered for use in hate speech classification

Highlights

  • In social media, it is found that hate speech is conveyed in the form of text, images and videos, as a result it can provoke certain people to do things that are against the law and harm other person

  • Hasil analisis menunjukkan algoritma Support Vector Machine (SVM) memiliki tingkat accuracy (83.2%), precision (83%), recall (83%) dan F1-score (83%), SVM menduduki tertinggi dibanding XGBoost dan Neural Network, sehingga algoritma SVM dapat dipertimbangkan untuk digunakan dalam klasifikasi ujaran kebencian

  • Model akan melakukan klasifikasi hate speech berdasarkan teks tersebut dengan menggunakan model Support Vector Machine (SVM) yang sebelumnya dikonversi dalam bentuk .joblib

Read more

Summary

Pendahuluan penanganan kasus ujaran kebencian pada saat ini tidak

Banyak orang mengungkapkan pendapat di depan umum. Hal ini dikarenakan pemerintah Indonesia menjamin bahwa setiap warga negaranya memiliki hak kebebasan untuk menyuarakan pendapatnya [1]. Data Dari penelitian yang telah disebutkan diatas, tinjauan audio perlu diubah menjadi data teks, yang kemudian penelitian terdahulu dapat disimpulkan ke dalam Tabel digunakan untuk klasifikasi. Dilakukan stemming untuk teks-teks yang telah Penelitian ini menganalisis tiga algoritma yang optimal bersufiks dengan menggunakan Perpustakaan Sastrawi dalam melakukan klasifikasi ujaran kebencian. Penelitian yang dilakukan oleh [12] menunjukkan akan diubah menjadi teks, penulis akan menggunakan bahwa dengan adanya persebaran distribusi data dalam salah satu model pembelajaran mesin (SVM, setiap kelas akan mempengaruhi hasil accuracy model XGBOOST, atau Neural Network) yang memiliki hasil yang akan digunakan. Sehingga perlunya dilakukan terbaik akan digunakan untuk mengklasifikasikan ujaran pemerataan kelas, salah satunya dengan menggunakan kebencian. Memiliki dampak accuracy yang tidak signifikan Natural Language Toolkit (NLTK) digunakan dalam terhadap model dan atribut ini merupakan kata-kata proses ini untuk fungsi tokenisasi kata.

Stemming
Data Preparation
Case-Folding
Dataset Balancing
Neural Network
Evaluasi
Findings
Evaluasi Neural Network

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.