Abstract

Dunia saat ini sedang berada di era Big Data, dimana sejumlah besar data berdimensi tinggi tersebar di berbagai domain, seperti media sosial, layanan kesehatan, bio-informatika, dan pendidikan online. Big Data adalah salah satu teknik pembelajaran mesin dan menjadi alat penting yang populer dalam bisnis, sehingga pengelolaan Big Data yang efektif menjadi hal yang sangat penting. Salah satu topik yang menarik untuk diteliti dalam kajian Big Data khususnya text mining ialah cyberbullying Instagram. Beberapa teknik yang dapat digunakan untuk memecahkan masalah text mining yaitu, clustering, klasifikasi, outlier, asosiasi, dan masih banyak lagi. Klasifikasi merupakan bentuk dasar dari analisis data yang banyak diterapkan diberbagai bidang. Penelitian ini membangun model klasifikasi menggunakan algoritma Logistic Regression dengan penambahan proses seleksi fitur menggunakan algoritma Particle Swarm Optimization sebagai tahapan yang berada sebelum proses pelatihan model regresi untuk mengklasifikasi komentar cyberbullying Instagram. Seleksi fitur dilakukan untuk mempertahankan kinerja model klasifikasi dengan menggunakan jumlah fitur pelatihan yang lebih sedikit. Hasil penelitian menunjukkan bahwa penambahan seleksi fitur dapat mereduksi fitur kata sebanyak 40% yang diikuti penurunan akurasi, presisi, dan AUC masing-masing sebesar  1,25%, 4,25%, 1,09% serta peningkatan nilai recall dan f1-score secara berurut sebesar 5,36% dan 0,57%. Penambahan Particle Swarm Optimization sebagai seleksi fitur pada kasus  disimpulkan efektif mempertahankan kinerja pembelajaran model dilihat dari nilai AUC yang tetap berada pada kategori Good Classification saat dilatih dengan fitur kata yang lebih sedikit.

Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call