Abstract

Masalah data kelas tidak seimbang memiliki efek buruk pada ketepatan prediksi data. Untuk menangani masalah ini, telah banyak penelitian sebelumnya menggunakan algoritma klasifikasi menangani masalah data kelas tidak seimbang. Pada penelitian ini akan menyajikan teknik under-sampling dan over-sampling untuk menangani data kelas tidak seimbang. Teknik ini akan digunakan pada tingkat preprocessing untuk menyeimbangkan kondisi kelas pada data. Hasil eksperimen menunjukkan neural network (NN) lebih unggul dari decision tree (DT), linear regression (LR), naïve bayes (NB) dan support vector machine (SVM).

Highlights

  • The Problems unbalancing class dataset have an adverse effect on the accuracy of prediction data

  • balanced. This technique is used at the level of the preprocessing to balance class condition

  • support vector machine (SVM) modeling for highly imbalanced classification

Read more

Summary

PENDAHULUAN

Masalah data kelas tidak seimbang sering disebabkan oleh satu kelas kalah banyak dengan kelas lain didalam dataset [1][2]. Namun dalam maslah ini cukupa sulit karena algoritma klasifikasi tradisional bias terhadap kelas minoritas [12], artinya apabila dipaksakan hasil prediksi dapat mendekati keliru bahkan salah [13]. Telah banyak penelitian yang dilakukan untuk mengatasi masalah data kelas tidak seimbang, seperti yang dilakukan oleh Zhou dan Liu [14] menunjukkan bahwa menyelesaikan masalah multiclass lebih sulit dari dua class. Penelitian lain juga menunjukkan bahwa algoritma standar tidak bekerja pada data kelas tidak seimbang atau masalah data multi class [15], sehingga menggunakan metode tradisional kurang tepat menangani masalah ini, apabila dipaksakan dapat menimbulkan prediksi bias dan hasil akurasi yang menyesatkan [16]. Over-sampling bekerja dengan kelas mayoritas, memiliki kelebihan pada dataset yang besar seperti mengurangi jumlah pengamatan dari kelas mayoritas untuk membuat kumpulan data seimbang, meningkatkan run time. Pekerjaan kami dari makalah ini diringkas dalam bagian terakhir

TINJAUAN PUSTAKA
METODE YANG DIUSULKAN
HASIL PENELITIAN
75 DT NN LR NB SVM
KESIMPULAN
Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call