Abstract

Currently, the problem of college failure, its on-time graduation, and the factors that cause it is still an interesting research topic (C. Marquez-Vera, C. Romero and S. Ventura, 2011). This study compares three data mining classification algorithms namely Naive Bayes, Decision Tree and K-Nearest Neighbor to predict graduation and dropout risk for students to improve the quality of higher education and the most accurate algorithms to use Prepare graduation and dropout prediction Student studies. The best algorithm for predicting graduation and dropout is the decision tree with the best accuracy value of 99.15% with a training data ratio of 30%. Keyword : Data Mining; Algoritma Naive Bayes; Decision Tree; K-Nearest Neighbor; Predict Graduation; Drop Out.

Highlights

  • Saat ini, masalah kegagalan studi, kelulusan tepat waktu dan faktor-faktor penyebabnya masih menjadi topik yang menarik untuk diteliti

  • Penelitian terkait permasalahan Putus Studi, mahasiswa non aktif dan kelulusan mahasiswa sudah banyak dilakukan oleh para peneliti sebelumnya seperti Kotsiantis, Pierrakeas dan Pintelas menyebutkan bahwa sangat penting bagi dosen untuk mendeteksi mahasiswa yang cenderung drop out sebelum mereka memasuki pertengahan masa studi

  • The best algorithm for predicting graduation and dropout is the decision tree with the best accuracy value of 99.15% with a training data ratio of 30%

Read more

Summary

PENDAHULUAN

Masalah kegagalan studi, kelulusan tepat waktu dan faktor-faktor penyebabnya masih menjadi topik yang menarik untuk diteliti Beberapa algoritma klasifikasi data mining telah digunakan untuk memprediksi perilaku mahasiswa yang berpotensi drop out diantaranya decision tree, neural network, naïve bayes,instance-based learning, logistic regression dan support vector machine. Akan dilakukan perbandingan tiga algoritma klasifikasi data mining yaitu Naive Bayes, Decision Tree dan K-Nearest Neighbor untuk prediksi kelulusan mahasiswa dan resiko putus studi bagi mahasiswa untuk peningkatan mutu perguruan tinggi dan dapat menghasilkan algortima yang paling akurat dalam prediksi kelulusan dan putus studi mahasiswa. 5. Data mining atau Knowledge Discovery in Databases (KDD) adalah pengambilan informasi yang tersembunyi, dimana informasi tersebut sebelumnya tidak dikenal dan berpotensi bermanfaat. Bayesian classification didasarkan pada teorema Bayes yang memiliki kemampuan klasifikasi serupa dengan Decision Tree dan Neural Network. Bayesian Classification terbukti memiliki akurasi dan kecepatan yang tinggi saat diaplikasikan ke dalam database dengan data yang besar (Kusrini dan Emha Taufiq Luthfi, 2009).

Decision Tree
METODE PENELITIAN
Evaluation
Hasil Komparasi
KESIMPULAN
Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.