Abstract

Outlier detection is an important field of study because it is able to detect abnormal data distribution from a set of data. In the student graduation data, there are students with high semester GPA but do not graduate on time but students with low semester GPA can graduate on time. This study aims to detect outlier values ​​in student graduation data for the 2020-2021 class. Factors (attributes) used in this study are Student Academic Support Credit Scores (AKPAM) and Social Studies from semester one to semester six. The dataset used is 1204 graduates. The outlier detection method used is One-Class Support Vector Machine (SVM). One-class SVM is a derivative of SVM method that detects outliers based on data outside the specified class. The results of outlier detection using One-Class SVM method with three types of kernels produce the following reference values: kernel 'rbf' n by 91.4%, kernel 'linear' by 90% and kernel 'poly' by 90%. After normalization using MinMaxScaler the reference value increased by 2% in each kernel. The results of testing the One-Class SVM method get an average 90.3%, thus it can be concluded that the One-Class SVM method is feasible to be used as an outlier detection method.

Highlights

  • This study aims to detect outlier values in student graduation data for the 2020-2021 class

  • MENGGUNAKAN METODE SUPPORT VECTOR MACHINE FORECASTING THE NUMBER OF TUBERCULOSIS DISEASE PATIENTS IN EAST JAVA REGION USING. 2019

Read more

Summary

PENDAHULUAN

Universitas Darussalam (UNIDA) Gontor merupakan perguruan tinggi pesantren yang terletak di Ponorogo Jawa Timur. Pada data kelulusan mahasiswa terdapat mahasiswa lulus tepat waktu dan lulus tidak tepat waktu. Data mahasiswa tidak tepat waktu tersebut merupakan data anomaly, dikarenakan data tersebut data yang berbeda dengan data normal yaitu data mahasiswa lulus tepat waktu. Dalam memprediksi kelulusan mahasiswa dengan data imbalance dengan perbandingan 89% data mahasiswa lulus tepat waktu dan 11% data mahasiswa tidak lulus tepat waktu, dari keseluruhan jumlah dataset. Kemudian penelitian kedua yang dilakukan pada tahun 2020 oleh Canghong Shi, Xiaojie Li, Jiancheng Lv, Jing Yin, dan Imran Mumtaz dengan menggunakan tiga metode yaitu One-Class SVM, Isolation Forest, dan Local Outlier Factor. Metode OCSVM adalah sebuah metode turunan dari metode Support Vector Machine yang berfungsi untuk mendeteksi data yang berada di luar kelas yang telah ditentukan yaitu outlier. Tujuan dari penelitian ini adalah mengetahui berapa jumlah data yang terdeteksi benar menggunakan metode OCSVM

METODE
Data Processing
HASIL DAN PEMBAHASAN
Findings
KESIMPULAN
Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call