Abstract

Japanese is one of the most difficult languages to understand and read. Japanese writing that does not use the alphabet is the reason for the difficulty of the Japanese language to read. There are three types of Japanese, namely kanji, katakana, and hiragana. Hiragana letters are the most commonly used type of writing. In addition, hiragana has a cursive nature, so each person's writing will be different. Machine learning methods can be used to read Japanese letters by recognizing the image of the letters. The Japanese letters that are used in this study are hiragana vowels. This study focuses on conducting a comparative study of machine learning methods for the image classification of Japanese letters. The machine learning methods that were successfully compared are Naïve Bayes, Support Vector Machine, Decision Tree, Random Forest, and K-Nearest Neighbor. The results of the comparative study show that the K-Nearest Neighbor method is the best method for image classification of hiragana vowels. K-Nearest Neighbor gets an accuracy of 89.4% with a low error rate.

Highlights

  • Bahasa merupakan alat yang digunakan manusia untuk saling berkomunikasi

  • This study focuses on conducting a comparative study of machine learning methods for the image classification of Japanese letters

  • Menggunakan metode K-Nearest Neighbor (KNN) yang merupakan hasil terbaik diantara metode lain, diharapkan mampu mengklasifikasi jenis huruf jepang yang lainnya

Read more

Summary

PENDAHULUAN

Bahasa merupakan alat yang digunakan manusia untuk saling berkomunikasi. Ketika manusia lahir maka akan mempelajari bahasa ibu masing-masing. Hiragana lebih umum digunakan dan memiliki karakteristik penulisan dan jumlah huruf yang berbeda sehingga ada rintangan tersendiri dalam memahaminya [4]. Beberapa penelitian dilakukan untuk melakukan klasifikasi tulisan huruf hiragana menggunakan citra yang diambil dari tulisan tangan. Komparasi untuk mengklasifikasi citra wajah suku di Indonesia dilakukan oleh Hartono et al Metode yang dikomparasi adalah KNN, SVM, dan Decision Tree. Hasil dari komparasi tersebut adalah urutan kinerja metode klasifikasi berdasarkan nilai presisi, recall, akurasi, dan F1. Hasil akurasi yang didapat dari masing-masing algoritma adalah 58.64% untuk algoritma Decision Tree dan 75.45% untuk algoritma Naïve Bayes [10]. Namun studi komparasi terhadap metode machine learning dalam melakukan klasifikasi citra pada huruf hiragana. Metode yang akan dikomparasi adalah Naïve Bayes, J48, SVM, Random Forest, Decision Tree, dan KNN. Bagian kedua akan menjelaskan metode penelitian yang digunakan pada penelitian ini

METODOLOGI PENELITIAN
Resize Image
Pembagian Data
Naive Bayes
Evaluasi dan Validasi
HASIL DAN PEMBAHASAN
Findings
KESIMPULAN
Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call