Abstract

Penggunaan bahasa tak baku semakin marak dalam komunikasi di media sosial. Penggunaan bahasa tak baku tidak terbatas pada kalimat, klausa, atau frasa saja namun juga pada penggunaan kata. Pada penelitian ini, akan dilakukan normalisasi kata yang tak baku/ nonstandard word (NSW) tersebut ke kata baku/ standard word (SW) Bahasa Indonesia. Metode stemmer Nazief-Adriani (Nazief-Adriani stemmer (NAS)) dikembangkan menjadi nonstandard stemmer (NSS) dengan meningkatkan kemampuannya untuk mendeteksi imbuhan tak baku. Tujuan penelitian ini adalah membandingkan penggunaan NAS dan NSS dalam normalisasi NSW. Algoritma kemiripan Needleman-Wunsch digunakan untuk membobot hasil pencocokan. Hasil pengujian dengan Mean Reciprocal Rank (MRR) pada sebanyak 3.438 NSW didapatkan penggunaan NSS dengan jumlah kueri = 9 (Q=9) memiliki tertinggi sebesar 79.26% dengan rata-rata sebesar 50.48%. Sedangkan pengujian MRR menggunakan NAS dengan Q=9 mendapatkan hasil tertinggi sebesar 72.87% dan rata-rata sebesar 47.23%. Dari dua pengujian MRR yang dilakukan, ada 3 huruf yang memiliki hasil stemming tertinggi, baik dalam pengujian menggunakan NAS maupun menggunakan NSS yaitu huruf awal r, f dan j. Peningkatan nilai MRR paling signifikan terjadi pada huruf awal ‘d’, ‘n’ dan ‘t’ yang merupakan huruf awal dari sebagian imbuhan tak standar.

Highlights

  • Bahasa adalah sarana yang digunakan untuk berkomunikasi atau menyampaikan sesuatu dengan sesama

  • The use of non-standard language is increasingly prevalent in communication on social media

  • The use of indefinite language is not limited to sentences

Read more

Summary

PENDAHULUAN

Bahasa adalah sarana yang digunakan untuk berkomunikasi atau menyampaikan sesuatu dengan sesama. Penelitian ini difokuskan pada normalisasi penggunaan kata yang tidak baku/ nonstandard word (NSW) menjadi kata baku standard word (SW). Proses normalisasi NSW menjadi SW ini melalui tahapan beberapa tahapan seperti normalisasi angka ke huruf, normalisasi kata ulang, normalisasi flooding, dan stemming atau pemisahan kata dasar dari imbuhan. Setelah kata dasar diperoleh maka proses selanjutnya yang akan dilakukan yaitu pencocokan string dengan menggunakan algoritma Needleman-Wunsch. NSW dalam bahasa Indonesia selain dapat mengandung kata dasar yang tak baku juga dapat mengandung imbuhan tak baku seperti kata ‘mnjanjikn’ terdiri dari imbuhan ‘me-kan’ dengan kata dasar ‘janji’ atau kata ‘membuwat’ yang terdiri dari imbuhan awalan ‘me’ dan kata dasar ‘buat’. Penelitian ini menawarkan modifikasi metode NAS dengan mengakomodir berbagai bentuk imbuhan tak baku yang sering digunakan di media sosial

MATERI DAN METODE
Rancangan Sistem
Mean Reciprocal Rank
Contoh Normalisasi NSW denganNSS
HASIL DAN PEMBAHASAN
KESIMPULAN DAN SARAN
Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.