Using dictionary in a knowledge based algorithm for clustering short texts in Bahasa Indonesia

Husni Thamrin,Atiqa Sabardila

doi:10.1109/icodse.2014.7062678

Using dictionary in a knowledge based algorithm for clustering short texts in Bahasa Indonesia

Husni Thamrin, Atiqa Sabardila

https://doi.org/10.1109/icodse.2014.7062678

Copy DOI

Publication Date: Nov 1, 2014

Citations: 4

Affiliation: Muhammadiyah University of Surakarta

#Semantic Approach #Clustering Short Texts + Show 8 more

Abstract
Full-Text PDF
Similar Papers

Abstract

Text clustering is important in many application of information retrieval. This paper presents a study of clustering short texts in Bahasa Indonesia using semantic similarity approach where dictionary of synonyms and hyponyms is used to get information on word relatedness. We compare sentence similarity calculations based on lexical matching and word similarity. More than 250 sentences are involved. Our experiment shows that clustering using sentence similarity based on lexical matching performs better in terms of precision and F-measure than clustering using sentence similarity based on semantic approach.

Full Text