Distance Metrics Selection Validity in Cluster Analysis

Peter Grabusts

doi:10.2478/v10143-011-0045-y

Distance Metrics Selection Validity in Cluster Analysis

Peter Grabusts

Open Access

https://doi.org/10.2478/v10143-011-0045-y

Copy DOI

Journal: Scientific Journal of Riga Technical University. Computer Sciences	Publication Date: Jan 1, 2011
Citations: 4

#Means Clustering Algorithm #Manhattan Distance + Show 8 more

Abstract
Full-Text PDF
Similar Papers

Abstract

In cluster analysis data are divided into groups according to a specific criterion called metrics. Traditionally the metrics of choice has been Euclidean distance. This article studies other distance metrics used in cluster analysis– Manhattan distance, Cosine distance and Pearson correlation measure. In k- means clustering algorithm these metrics were used to determine cluster centers and the clustering correctness was evaluated. It was found that the clustering results were very similar. The article also contemplates to evaluate clustering validity criteria.

Full Text