Improving Data Integrity of Individual-based Bibliographic Repository Using Clustering Techniques

Firdaus Firdaus,Mira Afrina,Muhammad Anshori,Oky Budiyarti,Siti Nurmaini

doi:10.18495/comengapp.v7i1.223

Improving Data Integrity of Individual-based Bibliographic Repository Using Clustering Techniques

Firdaus Firdaus, Mira Afrina + Show 3 more

Open Access

https://doi.org/10.18495/comengapp.v7i1.223

Copy DOI

Journal: Computer Engineering and Applications Journal

Publication Date: Feb 10, 2018

Affiliation: Sriwijaya University

#Co-author Relationship #Individual-based Data + Show 8 more

Abstract
Full-Text PDF
Similar Papers

Abstract

This paper presents a method to improve data integrity of individual-based bibliographic repository. Integrity improvement is done by comparing individual-based publication raw data with individual-based clustered publication data. Hierarchical Agglomerative Clustering is used to cluster the publication data with similar author names. Clustering is done by two steps of clustering. The first clustering is based on the co-author relationship and the second is by title similarity and year difference. The two-step hierarchical clustering technique for name disambiguation has been applied to Universitas Sriwijaya Publication Data Center with good accuracy.

Full Text