Abstract

마이크로어레이 데이터의 클러스터링 성능을 향상시키기 위하여 유전자 온톨로지(GO)를 활용하는 연구가 최근 진행 중에 있다. 그 중 Biological Process(BP) GO를 활용한 Kustra et al.의 연구가 2006년에 소개된 바 있다. 본 연구는 Kustra et al.의 연구를 확장하여 일반적이고 실질적인 GO의 활용 방안을 위한 분석 결과를 제시하기 위하여 다양한 활용 방법을 적용한다. (1) GO의 거리를 측정하기 위하여 Lin et al, Resnik et al과 Jiang et al의 방법을 적용하였으며, (2) BP를 포함한 세 가지 GO 유형의 구조에 대해 적용하여 각 방법에 따른 성능 향상 정도를 분석한다. 각 방법에 대한 성능 분석 비교를 위하여 효모 유전자를 관측하여 형성한 데이터를 활용한다. 실험 결과를 통하여 GO 정보를 클러스터링에 적용하면 전반적으로 성능 향상을 유도하지만, 활용 방법에 따라서 성능 개선 정도의 차이가 발생한다. 그 중 Resnik의 거리 측정 척도와 BP GO를 활용하였을 때, 가장 개선된 성능을 유도함을 볼 수 있다. Recently many researches have been presented to improve the clustering performance of gene expression data by incorporating Gene Ontology into the process of clustering. In particular, Kustra et al. showed higher performance improvement by exploiting Biological Process Ontology compared to the typical expression-based clustering. This paper extends the work of Kustra et al. by performing extensive experiments on the way of incorporating GO structures. To this end, we used three ontological distance measures (Lin's, Resnik's, Jiang's) and three GO structures (BP, CC, MF) for the yeast expression data. From all test cases, We found that clustering performances were remarkably improved by incorporating GO; especially, Resnik's distance measure based on Biological Process Ontology was the best.

Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call