Abstract

단백질은 다른 물질과의 결합하여 기능을 수행하기 때문에 활성 사이트가 유사한 단백질은 유사한 기능을 가진다. 따라서 단백질의 바인딩 영역을 식별함으로써 단백질의 기능을 추론할 수 있다. 이 논문은 MCL (Markov Cluster) 알고리즘을 이용하여 단백질의 바인딩 영역을 추출하는 새로운 방법을 제시한다. 이를 위하여 단백질의 표면 잔기 거리를 나타내는 distance matrix를 생성하고, 여기에 MCL 프로세스를 적용한다. 제시한 방법을 평가하기 위해 Catalytic Site Atlas (CSA) 데이터를 사용하였다. CSA 데이터 (94개의 단일 체인 단백질)를 이용한 실험 결과, 알고리즘은 91개 단백질의 활성 사이트 주변의 바인딩 영역을 검출하였다. 이 논문은 단백질 활성 사이트를 분석하기 위한 새로운 기하학적 특징을 제시하였고, 활성 사이트와 관련이 없는 잔기를 제거함으로써 단백질 표면의 분석의 시간을 줄일 수 있는 장점이 있다. Proteins combine with other materials to achieve their function and have similar function if their active sites are similar. Thus we can infer the function of protein by identifying the binding area of proteins. This paper suggests the novel method to select binding area of protein using MCL (Markov Cluster) algorithm. We construct the distance matrix from surface residues distance on protein. Then this distance matrix is transformed to connectivity matrix for applying MCL process. We adopted Catalytic Site Atlas (CSA) data to evaluate the proposed method. In the experimental result using CSA data (94 selected single chain proteins), our algorithm detects the 91 (97%) binding area near by active site of each protein. We introduced a new geometrical features and this mainly contributes to reduce the time to analyze the protein by selecting the residues near by active site.

Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call