Abstract
정보기술이 발달함에 따라 시공간의 규제를 넘어 많은 정보를 이용할 수 있게 되었지만 이를 활용하지 못하는 경우 정보의 불균형이 발생한다. 정보 불균형은 기술이전 시에도 발생하는데, 이에 따라 국내 기술 이전을 희망하는 국내/해외 사업자들의 원활한 기술 이전이 어려운 상황이다. 본 연구에서는 국내 기술 정보를 통합 및 분석하여, 기술 이전에 유용한 정보를 제공하는 방안을 제안한다. 특정 도메인의 구조에 따라 크롤링을 진행하기 때문에 다중도메인을 대상으로 크롤링을 수행하기엔 비용적으로 효율적이지 않고 구조가 복잡한 기존 동작 기반 웹 크롤러가 아닌 새로운 크롤링 기법이 필요하다. 또한 단어와 문서의 빈도를 기반으로 한 단순 요약 기법은 새로운 정보 응용과 참조가 빠른 기술 이전 시장에 적용하는 데 한계가 있기 때문에 페이지에 가중치를 부여하여 중요도에 따라 요약하는 추출적 요약 방식을 적용하고자 하였다. 본 논문에서는 다양한 도메인에서 정보를 수집하기 위한 전역적인 크롤러 기법과 수집한 정보를 기반으로 텍스트랭크(TextRank)를 이용한 요약 모델을 생성한다. 다중도메인에서 한 번에 정보를 수집하고, 수집된 페이지에 가중치를 부여해 중요도가 높은 정보를 추출함으로써 최신 기술 정보의 동향을 파악할 수 있으며, 영문의 기술이전 웹사이트의 프로토타입을 구축하여 국내외 기업의 기술 이전의 활성화를 촉진하고자 하였다. 우리는 실험을 통해 크롤링 기법과 요약 모델의 성능을 검증한다.
Talk to us
Join us for a 30 min session where you can share your feedback and ask us any queries you have
Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.