Abstract

본 연구는 언어학적 단서를 활용하여 오피니언 마이닝으로도 일컬어지는 감성분석의 필수요소인 오피니언 서술자 및 오피니언 대상을 찾는 것에 그 목적이 있다. 기존의 감성분석 연구는 주로 긍정 혹은 부정의 감성값을 파악하는 것에 초점을 맞춰왔다. 그러나 이렇게 극성값만을 파악하는 것으로는 누가 어떤 대상에 대해 감성을 표현했는지 파악할 수 없으며 그 분석결과는 신뢰도가 떨어지고 활용도가 제한적이라 할 수 있다. 본 연구는 영화리뷰 데이터에 포함된 오피니언으로 분류되는 문장들의 구문 및 의미 자질을 활용하여 총 15개의 감성패턴을 추출하였다. 더불어 오피니언 패턴을 통해 오피니언 서술자를 수식하는 감성표현과 오피니언 대상을 수식하는 감성표현도 분류했다. 오피니언 패턴과 감성표현의 분류는 명시적 혹은 함축적으로 표현된 오피니언 서술자와 오피니언 대상을 정확하게 식별하는데 활용된다. 이러한 오피니언 패턴을 평가 데이터에 적용하여 해 본 결과, 오피니언 서술자 및 대상이 파악된 정확도는 88.89%으로 나타났다. 본 연구는 선행연구에서 다루지 않았던 언어학적 단서를 활용하여 오피니언 서술자와 오피니언 대상을 식별했을 뿐만 아니라 감성표현의 종류를 정리하여 향후 자동화된 감성 분석의 정확도를 높일 수 있는 토대를 마련하였다는 점에서 의의가 있다.This study identifies opinion patterns of the sentences extracted from movie reviews. Linguistic cues are utilized to determine an opinion holder and an opinion object, essential sentiment components for evaluating semantic orientations in sentiment analysis. Syntactic and semantic features are utilized to define fifteen opinion patterns by which the holder and the object are identified regardless of whether they are explicitly stated or implicitly indicated. When the patterns are applied to test data, the holder and the object are successfully mapped, resulting in the accuracy rate of 88.89%. Sentiment expressions are also classified to provide a clue to determine the components. The opinion patterns and sentiment expression classification are expected to improve the accuracy of interpreting sentiment-bearing sentences.

Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.