한국어 음성 인식 모델의 동음 현상 인식 오류 유형에 대한 검토

A-Reum Kim,Gyu-Hwan Oh

doi:10.31889/kll.2023.03.202.37

Abstract

본 연구의 목적은 현재 사용되고 있는 한국어 음성 인식 모델들의 주요 오류 요인 중 하나가 ‘동음 현상’임을 밝히고, CLOVA Speech open API를 이용한 음성 인식실험 결과를 토대로 동음 현상에 의한 음성 인식 오류 양상을 유형화하는 것이다. 최근의 음성 인식 모델들은 강한 맥락 의존성을 바탕으로 음성 인식을 수행한다. 따라서 맥락 정보가 불충분하거나 불안정해지는 상황에서는 필연적으로 인식률이 낮아지는 문제를 보인다. 본 연구에서는 음성 인식 과정에서 맥락 정보를 불안정하게 만드는 데에 문장 안에서 여러 요인들로 인해 형성되는 다양한 ‘동음 현상’이 관여하는 것으로 판단하였으며, 동음 현상으로 인한 음성 인식 오류를 ‘동음어에 의한 오류’와 ‘음운 과정에 의한 오류’, ‘연음으로 인한 오류’, ‘음소 간 비변별에 의한 오류’ 등으로 나누어 살펴보았다. 그리고 이 중 음성 인식 상황에서 일반적으로 오류를 유발하지 않는 ‘동음어에 의한 오류’를 제외한 세 오류 유형의 음성 인식 양상과 오류 요인을 분석하였다.

Full Text