Abstract

다양한 음성 압축방식이 여러 분야에서 광범위하게 사용되고 있으며 그 심리음향적 인지결과는 대상 언어의 특성과 압축 방식에 따라서 다를 수가 있다. 한국어에서도 이러한 인지 결과를 비교하는 정량적인 자료가 관련된 임상이나 응용 분야에서 필요하지만 구체적인 내용이 확인되어 있지 않다. 본 연구에서는 통제된 언어적 특성을 갖는 0에서 9까지 한국어 단음절 숫자 들이 무작위로 조합되는 다섯 쌍 조합(quintet set)을 대상으로 하여 자주 사용되는 세가지 대표적인 음성 압축방식의 특성을 비교 분석하였다. 비교 기준으로는 기존의 연구에서 분석 정리된 시간과 주파수 정보가 모두 일정하게 변화되는 PNT (Preserving No Trait) 압축에서 얻은 자료를 비교 근거로 선정하였다. 이를 기준으로 하여 동일한 조건의 정상인 그룹에서 심리음향적 피치(pitch) 정보가 주로 보전되는 PPT (Preserving Pitch Trait), 시간 정보가 주로 보전되는 PTT (Preserving Time Trait) 압축방식의 인지 결과를 기록하고 분석하였다(N=20). 본 연구 결과에서 얻어진 자료를 보면, 정보의 압축비율이 높을 수록 심리음향학적으로 중요한 주파수 정보(피치)를 보전하는 것이 인지도 측면에서 가장 유리한 것으로 나타났다(PPT>PTT>PNT). 또한, 세가지 압축방법에서 50% 인지율을 보이는 압축률의 역치도 PPT가 20%, PTT가 42%, PNT가 44% 순으로 나타났다. 따라서 인지도 측면에서만 살펴보면 본 조건에서는 PPT 압축 방식이 가장 우수한 것으로 추정되었다. 이러한 숫자 자극을 이용한 평가 방법은 향후 새로운 압축 방식의 효율성과 인지도 측면을 비교 가능하게 하며, 이를 이용하면, 청각정보처리기능을 진단하거나 압축 관련 특수 보청기 적합 재활에서 정량적인 지표를 제공하는 도구로도 사용될 수 있을 것으로 판단된다. The performances of speech compression schemes appeared to be dependent on the response profiles to compressed stimuli and the features of individual languages to some extent. Although these response profiles were critical in comparing various compression outcomes, the related data were limited in number for Korean monosyllabic words. From the previous study, data from PNT (Preserving No Trait) compression was selected as a base set for comparison. In this study, the outcomes from PPT (Preserving Pitch Trait) and PTT (Preserving Time Trait) were analyzed under the same condition. Then, the properties of these three widely used representative compression schemes were quantitatively compared in normal hearing adults (N=20) for controlled Korean quintet digit sets (0 through 9). Results showed that PPT compression scheme exhibited the best perceptual performances for the Korean quintet digit sets in the final outcomes (PPT>PTT>PNT). The compression ratios of 50% performances were estimated as about 20%, 42%, and 44% for PPT, PTT, and PNT, respectively. The data indicated the influences of the salient psychoacoustic features of the three representative compressions on perceiving Korean monosyllabic digit words. This controlled procedure with monosyllabic quintet sets can evaluate efficiency and effectiveness of other compression schemes and may also contribute to diagnosing auditory processing disorders and fitting special hearing aids with compression issues.

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.