Discriminative speaker adaptation in Persian continuous speech recognition systems

Shadi Pirhosseinloo,Farshad Almas Ganj

doi:10.1016/j.sbspro.2012.01.043

Discriminative speaker adaptation in Persian continuous speech recognition systems

Shadi Pirhosseinloo, Farshad Almas Ganj

Open Access

https://doi.org/10.1016/j.sbspro.2012.01.043

Copy DOI

Journal: Procedia - Social and Behavioral Sciences	Publication Date: Jan 1, 2012
Citations: 4	License type: cc-by-nc-nd

Affiliation: Amirkabir University of Technology

#Minimum Phone Error #Minimum Phone Error Criterion + Show 8 more

Abstract
Full-Text PDF
Similar Papers

Abstract

In this paper, the use of discriminative criteria such as minimum phone error (MPE) and maximum mutual information (MMI) is investigated for discriminative training HMM models for Persian speech recognition system. Discriminative training criteria have been successfully used to train acoustic models, so these criteria are expected to improve the estimation of linear transforms for speaker adaptation. MPE criterion is used to estimate the discriminative linear transforms (DLTs) for mean transforms. Experiments on Farsdat corpus show considerable improvements of discriminative training against ML trained models and MPE training outperforms MMI training on test data. Furthermore, MPE-based DLT reduces the word error rate in comparison to MLLR adaptation.

Full Text