Modeling State-Conditional Observation Distribution Using Weighted Stereo Samples for Factorial Speech Processing Models

Mahdi Khademian,Mohammad Mehdi Homayounpour

doi:10.1007/s00034-016-0310-y

Abstract

This paper investigates the effectiveness of factorial speech processing models in noise-robust automatic speech recognition tasks. For this purpose, the paper proposes an idealistic approach for modeling state-conditional observation distribution of factorial models based on weighted stereo samples. This approach is an extension to previous single pass retraining for ideal model compensation which is extended here to support multiple audio sources. Non-stationary noises can be considered as one of these audio sources with multiple states. Experiments of this paper over the set A of the Aurora 2 dataset show that recognition performance can be improved by this consideration. The improvement is significant in low signal to noise energy conditions, up to 4% absolute word recognition accuracy. In addition to the power of the proposed method in accurate representation of state-conditional observation distribution, it has an important advantage over previous methods by providing the opportunity to independently select feature spaces for both source and corrupted features. This opens a new window for seeking better feature spaces appropriate for noisy speech, independent from clean speech features.

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

R Discovery Prime

R Discovery Prime

Modeling State-Conditional Observation Distribution Using Weighted Stereo Samples for Factorial Speech Processing Models

Abstract

Talk to us

Similar Papers

More From: Circuits, Systems, and Signal Processing

Lead the way for us

Journal: Circuits, Systems, and Signal Processing	Publication Date: Apr 6, 2016
Citations: 3

Similar Papers

Factorial speech processing models for noise-robust automatic speech recognition
Mahdi Khademian ... Mohammad Mehdi Homayounpour
-
Mahdi Khademian, et. al.Mahdi Khademian ... Mohammad Mehdi Homayounpour
01 May 2015
01 May 2015

Noise-Adaptive LDA: A New Approach for Speech Recognition Under Observation Uncertainty
Dorothea Kolossa ... Rahim Saeidi
IEEE Signal Processing Letters | VOL. 20
Dorothea Kolossa, et. al.Dorothea Kolossa ... Rahim Saeidi
01 Nov 2013
IEEE Signal Processing Letters | VOL. 20

Introduction of a reliability measure in missing data approach for robust speech recognition
...
-
, et. al. ...
01 Sep 2000
01 Sep 2000

Dynamic Minimum Subband Spectral Subtraction and Its Application in Robust Speech Recognition
Xin Ma ... Yuhua Peng
-
Xin Ma, et. al. Xin Ma ... Yuhua Peng
30 Aug 2006
30 Aug 2006

Editage

Paperpal

R Discovery

Mind the Graph

R Discovery Prime

R Discovery Prime

Modeling State-Conditional Observation Distribution Using Weighted Stereo Samples for Factorial Speech Processing Models

Abstract

Talk to us

Similar Papers

More From: Circuits, Systems, and Signal Processing