Exploiting visual information for NAM recognition

Panikos Heracleous,Viet-Anh Tran,Gérard Bailly,Denis Beautemps,Helene Loevenbruck

doi:10.1587/elex.6.77

Abstract

Non-audible murmur (NAM) is an unvoiced speech received through body tissue using special acoustic sensors (i.e., NAM microphones) attached behind the talkers ear. Although NAM has different frequency characteristics compared to normal speech, it is possible to perform automatic speech recognition (ASR) using conventional methods. In using a NAM microphone, body transmission and the loss of lip radiation act as a low-pass filter; as a result, higher frequency components are attenuated in NAM signal. A decrease in NAM recognition performance is attributed to spectral reduction. To address the problem of loss of lip radiation, visual information extracted from the talker's facial movements is fused with NAM speech. Experimental results revealed a relative improvement of 39% when fused NAM speech and facial information were used as compared to using only NAM speech. Results also showed that improvements in the recognition rate depend on the place of articulation.

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Journal: IEICE Electronics Express	Publication Date: Jan 1, 2009
Citations: 10	License type: free

R Discovery Prime

R Discovery Prime

Exploiting visual information for NAM recognition

Abstract

Talk to us

Similar Papers

More From: IEICE Electronics Express

Lead the way for us

Similar Papers

Analysis and Recognition of NAM Speech Using HMM Distances and Visual Information
Panikos Heracleous ... Takayuki Nagai
IEEE Transactions on Audio, Speech, and Language Processing | VOL. 18
Panikos Heracleous, et. al.Panikos Heracleous ... Takayuki Nagai
01 Aug 2010
IEEE Transactions on Audio, Speech, and Language Processing | VOL. 18

A tissue-conductive acoustic sensor applied in speech recognition for privacy
Panikos Heracleous ... Yoshitaka Nakajima
-
Panikos Heracleous, et. al.Panikos Heracleous ... Yoshitaka Nakajima
12 Oct 2005
12 Oct 2005

Unvoiced Speech Recognition Using Tissue-Conductive Acoustic Sensor
Panikos Heracleous ... Kiyohiro Shikano
EURASIP Journal on Advances in Signal Processing | VOL. 2007
Panikos Heracleous, et. al.Panikos Heracleous ... Kiyohiro Shikano
27 Sep 2006
EURASIP Journal on Advances in Signal Processing | VOL. 2007

Towards Augmentative Speech Communication
Panikos Heracleous ... Norihiro Hagit
-
Panikos Heracleous, et. al.Panikos Heracleous ... Norihiro Hagit
21 Jun 2011
21 Jun 2011

Editage

Paperpal

R Discovery

Mind the Graph

R Discovery Prime

R Discovery Prime

Exploiting visual information for NAM recognition

Abstract

Talk to us

Similar Papers

More From: IEICE Electronics Express