Neural Network Modelling of Speech Emotion Detection

Y Sri Lalitha,Althaf Hussain Basha Sk,M V Aditya Nag,S Tummala,S Kosaraju,S Singh,P Bobba

doi:10.1051/e3sconf/202130901139

Y Sri Lalitha, Althaf Hussain Basha Sk + Show 5 more

Open Access

https://doi.org/10.1051/e3sconf/202130901139

Copy DOI

Journal: E3S Web of Conferences	Publication Date: Jan 1, 2021
Citations: 3	License type: CC BY 4.0

Affiliation: Guntur Medical College

Abstract

In making the Machines Intelligent, and enable them to work as human, Speech recognition is one of the most essential requirement. Human Language conveys various types of information such as the energy, pitch, loudness, rhythm etc., in the sound, the speech and its context such as gender, age and the emotion. Identifying the emotion from a speech pattern is a challenging task and the most useful solution especially in the era of widely developing speech recognition systems with digital assistants. Digital assistants like Bixby, Blackberry assistant are building products that consist of emotion identification and reply the user in step with user point of view. The objective of this work is to improve the accuracy of the speech emotion prediction using deep learning models. Our work experiments with the MLP and CNN classification models on three benchmark datasets with 5700 speech files of 7 emotion categories. The proposed model showed improved accuracy.

Highlights

Q PDNLQJ WKH 0DFKLQHV ,QWHOOLJHQW DQG HQDEOLQJ WKHP WR ZRUN DV KXPDQ 6SHHFK UHFRJQLWLRQ LV RQH RI WKH HVVHQWLDO UHTXLUHPHQWV 8QGHUVWDQGLQJ RQHV (PRWLRQV DQG UHVSRQGLQJ VXLWDEO\ LQ D KXPDQ FRPSXWHU FRQYHUVDWLRQV PDNHV PDFKLQHV PRUH UHOLDEOH 'HWHUPLQLQJ HIILFLHQW WHFKQLTXHV WR LGHQWLI\ WKH HPRWLRQV LQ WKH VSHHFK VLJQDO KDV D YDULHW\ RI DSSOLFDWLRQV $V ZH KDYH EHHQ XVLQJ PDQ\ FRPSXWHU DSSOLFDWLRQV LQ RXU GD\ WRGD\ OLIH UHFRJQL]LQJ WKH HPRWLRQ KDV D VLJQLILFDQW LQIOXHQFH DQG KDV EHFRPH D GHPDQG IURP PDUNHWV WR PHGLFDO PDQDJHPHQW (PRWLRQ GHWHFWLRQ LV XVHG LQ PHGLFDO ILHOG ZKLFK KHOSV LQ VSRWWLQJ PHQWDO LVVXHV E\ GHWHUPLQLQJ 3DWLHQWV 6SHHFK SDWWHUQV>@ LQ EXVLQHVV PDUNHWLQJ XQGHUVWDQGLQJ FXVWRPHU¶V UHTXLUHPHQWV HQDEOHV FXVWRPL]HG SURPRWLRQ RI WKH SURGXFWV DQG LQ ( &RPPHUFH VLWHV VXFK DV $PD]RQ RU )OLSNDUW WR NQRZ WKH FXVWRPHU IHHGEDFN RI D SURGXFW QHHG HIILFLHQW VSHHFK HPRWLRQ UHFRJQLWLRQ V\VWHPV ,GHQWLI\LQJ HPRWLRQ LV D FKDOOHQJLQJ ZRUN EHFDXVH HPRWLRQV DUH VXEMHFWLYH LQGLYLGXDOV ZRXOG GUDZ RXW WKHP GLIIHUHQWO\ 7KH FRPSOH[LW\ RI 6(5 DOVR LQFOXGHV YDULRXV RWKHU IDFWRUV VXFK DV ODQJXDJH SLWFK HQHUJ\ ORXGQHVV UK\WKP HWF LQ WKH VRXQG VLJQDO DORQJ ZLWK WKH FRQWH[W VXFK DV JHQGHU DJH ZRUGV WLPH GXUDWLRQ RI D VLJQDO DQG HPRWLRQ DOO RI WKHVH ZLOO KDYH DQ LQIOXHQFH RQ WKH NLQG RI HPRWLRQ ZH DUH GHWHUPLQLQJ
Research of speech emotion recognition based on deep belief network and SVM 0DWK 3URE (QJJ & +XDQJ : *RQJ : )X DQG ' )HQJ 3A

Summary

Introduction

Q PDNLQJ WKH 0DFKLQHV ,QWHOOLJHQW DQG HQDEOLQJ WKHP WR ZRUN DV KXPDQ 6SHHFK UHFRJQLWLRQ LV RQH RI WKH HVVHQWLDO UHTXLUHPHQWV 8QGHUVWDQGLQJ RQHV (PRWLRQV DQG UHVSRQGLQJ VXLWDEO\ LQ D KXPDQ FRPSXWHU FRQYHUVDWLRQV PDNHV PDFKLQHV PRUH UHOLDEOH 'HWHUPLQLQJ HIILFLHQW WHFKQLTXHV WR LGHQWLI\ WKH HPRWLRQV LQ WKH VSHHFK VLJQDO KDV D YDULHW\ RI DSSOLFDWLRQV $V ZH KDYH EHHQ XVLQJ PDQ\ FRPSXWHU DSSOLFDWLRQV LQ RXU GD\ WRGD\ OLIH UHFRJQL]LQJ WKH HPRWLRQ KDV D VLJQLILFDQW LQIOXHQFH DQG KDV EHFRPH D GHPDQG IURP PDUNHWV WR PHGLFDO PDQDJHPHQW (PRWLRQ GHWHFWLRQ LV XVHG LQ PHGLFDO ILHOG ZKLFK KHOSV LQ VSRWWLQJ PHQWDO LVVXHV E\ GHWHUPLQLQJ 3DWLHQWV 6SHHFK SDWWHUQV>@ LQ EXVLQHVV PDUNHWLQJ XQGHUVWDQGLQJ FXVWRPHU¶V UHTXLUHPHQWV HQDEOHV FXVWRPL]HG SURPRWLRQ RI WKH SURGXFWV DQG LQ ( &RPPHUFH VLWHV VXFK DV $PD]RQ RU )OLSNDUW WR NQRZ WKH FXVWRPHU IHHGEDFN RI D SURGXFW QHHG HIILFLHQW VSHHFK HPRWLRQ UHFRJQLWLRQ V\VWHPV ,GHQWLI\LQJ HPRWLRQ LV D FKDOOHQJLQJ ZRUN EHFDXVH HPRWLRQV DUH VXEMHFWLYH LQGLYLGXDOV ZRXOG GUDZ RXW WKHP GLIIHUHQWO\ 7KH FRPSOH[LW\ RI 6(5 DOVR LQFOXGHV YDULRXV RWKHU IDFWRUV VXFK DV ODQJXDJH SLWFK HQHUJ\ ORXGQHVV UK\WKP HWF LQ WKH VRXQG VLJQDO DORQJ ZLWK WKH FRQWH[W VXFK DV JHQGHU DJH ZRUGV WLPH GXUDWLRQ RI D VLJQDO DQG HPRWLRQ DOO RI WKHVH ZLOO KDYH DQ LQIOXHQFH RQ WKH NLQG RI HPRWLRQ ZH DUH GHWHUPLQLQJ.

Results

Conclusion

Full Text

Paper version not known

Open DOI Link

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

R Discovery Prime

R Discovery Prime

Neural Network Modelling of Speech Emotion Detection

Abstract

Highlights

Summary

Talk to us

Similar Papers

More From: E3S Web of Conferences

Lead the way for us

Similar Papers

Recognition of Emotion with Intensity from Speech Signal Using 3D Transformed Feature and Deep Learning
Md Riadul Islam ... M A H Akhand
Electronics | VOL. 11
Md Riadul Islam, et. al.Md Riadul Islam ... M A H Akhand
28 Jul 2022
Electronics | VOL. 11

Automated English Speech Recognition Using Dimensionality Reduction with Deep Learning Approach
Jing Yu ... Lu Han
Wireless Communications and Mobile Computing | VOL. 2022
Jing Yu, et. al.Jing Yu ... Lu Han
07 Mar 2022
Wireless Communications and Mobile Computing | VOL. 2022

Deep Learning Model Compression Techniques: Advances, Opportunities, and Perspective
Hubert Msuya ... Baraka J Maiseli
Tanzania Journal of Engineering and Technology | VOL. 42
Hubert Msuya, et. al.Hubert Msuya ... Baraka J Maiseli
30 Jun 2023
Tanzania Journal of Engineering and Technology | VOL. 42

Robust Machine Learning against Adversarial Samples at Test Time
Jing Lin ... Kaiqi Xiong
-
Jing Lin, et. al.Jing Lin ... Kaiqi Xiong
01 Jun 2020
01 Jun 2020

Editage

Paperpal

R Discovery

Mind the Graph

R Discovery Prime

R Discovery Prime

Neural Network Modelling of Speech Emotion Detection

Abstract

Highlights

Summary

Talk to us

Similar Papers

More From: E3S Web of Conferences