Optimized multi-layer self-attention network for feature-level data fusion in emotion recognition

Basamma Umesh Patil,Ashoka Davanageri Virupakshappa,Ajay Prakash Basappa Vijaya

doi:10.11591/ijai.v13.i4.pp4435-4444

Basamma Umesh Patil, Ashoka Davanageri Virupakshappa + Show 1 more

https://doi.org/10.11591/ijai.v13.i4.pp4435-4444

Copy DOI

Abstract

<p>Understanding human emotions across diverse data sources presents challenges in various applications including healthcare, human-machine interaction, security, marketing, and gaming. Prior research has explored fusion techniques to address multimodal data heterogeneity, yet often overlooks the importance of discriminative unimodal information and potential complementarity among fusion strategies. Recognizing emotions from video and audio data poses challenges such as non-verbal cues interpretation, varying expression, ambiguity in context, and the need for nuanced feature extraction to capture subtle emotional nuances accurately. To tackle these issues, it is imperative to employ efficient emotion representation and multimodal fusion techniques, as these tasks have significant importance within the realm of multifaceted recognizing study. This study introduced a novel approach, optimized multi-layer self-attention network for emotion recognition (OMSN-ER), focusing on feature-level data fusion. OMSN-ER precisely assesses emotional states by merging facial and voice data, utilizing a multi-layer progressive dense residual fusion network and a self-attention mountain gazelle convolution neural network. Implemented in Python with the RAVDESS dataset, the methodology achieves exceptional accuracy (0.9908), surpassing benchmarks and demonstrating efficacy in multimodal emotion recognition. This research represents promising advancements in the intricate field of emotion recognition.</p>

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

R Discovery Prime

R Discovery Prime

Optimized multi-layer self-attention network for feature-level data fusion in emotion recognition

Abstract

Talk to us

Similar Papers

More From: IAES International Journal of Artificial Intelligence (IJ-AI)

Lead the way for us

Journal: IAES International Journal of Artificial Intelligence (IJ-AI)	Publication Date: Dec 1, 2024
License type: CC BY-SA 4.0

Similar Papers

Recognizing emotions in spoken dialogue with hierarchically fused acoustic and lexical features
Leimin Tian ... Johanna Moore
-
Leimin Tian, et. al.Leimin Tian ... Johanna Moore
01 Dec 2016
01 Dec 2016

Multi-modal emotion recognition using EEG and speech signals
Qian Wang ... Xiaolei Zhang
Computers in Biology and Medicine | VOL. 149
Qian Wang, et. al.Qian Wang ... Xiaolei Zhang
22 Jul 2022
Computers in Biology and Medicine | VOL. 149

A multimodal fusion emotion recognition method based on multitask learning and attention mechanism
Jinbao Xie ... Yury I Varatnitski
Neurocomputing | VOL. 556
Jinbao Xie, et. al.Jinbao Xie ... Yury I Varatnitski
04 Aug 2023
Neurocomputing | VOL. 556

Multimodal emotion recognition (MER) system
Kevin Tang ... Yun Tie
-
Kevin Tang, et. al.Kevin Tang ... Yun Tie
01 May 2014
01 May 2014

Editage

Paperpal

R Discovery

Mind the Graph

R Discovery Prime

R Discovery Prime

Optimized multi-layer self-attention network for feature-level data fusion in emotion recognition

Abstract

Talk to us

Similar Papers

More From: IAES International Journal of Artificial Intelligence (IJ-AI)