Multimodal Emotion Recognition with Auxiliary Sentiment Information

doi:10.13209/j.0479-8023.2019.105

Acta Scientiarum Naturalium Universitatis Pekinensis ›› 2020, Vol. 56 ›› Issue (1): 75-81.DOI: 10.13209/j.0479-8023.2019.105

Previous Articles Next Articles

Multimodal Emotion Recognition with Auxiliary Sentiment Information

WU Liangqing, LIU Qiyuan, ZHANG Dong^†, WANG Jiancheng, LI Shoushan, ZHOU Guodong

School of Computer Science & Technology, Soochow University, Suzhou 215006

Received:2019-05-22 Revised:2019-09-19 Online:2020-01-20 Published:2020-01-20
Contact: ZHANG Dong, E-mail: dzhang17(at)stu.suda.edu.cn

基于情感信息辅助的多模态情绪识别

吴良庆, 刘启元, 张栋^†, 王建成, 李寿山, 周国栋

苏州大学计算机科学与技术学院, 苏州 215006

通讯作者: 张栋, E-mail: dzhang17(at)stu.suda.edu.cn
基金资助:
国家自然科学基金(61331011, 61375073)资助

Abstract

Abstract:

Different from the previous studies with only text, this paper focuses on multimodal data (text and audio) to perform emotion recognition. To simultaneously address the characteristics of multimodal data, we propose a novel joint learning framework, which allows auxiliary task (multimodal sentiment classification) to help the main task (multimodal emotion classification). Specifically, private neural layers are designed for text and audio modalities from the main task to learn the uni-modal independent dynamics. Secondly, with the shared neural layers from auxiliary task, we obtain the uni-modal representations of the auxiliary task and the auxiliary representations of the main task. The uni-modal independent dynamics is combined with the auxiliary representations for each modality to acquire the uni-modal representations of the main task. Finally, in order to capture multimodal interactive dynamics, we fuse the text and audio modalities’ representations for the main and auxiliary tasks separately to obtain the final multimodal emotion and sentiment representations with the self attention mechanism. Empirical results demonstrate the effectiveness of our approach to multimodal emotion classification task as well as the sentiment classification task.

Key words: multimodal, emotion recognition, joint learning, sentiment analysis

摘要：

不同于纯文本的情绪分析, 本文面向多模态数据(文本和语音)进行情绪识别研究。为了同时考虑多模态数据特征, 提出一种新颖的联合学习框架, 将多模态情绪分类作为主任务, 多模态情感分类作为辅助任务, 通过情感信息来辅助提升情绪识别任务的性能。首先, 通过私有网络层对主任务中的文本和语音模态信息分别进行编码, 以学习单个模态内部的情绪独立特征表示。接着, 通过辅助任务中的共享网络层来获取主任务的辅助情绪表示以及辅助任务的单模态完整情感表示。在得到主任务的文本和语音辅助情绪表示之后, 分别与主任务中的单模态独立特征表示相结合, 得到主任务中单模态情绪信息的完整表示。最后, 通过自注意力机制捕捉每个任务上的多模态交互特征, 得到最终的多模态情绪表示和情感表示。实验结果表明, 本文方法在多模态情感分析数据集上可以通过情感辅助信息大幅度地提升情绪分类任务的性能, 同时情感分类任务的性能也得到一定程度的提升。

关键词: 多模态, 情绪识别, 联合学习, 情感分析

WU Liangqing, LIU Qiyuan, ZHANG Dong, WANG Jiancheng, LI Shoushan, ZHOU Guodong. Multimodal Emotion Recognition with Auxiliary Sentiment Information[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(1): 75-81.

吴良庆, 刘启元, 张栋, 王建成, 李寿山, 周国栋. 基于情感信息辅助的多模态情绪识别[J]. 北京大学学报自然科学版, 2020, 56(1): 75-81.

Add to citation manager EndNote|Ris|BibTeX

URL: https://xbna.pku.edu.cn/EN/10.13209/j.0479-8023.2019.105

https://xbna.pku.edu.cn/EN/Y2020/V56/I1/75

[1]	ZHANG Yazhou, WANG Mengyao, RONG Lu, YU Yang, ZHAO Dongming, QIN Jing. Can ChatGPT Be Served as the Sentiment Expert? An Evaluation of ChatGPT on Sentiment and Metaphor Analysis [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2024, 60(1): 43-52.
[2]	LI Zicheng, CHANG Xiaoqin, LI Yameng, LI Shoushan, ZHOU Guodong. A Joint Learning Approach to Few-Shot Learning for Multi-category Sentiment Classification [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2023, 59(1): 57-64.
[3]	HUANG Jin, XU Shi, CAI Ercong, WU Zhijie, GUO Meimei, ZHU Jia. An Emotion-Cause Pair Extraction Model Based on Multichannel Compact Bilinear Pooling [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2022, 58(1): 21-28.
[4]	LI Xiaojun, SHI Hanxiao, CHEN Nannan, LIU Hong, ZOU Yi. Research on Sentiment Analysis Based on Representation Learning [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2019, 55(1): 105-112.
[5]	YAN Leiming, YAN Luqi, WANG Chaozhi, HE Jiahui, WU Hongyu. Sentence Style Meta Learning for Twitter Classification [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2019, 55(1): 98-104.
[6]	LIU Siye, TIAN Yuan, FENG Yuning, ZHUANG Yulong. Comparison of Tourist Thematic Sentiment Analysis Methods Based on Weibo Data [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2018, 54(4): 687-692.
[7]	Jie JIANG, Rui XIA. Microblog Sentiment Classification via Combining Rule-based and Machine Learning Methods [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2017, 53(2): 247-254.
[8]	Li DONG, Zhongqing WANG, Deyi XIONG. Stock Index Prediction Based on Text Information [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2017, 53(2): 273-278.
[9]	LIU Cuijuan, LIU Zhen, CHAI Yanjie, FANG Hao, LIU Liangping. Research on the Visualization Method of Social Crowd Emotion Based on Microblog Text Data Analysis [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2016, 52(1): 178-186.
[10]	ZHU Zhu,WANG Rong,LI Shoushan,ZHOU Guodong. Recognizing the Ellipsis of Opinion Target in Chinese Text [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2015, 51(2): 315-320.
[11]	CHEN Weiliang,SUN Xiao. Mandarin Speech Emotion Recognition Based on MFCCG-PCA [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2015, 51(2): 269-274.
[12]	OUYANG Chunping,YANG Xiaohua,LEI Longyan,XU Qiang,YU Ying,LIU Zhiming. Multi-strategy Approach for Fine-Grained Sentiment Analysis of Chinese Microblog [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2014, 50(1): 67-72.
[13]	CHEN Qiang,HE Yanxiang,LIU Xule,SUN Songtao,PENG Min,LI Fei. Cross-Language Sentiment Analysis Based on Parser [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2014, 50(1): 55-60.
[14]	HE Feiyan,HE Yanxiang,LIU Nan,LIU Jianbo,PENG Min. A Microblog Short Text Oriented Multi-class Feature Extraction Method of Fine-Grained Sentiment Analysis [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2014, 50(1): 48-54.
[15]	SUN Yan,ZHOU Xueguang,FU Wei. Unsupervised Topic and Sentiment Unification Model for Sentiment Analysis [J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2013, 49(1): 102-108.

Multimodal Emotion Recognition with Auxiliary Sentiment Information

基于情感信息辅助的多模态情绪识别

PDF

Knowledge

Abstract

Cite this article

share this article

References

Related Articles 15

Recommended Articles

Metrics