话语水平上的语音情感识别 原始目的 情绪是人类的基础,影响感知和日常活动,例如交流,学习和决策。 最近,SER已引起越来越多的关注。 语音情感识别是一项非常具有挑战性的任务,因为机器无法理解人类的情感状态,因此要提取有效的情感特征是一个悬而未决的问题。 在这个项目中,我们将探索该领域的一些贡献,并找出进行语音情感检测的重要算法。 我们特别有兴趣将人类设计的功能与人类语音中的原始表示进行比较。 语料库 该项目使用的数据是交互式情感和声运动捕捉(IEMOCAP)数据库,该数据库来自南加利福尼亚大学的信号分析和解释实验室。 它包含12个小时的视听数据,包括视频,语音,面部动作捕捉,文本转录[3]。 录音包括专业演员,即兴创作和编写一系列跨越十个不同情感类别的语义中立的话语。 有5位女性演讲者和5位男性演讲者。 表中显示了属于每个情感类别的发声的数量和计数比率。 昂 堆 Exc 诺伊 伤心
评论0
最新资源