音频分类被认为是模式识别中的巨大挑战。尽管音频分类任务始终被视为独立任务,但任务本质上是彼此相关的,例如说话者的口音和说话者的识别。在本文中,我们提出了一种基于深度神经网络(DNN)的多任务模型,该模型利用了这种关系并同时处理多个音频分类任务。我们将我们的模型称为门控残差网络(GResNets)模型,因为它将深层残差网络(ResNets)与门机制集成在一起,与卷积神经网络(CNN)相比,它可以更好地提取任务之间的表示形式。具体来说,两个乘法卷积层用于替换ResNets中的两个前馈卷积层。我们在多个音频分类任务上测试了我们的模型,发现我们的多任务模型比单独训练模型的特定于任务的模型具有更高的准确性。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~