基于不确定性损失函数和任务层级注意力机制的多任务谣言检测研究.docx资源-CSDN文库

版权申诉

文档资料

11 浏览量 2022-06-26 15:02:13 上传评论收藏 379KB DOCX 举报

资源推荐

资源详情

资源评论

1 引言

近年来互联网科技发展迅速以微博、知乎、论坛等为代表的社交媒体在信

息传播方面扮演着越来越重要的角色。人们仅仅需要一台移动通信设备 便可在

社交平台上发布和传播信息。每天数以亿计的信息在各个平台自由流动 为谣言

的产生和传播提供前所未有的有利条件。而谣言通常被认定为为达某种目的而

被凭空捏造的信息。这类信息的传播可能会对社会生活、经济、政治等各个方

面带来重大影响因此谣言识别一直是亟待解决的热点和难点问题。

 等







将谣言识别细分为以下  个子任务如图





所示。谣言勘探：该

任务从海量的文本中将无法辨别真伪的信息筛选出来 这些信息被视为疑似谣言

文本并在接下来的任务中做进一步判别谣言追踪：一旦疑似谣言信息被确认之

后关联追踪其相关信息包括但不限于评论信息和用户相关信息立场检测：通过

疑似谣言下的相关评论确定用户的态度谣言检测：作为谣言识别的最终步骤用

于判断疑似谣言的真假。

图 

图 1谣言识别流程

Fig.1Rumor Identification Process

目前国内外对于谣言识别研究主要聚焦于单一的谣言检测任务采用基于内

容的谣言检测方法







通过谣言传播过程的文本特征







、用户内容特征







以及随时

间变化的趋势







进行谣言识别。但谣言识别研究中多个任务如何相互作用如何将

各个任务作为一个整体以有效地解决谣言问题是一个十分值得探究且有意义的

课题。已有的多任务谣言检测







研究对于各个任务的层次关系的界定都是通过

人工设定各个任务的权重将任务划分为主任务和辅助任务。该方法存在以下不

足：首先各个任务间设定一个合理的权重关系需要对于数据分布有着深刻的理

解和大量的实验基础其次当模型更换不同的数据集各个任务间的权重是否需要

发生变化有待考究。因此人工划分主任务和辅助任务是否具有必要是一个值得

讨论的问题。

基于以上问题本文通过引入同方差不确定性对损失函数加以优化并使用层

级注意力机制对模型加以改进使模型在训练不同的数据集时自发寻找任务之间

的最优权重避免人工划分主任务和辅助任务最终得到满意效果。本文以谣言检

测为解决谣言问题的关键步骤联合谣言勘探和立场检测任务构建基于不确定性

损失函数和任务层级注意力机制的多任务神经网络模型。

2 研究现状

近年来国内外学者对于谣言检测已进行大量研究但目前对于谣言检测相关

研究主要以单任务为主。谣言检测早期阶段研究者的注意力主要集中在特征提

取方面。 等







对用户、结构、语言和时间等特征进行综合并计算它们的

相对强度运用统计学习方法区分谣言的真假。 等







使用新浪微博数据集除

了文本的语义特征还将基于客户端的软件特征和基于发送文本的位置特征纳入

模型考虑范围。 等







强调了发布谣言的用户特征提出一种基于规则的方

法以识别  上的政治谣言。人工选择的特征虽然可以增加谣言识别的准确

率但是人工标注可能费时费力不利于实际检测。近年来深度学习的崛起在一定

程度上解决了这个问题。 ! 等

"





使用循环神经网络（ #$  % &

% '#%%）和其衍生模型进行谣言检测得到效果优于手工制作特征的模型。

 等







在 #%% 基础上引入深度注意力机制相比于其他模型取得了更好的效

果。本文使用三个关联任务进行多任务学习通过不同的任务学习不同领域的语

义信息。该方法既有效学习其他特征又避免了耗费过多人工成本实现谣言的自

动化检测。

同时多任务学习在自然语言处理任务中取得了不俗的成绩。在主题 (关系推

理方面 &&  等







使用卷积神经网络  构建出一个以语义角色标注

（ )$  #&  *&#* ）为主任务  包含词性（ + (,(

-$+.）标注、浅层句法分析（ '）、命名实体识别（%)/

01#$%0# ）、语言模型（*!/&*!）的多任务模型。

结果表明各种组合的多任务模型效果均优于单模型效果。在文本分类方面* 等







针对文本多分类任务提出三种不同的多任务贡献分类模型探索不同任务之间

的语义共享提高分类的准确性。在机器翻译方面2 等







使用多任务学习解

决多语言翻译及语料稀疏的问题。在谣言检测方面 3  等







使用跨编码器(解码

器共享的单一注意力机制该模型在资源受限的情况下相比单模型取得了更好效

果 4$' 等







提出基于长短期记忆网络（ *   ( )

!) 1*!）的多任务学习方法构建分别包含谣言勘探、立场检测和谣言

检测任务组合的模型该实验证明所包含的任务越丰富模型准确率越高! 等







在此基础上针对立场检测和谣言检测子任务提出 0(#%% 模型该模型对于每

个子任务附加单独门控循环单元（5/#$ 65#6）层增强提取的

语义信息。* 等







在多任务模型中引入用户信用信息和注意力（7）机

制用于提高谣言检测准确性。

在以往的多任务谣言检测研究中研究者主观为每个任务赋予固定权重划分

主任务和辅助任务。然而主任务和辅助任务划分是否合理有待研究。针对此问

题 等







将多任务模型转化为多目标优化问题寻找帕累托最优解。4/&&

等







在计算机视觉领域基于贝叶斯深度学习的不确定性

"





在联合语义分割、实

例分割和深度回归的多任务模型上取得较好效果。本文对同方差不确定性损失

函数







进行改进使之适用于多任务谣言检测研究并引入层级注意力机制







构建

基于谣言勘探、立场检测和谣言检测的多任务模型框架。

3 基于任务依赖不确定性和注意力机制的多任务谣言检测模型

目前已有的多任务谣言检测方法对于各个任务的层次划分都是通过模型损

失函数表示如公式（）所示







。

Losstotal=∑wiLossi*88&9:*88

;<

其中=Losstotal*88& 为模型的损失函数由各个任务损失函数加权求和

确定=wi 为各个任务的权重=Lossi*88 为第 i 个任务的损失函数。

如何设定 wi更换不同数据集 wi 是否会发生变化多任务谣言检测主观

设定主任务和辅助任务是否合理是一个值得探讨的问题。

本文首次在多任务谣言检测领域引入同方差不确定性 将简单加权求和的损

失函数转化为不确定性损失函数。同时模型在联合谣言勘探、立场检测和谣言

检测的多任务检测模型中引入注意力机制加强模型的语义理解能力。根据每个

任务对谣言检测任务的重要度提供不同的权重增强带有支持、反对等标签的立

场信息和疑似谣言文本信息对于谣言检测任务的影响。

>同方差不确定性和损失函数优化

不确定性是深度学习中一个重要的研究方向







。不确定性可以划分为认知的

不确定性和偶然的不确定性。其中  认知的不确定性（ 0-8)$

6$ 106）用于描述模型本身带有的不确定性由模型的参数决定偶然的

不确定（7& $6$ 176）用于描述观测中固有噪声带来的影响。偶

然的不确定性可以进一步划分为异方差不确定性和同方差不确定性。在多任务

学习中异方差不确定性根据不同的输入具有不同的差别。同方差不确定性不依

赖于输入数据但是在模型中与不同任务有关。

在多任务学习领域同方差不确定性表明了任务的相对置信度反映了分类和

回归问题的不确定性。因此本文将同方差不确定性作为误差项对多任务学习中

各个任务的权重进行优化。基于同方差不确定性中模型依赖于不同任务的特点

推导多任务谣言检测的损失函数。假设模型的语义输入为 x参数矩阵为 W任务

间的误差项为 σ2?模型输出为 fW(x),@;A<对于分类任务的概率估计如公式

（）所示。

p(y∣∣fW(x),σ)=Softmax(1σ2fW(x))-;1,@A?<9,)A?,@A

;<

其中=y1 代表多任务谣言检测中的任务p 为概率估计值。

进一步对于公式（）求极大似然估计如公式（）所示。

logp(y=c∣∣fW(x),σ)=1σ2fWc(x)

−log(∑c'exp(1σ2fWc'(x)))&-;19$,@A?<9?,$@;A<(&:$BA-⁡?,$B@A

;<

其中c 为模型的真实标签=fWc'(x),$B@;A<为 fWc(x),$@;A<中第 c'$B元素的

向量表示。

将公式（  ）扩展到谣言检测多分类任务损失函数

L(W,σ1,σ2,σ3)*;@???<如公式（）所示。

L(W,σ1,σ2,σ3)=−logp(y1,y2,y3=c|

fw(x))=Softmax(y1=c1;fw(x),σ1)⋅Softmax(y2=c2;fw(x),σ2)⋅Soft

max(y3=c3;fw(x),σ3)=∑K=3i=11σ2ifwc(x)−log(∑c′exp(1σ2ifwc′

(x)))=∑K=3i=1(p(y1|fw(x)σ)−log(∑c′iexp(1σ2fwc′i(x))(log(∑c′iexp(fwc

′i(x))))1σ2i)≈∑K=3i=1(Li(W)+log(σi))*;@???<9C&-;1119$D

,;A<<9,)A;19$,;A<?<⋅,)A;19$,;A<?<⋅,)A;19$,;A<?

<9:949?,$;A<C&;:$EA-;?,$E;A<<<9:949;-;1D,;A<?<C&;:$

EA-;?,$E;A<<;&;:$EA-;,$E;A<<<<?<F:949;*;@<G&;?<<

;<

其中=σ1、σ2、σ3?、?、? 分别代表谣言勘探、立场检测、谣言检测任

务的噪声=Li*（W）9=−log(softmax(yi,fW(x)))(&;8,)A;1,@;A<<<为分

类任务 i 的交叉熵损失。为了简化计算  粗略地假设

1σ2∑c'iexp(1σ2fWc'i(x))≈(∑c'iexp(1σ2fWc'i(x)))1σ2i?:$BA-;?,$B@;A<<

F;:$BA-;?,$B@;A<<<?。

最终传统的线性加权求和损失函数转化为通过学习参数 logσi&? 的不确

定性损失函数。模型摒弃了主观设定权重过程因此不需要假定主任务和辅助任

务。在训练过程中模型会自动寻找最优的 logσi&?求得最终的满意解。

>基于注意力机制的多任务谣言检测模型

基于任务层级注意力机制的多任务谣言检测模型结构如图





所示。整个模

型具有三个并行分支依次为谣言勘探任务、谣言检测任务和立场检测任务。各

个任务通过浅层的参数共享补充学习各个领域的相关知识提升模型泛化效果。

图 

剩余15页未读，继续阅读

评论收藏

内容反馈

版权申诉

罗伯特之技术屋

粉丝: 3541
资源: 1万+

基于不确定性损失函数和任务层级注意力机制的多任务谣言检测研究.docx

基于马尔科夫理论的不确定性规划和感知问题研究.docx

基于图注意力机制和Transformer的异常检测.docx

基于注意力机制的社交垃圾文本检测方法.docx

基于并行注意力机制的地面红外目标检测方法.docx

基于TCN和注意力机制的异常检测和定位算法.docx

基于标签嵌入注意力机制的多任务文本分类模型.docx

基于AR虚实图像注意力机制的电缆装配质量检测方法.docx

基于注意力机制的概念化句嵌入研究.docx

基于社会注意力机制的行人轨迹预测方法研究.docx

融合源信息和门控图神经网络的谣言检测研究.docx

基于高斯建模和YoLo V3目标检测的遗留物检测方法.docx

一种基于多关系传播树的谣言检测方法.docx

YOLOv3-A：基于注意力机制的交通标志检测网络.docx

基于深度学习的厨师帽和口罩佩戴的检测方法.docx

基于改进注意力机制的问题生成模型研究.docx

基于多尺度融合注意力机制的人脸表情识别研究.docx

基于单片机的空气质量检测仪研究与设计.docx

研究生作业_基于遗传算法优化多元多目标函数的MATLAB实现.docx

基于注意力机制的多特征融合人脸活体检测.docx

全国计算机等级考试二级Python真题及解析.docx

1000份ppt模版，PPT模板优秀PPT

matlab批量读取excel表格数据并处理画图

导入证书可以解决”无法建立到信任根颁发机构的证书链"问题。

OpenCv车辆识别训练模型

代码随想录知识星球精华-大厂面试八股文第二版v1.2.pdf

Vue-Element UI集成ECharts实现数据统计分析页代码部分(如果帮助到你，感谢关注点赞)

数学建模对乙醇偶合制备C4烯烃的问题研究

STM32F103C8T6中文数据手册

（头歌）计算机组成原理存储系统设计（HUST）1-7关答案

最新资源