没有合适的资源?快使用搜索试试~ 我知道了~
引入外部知识的社交平台立场检测模型.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 119 浏览量
2023-02-23
20:13:56
上传
评论
收藏 663KB DOCX 举报
温馨提示
试读
13页
引入外部知识的社交平台立场检测模型.docx
资源推荐
资源详情
资源评论
摘要
针对社交平台的用户评论进行立场检测,旨在对某一特定话题下的用户评论进行立场分类。现有立
场检测研究只关注评论文本的内部语义特征,而忽略了与评论文本相关的外部知识。通过将评论的
关键信息映射到知识图谱中,以检索与该关键信息有关的外部知识,并将外部知识引入到模型中进
行立场检测任务,该方法可通过提供可能对立场检测任务至关重要的背景知识来提升分类效果。在
构建立场检测模型时,除考虑评论的文本特征外,采用门控图神经网络方法融合评论之间的结构信
息,从而提取相关评论的相互影响情况。实验结果表明,与已有解决该问题的 立场 检测 模型 相比 ,
该模型取得了较好的检测结果。将评论的文本特征与结构信息相结合并引入外部知识,可有效提升
模型的立场检测性能。
Abstract
Stance detection for user comments on social platforms aims to classify the stance
of users' reviews towards a specific topic. Existing stance detection studies only
focus on the internal semantic features of reviews text, while ignoring the external
knowledge associated with the text of the review. Retrieve external knowledge
related to the key information of a comment by mapping it to a knowledge graph
and introduce the external knowledge into the model for the stance detection task,
which can improve the classification result by providing background knowledge that
may be crucial to the stance detection task. In addition to considering the textual
features of reviews when constructing the stance detection model, employs a
gated graph neural network approach to fuse the structural information between
reviews which can capture the interactions of related reviews. The experiment
shows that the model achieves better stance detection results compared with
existing stance detection models for solving this problem. By combining the textual
features and structural information of reviews and introducing external knowledge,
the performance of the stance detection model can be effectively improved.
译
关键词
立场检测; 门控图神经网络; 知识图谱; 结构信息
Keywords
stance detection; gated graph neural network; knowledge graph; structural
information
译
0 引言
立场是在给定话题下用户观点的表达,而立场检测是自动检测用户对于给定话题发表的评论是支持、
反对或者中立
[ 1 ]
。随着社交媒体的不断发展,人们更愿意通过微博、Twitter 及 Facebook 等在
线社交平台来表达自己的观点立场,发表对热门话题的评论,使得从在线评论中自动提取特征信息
进行立场检测得到了学术界的广泛关注
[ 2]
。
随着立场研究的发展,立场检测任务在国内的 NLPCC 及国外的 Semeval 等多个竞赛中被相继提
出。根据这些竞赛提出的立场检测任务,有诸多学者利用该任务提供的数据集 构建 立场 检测 模型 。
如 Vijayaraghavan 等
[ 3]
首先将给定数据根据立场类别进行划分,然后基于卷积神经网络(CNN)
分别从单词级和字符级两个层面构建立场检测模型,最后针对每个类别的数据选择两个检测模型中
性能最佳的模型进行预测。实验结果表明,该方法具有一定的鲁棒性,但是采用多个深度学习模型
的方法存在计算量过大的问题。为了减少计算量,Siddiqua 等
[ 4]
提出基于深度学习方法的单个立
场检测模型,该模型利用卷积核过滤输入的评论文本嵌入表征,然后将过滤好的向量分别输入到基
于注意力机制的双向长短期记忆网络(Bi-LSTM)
[ 5]
和嵌入的长短期记忆网络(LSTM)
[ 6]
中得
到特征向量,最后将两个特征拼接后进行分类。该模型通过构建基于注意力机制的长短期记忆网络
集成模型,从而有效捕获立场信息。
目前已有研究采用的方法大多是基于评论文本特征的模型,而这些模型无法捕获到评论与评论之间
的网络结构关系
[ 7 ]
。为获取评论之间的网络结构关系,本文采用门控图神经网络(GGNN)技术
捕获评论的立场特征。此外,还有研究在对评论进行数据预处理时,将手动提取的文本特征和预训
练模型(如 word2vec、bert 等)获取的特征向量相结合,得到评论的表征向量
[ 8]
。虽然采用这
些方法可有效提高立场检测的准确性,但是对于一些给出文本信息不足的评论并不能有效提取特征
信息。Kapanipathi 等
[ 9]
的研究表明,通过引入外部知识提供评论文本的背景知识,可有效应对
文本上下文信息有限的问题。因此,本文通过知识图谱对评论的关键信息引入外部知识,并基于
RGCN 模型获取评论的特征表示。
本文训练了一个引入外部知识的门控神经网络模型 KRGGNN,在捕获评论与评论之间网络结构关
系的同时,解决了评论文本可提取信息不足的问题。首先,利用开源的知识图谱 WordNet 针对评
论文本关键单词进行外部知识的引入,并将这些知识作为实体构建图模型,然后利用 RGCN 获取
推文的文本表征,接下来将评论之间的网络结构及相应的表征向量输入到 GGNN 中获取立场信息,
最后将最终评论的特征向量输入到 Softmax 层进行立场分类。
1 相关研究
随着互联网信息技术的发展,立场检测任务在多个竞赛中被相继提出。立场检测研究方法主要分为
以下两类:
(1)基于特征工程的机器学习立场检测方法。传统研究主要采用机器学习方法进行文本立场检测,
包括支持向量机(SVM)、逻辑回归、朴素贝叶斯以及决策树等。Küçük 等
[ 10]
针对多目标的立场
检测任务,采用 SVM 分类器对与体育相关的 3 个不同版本的推文进行立场分类,同时在对推文进
行特征表示时使用了联合特征;Addawood 等
[ 11]
分别采用 SVM、朴素贝叶斯及决策树对推文进
行立场分类,同时在构建文本特征时结合了情感、推文论证等多个特征。实验结果表明,推文的情
感及语气等对立场分类起着重要影响,基于 SVM 的模型在测试集中取得了较好效果。但是,这些
研究主要通过人工提取特征构建文本特征表示,通过输入分类器进行信息获取,因此人工成本较高。
(2)基于深度学习的立场检测方法。与传统机器学习方法不同,基于深度学习的方法能够对文本
特征进行自学习与筛选,不仅能减少人力成本,而且能提升模型的稳定性。Mohtarami 等
[ 12]
利用
端到端的方式自动进行立场检测,分别利用 CNN 和 LSTM 对输入的推文信息进行特征提取,引入
相似性矩阵计算与推文目标话题或声明的相关性,提取与声明或话题更相关的文本特征信息。虽然
该方法可自动学习文本特征,并能获取有利的文本信息,但其只关注评论的文本特征,而忽略了评
论相互之间的网络结构信息。Kochkina 等
[ 13]
以社交平台推文为对象,基于评论之间的相互关系
建立多个分支,并利用 LSTM 实现构建的评论分支中前后评论之间信息的相互传递。该方法将文本
特征与推文之间的网络结构信息相结合,可有效地捕获推文立场信息。Li 等
[ 14]
以新闻文章为研究
对象,采用 Hierarchical LSTM
[ 15]
等多种方法,基于图卷积神经网络(GCN)对以政治人物、用
户和新闻文章为对象构建的图模型,获取推文之间的网络信息。实验结果表明,联合文本与网络特
征进行立场检测的效果明显优于仅利用其中之一的特征进行立场检测。因此,本文在构建评论文本
特征的基础上,根据评论之间的网络结构构建图模型,并利用 GGNN 获取评论之间的网络结构信
息。
针对立场检测任务,给定评论的文本语言表达情况对最终分类结果起着非常重要的影响。然而,目
前大多数研究的关注重点仅限于给定的评论文本,若遇到文本质量不佳或可获 取信 息不 足的 情况 ,
则可能导致最终的预测效果不佳。Kapanipathi 等
[ 9]
将立场检测转变为文本蕴含任务,利用知识
图谱实现文本外部知识的引入,提取句子内外相关实体构建图模型,并利用 RGCN 进行分类。Li
等
[ 14]
提取句子的有用词,针对这些词引入同义词、上位词、下位词等外部信息,并利用注意力机
制对其进行编码,最终进行句子分类。以上研究表明,对给定的目标对象引入外部知识可有效弥补
句子内部缺失的信息。本文在进行立场检测前对评论文本进行关键词提取,利用 WordNet 知识图
谱检索与该关键词有关的其他词汇以构建知识图模型,再利用 RGCN 进行推文特征提取以获取推
文的初始表征。
针对 RumorEval 2019 的立场检测问题, 本文不 仅将推文的文本特 征与网 络结构相结合,利用
GGNN 进行立场检测,而且在构建文本表征时通过引入文本外部知识,获取基于评论文本的额外背
景知识。
2 基于 GGNN 并引入外部知识的立场检测模型
本文利用 WordNet 知识图谱 对数据 集的评论信息引入外部知识, 补全评 论文本 可能缺 失的信 息。
本文提取评论文本中的关键单词映射到知识图谱中构建节点,并检索与该节点相关的一阶邻点以获
取全局图 G。为了提取知识图谱中有价值的信息,通过 PPR 过滤方法对该全局图 G 提取相关子图
G', 并 利 用 RGCN 进 行 图 表 示 学 习 , 进 而 获 取 评 论 的 知 识 表 示 。 同 时 , 利 用 门 控 神 经 网 络
(GGNN)技术将评论文本特征与评论结构关系相结合进行立场检测。具体模型架构 KRGGNN 如
图 1 所示。
剩余12页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3588
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功