引入外部知识的社交平台立场检测模型.docx

版权申诉

119 浏览量 2023-02-23 20:13:56 上传评论收藏 663KB DOCX 举报

资源推荐

资源详情

资源评论

摘要

针对社交平台的用户评论进行立场检测，旨在对某一特定话题下的用户评论进行立场分类。现有立

场检测研究只关注评论文本的内部语义特征，而忽略了与评论文本相关的外部知识。通过将评论的

关键信息映射到知识图谱中，以检索与该关键信息有关的外部知识，并将外部知识引入到模型中进

行立场检测任务，该方法可通过提供可能对立场检测任务至关重要的背景知识来提升分类效果。在

构建立场检测模型时，除考虑评论的文本特征外，采用门控图神经网络方法融合评论之间的结构信

息，从而提取相关评论的相互影响情况。实验结果表明，与已有解决该问题的立场检测模型相比，

该模型取得了较好的检测结果。将评论的文本特征与结构信息相结合并引入外部知识，可有效提升

模型的立场检测性能。

Abstract

Stance detection for user comments on social platforms aims to classify the stance

of users' reviews towards a specific topic. Existing stance detection studies only

focus on the internal semantic features of reviews text， while ignoring the external

knowledge associated with the text of the review. Retrieve external knowledge

related to the key information of a comment by mapping it to a knowledge graph

and introduce the external knowledge into the model for the stance detection task，

which can improve the classification result by providing background knowledge that

may be crucial to the stance detection task. In addition to considering the textual

features of reviews when constructing the stance detection model， employs a

gated graph neural network approach to fuse the structural information between

reviews which can capture the interactions of related reviews. The experiment

shows that the model achieves better stance detection results compared with

existing stance detection models for solving this problem. By combining the textual

features and structural information of reviews and introducing external knowledge，

the performance of the stance detection model can be effectively improved.

译

关键词

立场检测; 门控图神经网络; 知识图谱; 结构信息

Keywords

stance detection; gated graph neural network; knowledge graph; structural

information

译

0 引言

立场是在给定话题下用户观点的表达，而立场检测是自动检测用户对于给定话题发表的评论是支持、

反对或者中立

［ 1 ］

。随着社交媒体的不断发展，人们更愿意通过微博、Twitter 及 Facebook 等在

线社交平台来表达自己的观点立场，发表对热门话题的评论，使得从在线评论中自动提取特征信息

进行立场检测得到了学术界的广泛关注

［ 2］

。

随着立场研究的发展，立场检测任务在国内的 NLPCC 及国外的 Semeval 等多个竞赛中被相继提

出。根据这些竞赛提出的立场检测任务，有诸多学者利用该任务提供的数据集构建立场检测模型。

如 Vijayaraghavan 等

［ 3］

首先将给定数据根据立场类别进行划分，然后基于卷积神经网络（CNN）

分别从单词级和字符级两个层面构建立场检测模型，最后针对每个类别的数据选择两个检测模型中

性能最佳的模型进行预测。实验结果表明，该方法具有一定的鲁棒性，但是采用多个深度学习模型

的方法存在计算量过大的问题。为了减少计算量，Siddiqua 等

［ 4］

提出基于深度学习方法的单个立

场检测模型，该模型利用卷积核过滤输入的评论文本嵌入表征，然后将过滤好的向量分别输入到基

于注意力机制的双向长短期记忆网络（Bi-LSTM）

［ 5］

和嵌入的长短期记忆网络（LSTM）

［ 6］

中得

到特征向量，最后将两个特征拼接后进行分类。该模型通过构建基于注意力机制的长短期记忆网络

集成模型，从而有效捕获立场信息。

目前已有研究采用的方法大多是基于评论文本特征的模型，而这些模型无法捕获到评论与评论之间

的网络结构关系

［ 7 ］

。为获取评论之间的网络结构关系，本文采用门控图神经网络（GGNN）技术

捕获评论的立场特征。此外，还有研究在对评论进行数据预处理时，将手动提取的文本特征和预训

练模型（如 word2vec、bert 等）获取的特征向量相结合，得到评论的表征向量

［ 8］

。虽然采用这

些方法可有效提高立场检测的准确性，但是对于一些给出文本信息不足的评论并不能有效提取特征

信息。Kapanipathi 等

［ 9］

的研究表明，通过引入外部知识提供评论文本的背景知识，可有效应对

文本上下文信息有限的问题。因此，本文通过知识图谱对评论的关键信息引入外部知识，并基于

RGCN 模型获取评论的特征表示。

本文训练了一个引入外部知识的门控神经网络模型 KRGGNN，在捕获评论与评论之间网络结构关

系的同时，解决了评论文本可提取信息不足的问题。首先，利用开源的知识图谱 WordNet 针对评

论文本关键单词进行外部知识的引入，并将这些知识作为实体构建图模型，然后利用 RGCN 获取

推文的文本表征，接下来将评论之间的网络结构及相应的表征向量输入到 GGNN 中获取立场信息，

最后将最终评论的特征向量输入到 Softmax 层进行立场分类。

1 相关研究

随着互联网信息技术的发展，立场检测任务在多个竞赛中被相继提出。立场检测研究方法主要分为

以下两类：

（1）基于特征工程的机器学习立场检测方法。传统研究主要采用机器学习方法进行文本立场检测，

包括支持向量机（SVM）、逻辑回归、朴素贝叶斯以及决策树等。Küçük 等

［ 10］

针对多目标的立场

检测任务，采用 SVM 分类器对与体育相关的 3 个不同版本的推文进行立场分类，同时在对推文进

行特征表示时使用了联合特征；Addawood 等

［ 11］

分别采用 SVM、朴素贝叶斯及决策树对推文进

行立场分类，同时在构建文本特征时结合了情感、推文论证等多个特征。实验结果表明，推文的情

感及语气等对立场分类起着重要影响，基于 SVM 的模型在测试集中取得了较好效果。但是，这些

研究主要通过人工提取特征构建文本特征表示，通过输入分类器进行信息获取，因此人工成本较高。

（2）基于深度学习的立场检测方法。与传统机器学习方法不同，基于深度学习的方法能够对文本

特征进行自学习与筛选，不仅能减少人力成本，而且能提升模型的稳定性。Mohtarami 等

［ 12］

利用

端到端的方式自动进行立场检测，分别利用 CNN 和 LSTM 对输入的推文信息进行特征提取，引入

相似性矩阵计算与推文目标话题或声明的相关性，提取与声明或话题更相关的文本特征信息。虽然

该方法可自动学习文本特征，并能获取有利的文本信息，但其只关注评论的文本特征，而忽略了评

论相互之间的网络结构信息。Kochkina 等

［ 13］

以社交平台推文为对象，基于评论之间的相互关系

建立多个分支，并利用 LSTM 实现构建的评论分支中前后评论之间信息的相互传递。该方法将文本

特征与推文之间的网络结构信息相结合，可有效地捕获推文立场信息。Li 等

［ 14］

以新闻文章为研究

对象，采用 Hierarchical LSTM

［ 15］

等多种方法，基于图卷积神经网络（GCN）对以政治人物、用

户和新闻文章为对象构建的图模型，获取推文之间的网络信息。实验结果表明，联合文本与网络特

征进行立场检测的效果明显优于仅利用其中之一的特征进行立场检测。因此，本文在构建评论文本

特征的基础上，根据评论之间的网络结构构建图模型，并利用 GGNN 获取评论之间的网络结构信

息。

针对立场检测任务，给定评论的文本语言表达情况对最终分类结果起着非常重要的影响。然而，目

前大多数研究的关注重点仅限于给定的评论文本，若遇到文本质量不佳或可获取信息不足的情况，

则可能导致最终的预测效果不佳。Kapanipathi 等

［ 9］

将立场检测转变为文本蕴含任务，利用知识

图谱实现文本外部知识的引入，提取句子内外相关实体构建图模型，并利用 RGCN 进行分类。Li

等

［ 14］

提取句子的有用词，针对这些词引入同义词、上位词、下位词等外部信息，并利用注意力机

制对其进行编码，最终进行句子分类。以上研究表明，对给定的目标对象引入外部知识可有效弥补

句子内部缺失的信息。本文在进行立场检测前对评论文本进行关键词提取，利用 WordNet 知识图

谱检索与该关键词有关的其他词汇以构建知识图模型，再利用 RGCN 进行推文特征提取以获取推

文的初始表征。

针对 RumorEval 2019 的立场检测问题，本文不仅将推文的文本特征与网络结构相结合，利用

GGNN 进行立场检测，而且在构建文本表征时通过引入文本外部知识，获取基于评论文本的额外背

景知识。

2 基于 GGNN 并引入外部知识的立场检测模型

本文利用 WordNet 知识图谱对数据集的评论信息引入外部知识，补全评论文本可能缺失的信息。

本文提取评论文本中的关键单词映射到知识图谱中构建节点，并检索与该节点相关的一阶邻点以获

取全局图 G。为了提取知识图谱中有价值的信息，通过 PPR 过滤方法对该全局图 G 提取相关子图

G'，并利用 RGCN 进行图表示学习，进而获取评论的知识表示。同时，利用门控神经网络

（GGNN）技术将评论文本特征与评论结构关系相结合进行立场检测。具体模型架构 KRGGNN 如

图 1 所示。

剩余12页未读，继续阅读

评论收藏

内容反馈

版权申诉

罗伯特之技术屋

粉丝: 3588
资源: 1万+

引入外部知识的社交平台立场检测模型.docx

基于Python的上下班时间预测模型.docx

企业数字化转型：数字化成熟度评估模型.docx

高级信息系统项目管理师软件工程知识考试卷模拟考试题.docx.docx

研究生数学建模竞赛A题 无线智能传播模型.docx

售前会用到的26个顶尖战略咨询分析模型.docx

(完整版)智慧社区需求分析及评估模型.docx

文本立场检测综述.docx

云迁移安全(一)：Gartner的5R安全迁移模型.docx

构建合作型团队5.1、如何创建合作型团队思维模型.docx

基于高斯建模和YoLo V3目标检测的遗留物检测方法.docx

基于89C51单片机的粮食水分温度综合检测仪.docx

一种基于YOLO v3神经网络的工业零件检测方法.docx

搭建高斯白噪声信道下的二进制频移键控(FSK)模型.docx

数电课程设计,15进制计数器,串行序列检测器.docx

基于深度学习的厨师帽和口罩佩戴的检测方法.docx

一种基于YOLOv3优化算法的交通灯检测方法.docx

(完整word版)基于单片机的环境温湿度检测系统.docx

利用UML和ROSE工具,建立“图书馆管理系统”的完整模型.docx

行业知识库平台解决方案设计.docx

相关实用应用程序（Windows可用）

免费可用的ChatGPT网页版.zip

ChatGPT使用总结：150个ChatGPT提示词模板（完整版）

chromedriver-win64.zip

全国计算机二级WPSoffice精选350道选择题题库（含答案）.pdf

哈尔滨工业大学-ChatGPT调研报告-2023.3.6-94页.pdf

农村公交与异构无人机协同配送优化

李飞飞自传 我看见的世界 The World I see

4个亲测好用的ChatGPT4渠道

2023泛娱乐社交出海手册-ZEGO即构科技

最新资源

研究生数学建模竞赛A题无线智能传播模型.docx

李飞飞自传我看见的世界 The World I see