没有合适的资源?快使用搜索试试~ 我知道了~
基于CNN和深层语义匹配的中文实体链接模型.pdf
需积分: 9 1 下载量 27 浏览量
2021-08-03
17:35:08
上传
评论
收藏 1.09MB PDF 举报
温馨提示
知识图谱,事理图谱,事件推理
资源推荐
资源详情
资源评论
基 于 CNN 和深层 语 义 匹 配 的 中 文 实 体 链 接 模 型
吴晓崇 段跃兴 张月琴 闫 雄
太原理工大学信息与计算机学院 山西 晋中
摘 要 实体链接是知识图谱领域的重要研究内容 现有的实体链接模型研究大多集中在对手工特征
的选择上 不能很好地利用实体间的语义信息来实现更高效的实体链接效果 故提出一个基于深度语义
匹配模型和卷积神经网络的实体链接模型 候选实体生成阶段采用构造同名字典 并基于上下文进行字典
扩充 通过匹配来选择候选实体集 通过卷积神经网络来捕获深层语义信息 进行特征提取 并将其作为
语义匹配模型的输入 通过模型训练学习选择出最佳参数 并输出语义相似度最高的候选实体作为实体链
接的结果 在 NLP & CCERL 数据集上较 Ranking SVM 模型准确率提升了 达到
实验结果表明了提出的新模型性能优于当前的主流模型
关键词 实体链接 知识图谱 卷积神经网络 深层语义模型 语义相似度
中图分类号 TP 文献标志码 A
doi
j
issn X
A Chinese entity linking model based on CNN
and deep structured semantic model
WU Xiaochong DUAN Yuexing ZHANG Yue
q
in YAN Xiong
College of Information and Computer Taiyuan University of Technology Jinzhong China
Abstract Entity Linking is an important research content in the field of Knowledge Graph Most of
the existing entity linking models focus on the selection of manual features which cannot make good use
of the semantic information between entities to achieve better efficient entity linking effect Therefore
an improved entity linking model based on deep structured semantic model and convolutional neural net
work is proposed It captures deep semantic information and extracts features through CNN and uses
them as input of the deep structured semantic model It selects the best parameter through model train
ing and outputs candidate entities with the highest semantic similarity as the result of entity linking
Compared with the ranking SVM model the proposed model improves the accuracy by to
on the NLP & CCERL dataset The experimental results show that the proposed model is effective
and superior to the current mainstream model in entity linking tasks
Key words entity linking knowledge graph convolutional neural network deep structured semantic
model semantic similarity
1 引言
知识图谱 KG Knowledge Graph是一种语义
网 知识图谱以图形的方式来展现实体以及实体之
间的关系
实体链接 ELEntity Linking 主要是
用于消除异构数据中实体冲突 指向不明等不一致
性问题
是知识图谱扩充的关键技术 同时也是自
然语言处理领域里众多任务的基本组成部分 随着
网络中文本数据大量涌现 邮件 博客 微博 评论等
收稿日期 修回日期
基金项目 国家自然科学基金
通信地址 山西省晋中市太原理工大学信息与计算机学院
Address College of Information and Computer Taiyuan U niversity of Technology Jinzhong Shanxi P R China
CN TP
ISSN X
计算机工程与科学
Computer Engineering & Science
第 卷第 期 年 月
Vol No Aug
文章编号 X
短文本内容广泛存在 不同于存在丰富的语义信息
的长文本的实体链接 如何提升短文本的实体链接
效果正困扰着众多研究人员 并制约着知识图谱技
术的发展 故研究实体链接对知识图谱构建和扩
充 信息抽取 信息检索和问答系统等有重大意义
2 相关工作
给定一段文本 实体链接的任务是识别实体提
及后在给定的知识库 KBKnowledge Bases 中链
Figure Example of entity linking
图 实体链接示例
接特定实体提及至对应目标实体 如图 所示 以
文本 年世界杯在英格兰举行 月 日晚
英格兰 击败西德 夺得了 年世界杯冠军
最佳球员是查尔顿 最佳射手由尤西比奥获得 为
例 实体链接任务首先要识别出实体提及世界杯
英格兰等 然后将有歧义的实体提及分别链接至
知识库中对应实体 如 第 个世界杯指的是国
际足联世界杯FIFA World Cup 而第 个世界
杯特指 年英格兰世界杯 第 个英格兰指
大不列颠及北爱尔兰联合王国 第 个指英格兰国
家男子足球队
实体链接任务主要解决实体歧义问题 当前用
于解决实体歧义问题的模型大致分为基于概率生成
模型方法 基于主题模型方法 基于图方法和基于深
度学习方法
基于传统概率模型的实体链接方法
主要就是考虑 个实体各自属性的相似性 而并不
考虑实体间的关系 将基于属性相似度评分来判断
实体是否匹配的问题转化为一个分类问题并建立了
该问题的概率模型 主题模型是一种特殊的基于概
率模型的方法 能够在海量数据中找出文字间的语
义主题 一般适用于长文本的实体链接任务 近年
来集成实体链接方法被广泛关注 Han 等人
率先
提出了一种基于图模型的集成实体链接算法 将实
体提及和候选实体视为图的顶点 以实体间的谷歌
距离作为语义相关性测度 建立实体相关图 采用随
机游走方法对图中的候选实体进行排序 得到实体
链接的推荐结果 此后 一系列的基于图的方法相
继被提出 如 基于图模型的维基概念相似度计算方
法
基于图的中文集成实体链接 GCCEL Graph
based Collective Chinese Entity Linking 算法
目
前 最新的研究成果是 Zeng 等人
提出的用于解
决表格实体链接任务的列表集体实体链接Collec
tive ListOnly Entity Linking
随着深度学习方法在自然语言理解领域取得
巨大成功 利用深度学习方法来解决实体的歧义问
题成为当前实体链接研究的主流方向 He 等人
在实体链接任务中首次使用深度学习 模型通过堆
叠去噪自动编码器来学习实体表示 以测量上下文
与实体相似性 Huang 等人
提出了一种基于图
的半监督实体消歧方法 将深度神经网络模型得到
的实体间语义关联度作为图中的边权值 实验结果
证实该方法无论在关联性测试上还是在消歧性能
上都具有更好的测试结果 Zeng 等人
通过使
用基于注意力机制的长短期记忆网络模型完成实
体链接 Luo 等人
提出了深度语义匹配模型来
实现实体消歧 谭咏梅等人
提出的融合卷积神
经网络 CNN Convolutional Neural Network 和
重启随机游走的实体链接方法在指称识别后生成
指称的候选实体集 随后使用融合卷积神经网络和
重启随机游走的实体链接方法对候选实体进行选
择 最后对知识库中无对应实体的指称进行聚类
当前的实体链接方法严重依赖于人工选取的特征
而现有的文本特征往往不能有效地表达文本信息
导致处理实体消歧任务时的性能和计算效率取决
于选取的特征的优劣
针对上述问题 本文在深度语义匹配模型中引
入了卷积神经网络来挖掘深层语义特征 可以避免
绝大多数实体消歧所面临的语义信息利用不足的
问题 同时无需过多手工标注数据
3 CDSSM 模型
本节主要介绍改进的基于卷积神经网络和深
吴晓崇等 基于 CNN 和深层语义匹配的中文实体链接模型
剩余6页未读,继续阅读
资源评论
无名算法专家
- 粉丝: 1
- 资源: 26
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功