没有合适的资源?快使用搜索试试~ 我知道了~
医学知识推理研究现状与发展.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 169 浏览量
2022-11-28
20:29:55
上传
评论
收藏 417KB DOCX 举报
温馨提示
![preview](https://dl-preview.csdnimg.cn/87191947/0001-91a4ecea1a1db603623c097407bb2461_thumbnail-wide.jpeg)
![preview-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/scale.ab9e0183.png)
试读
25页
医学知识推理研究现状与发展.docx
资源推荐
资源详情
资源评论
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![](https://csdnimg.cn/release/download_crawler_static/87191947/bg1.jpg)
2012 年,谷歌首次推出了知识图谱,并利用它来提高查询结果 的相关性和
用户的检索体验,为用户提供了更加精确化和智能化的搜索服务
[1]
。知识图谱以
网状的结构、三元组的知识组成形式来显式表示现实世界中的知识,更加简洁
直观,灵活丰富。目前,不同领域内已经创建了很多大型知识图谱库(knowledge
bases,KB),如 DBpedia
[2]
、Freebase
[3]
和 Yago
[4]
等。这些知识图谱库是由大
量的事实以三元组(头实体,关系,尾实体)形式构成的。其中,头实体和尾实体
用图谱中的节点表示,关系由图谱中节点之间的连接边表示。每一个三元组表
达了现实物理世界中的一条知识或事实。最近几年,伴随人工智能的快步发展,
知识图谱逐渐成为了知识服务领域中一个新的研究热点,受到国内外学者和工
业界的聚焦与关注,已经发展成为支撑众多人工智能应用的核心,比如智能化精
准搜索、自动问答、推荐系统和决策支持等
[5]
。
在医学领域,得益于信息化技术的快速发展和医疗信息系统的普及,医学数
据库中积淀了海量的医学知识和临床诊断数据,如果能从这些数据中提炼出知
识,同时对其管理和合理利用,是推进医学智能化和自动化的关键。同时,也能够
为医学知识检索、医疗辅助诊断以及医学档案的智能化管理提供基础。知识图
谱能够有效挖掘、组织和管理大规模数据中的知识,提高知识信息服务质量,从
而也可以在医学领域为医生和病人提供更智能化的服务。尤其近年来人工智能
快步发展和智能医疗、精准医疗和医学辅助诊断的提出,知识图谱在医学领域
逐渐引起重视,受到国内外研究人员广泛的关注
[6-7]
。不断有知识图谱在医学领
域的相关成果和研究被提出。比如,牛津大学建立了称为 LynxKB 的知识图谱
[8]
,主要用以药学相关的研究。日本东北大学提出一种知识图谱来进行面向个体
化预防和医疗的基因组前瞻性队列研究工作
[9]
。中医科学院通过自动化技术构
建了一种中医药知识图谱,用于帮助医生进行辅助诊断
[10]
。吉林大学针对世界
基因组流行病建立了一种基于知识图谱的可视化分析方法
[11]
等。在这些医学知
识图谱中,节点以及节点间的连接边分别囊括了不同的含义。通常,节点的含义
包括:疾病、症状、药物、辅助检查、科室、手术和部位等。节点之间连接边
的含义包含:疾病类型、临床表现、诱发病因、发病机理和机制、预防措施、
药理作用、鉴别方式和诊断方法等。当前医学知识图谱的主要应用涵盖了医学
问答系统、临床决策与支持系统、医学辅助诊断和医学语义精准搜索等方面,
这些研究和成果促进了智能医疗和医学智能自动化的发展,存在着极其广阔的
应用前景和社会价值
[12]
。然而,虽然医学知识图谱取得了较好的应用与发展,却
![](https://csdnimg.cn/release/download_crawler_static/87191947/bg2.jpg)
存在着一些缺陷,其中医学知识图谱由于构建过程中的不完整性严重制约了其
使用效能。如何自动地从已有的医学知识中发掘隐藏的医学知识进而补全医学
知识图谱已成亟待解决的事项。
从海量数据中发掘出隐藏的知识依赖于推理技术的支持。推理是模拟人类
思维的过程,旨在从一个或多个已有的经验知识前提下推理出结论或者新的知
识
[13]
。学术界相继给出了知识推理的基本概念。Nikolas
[14]
认为推理是一系列能
力的集合,这种能力包括理解对象、应用逻辑规则和根据已有知识校准和核验
体系结构的能力。Tari
[15]
将知识推理归纳为基于已知事实和现有逻辑规则推断
出新知识的机制。基于知识图谱的医学知识推理目的主要是从现有的知识图谱
数据中辨别出错误的医学知识数据并发掘推断出新的知识。通过医学知识推理,
可以获得医学知识图谱中现有实体对间新的关系,然后反馈给医学知识图谱,从
而能够扩展和补全现有医学知识图谱,为医学高级应用提供完备的医学知识支
持。基于医学知识图谱广泛的现实应用和补全现有医学知识图谱不完整的缺陷
需求,基于知识图谱的医学知识推理成为当前知识图谱和知识推理研究领域的
热门问题
[16]
。医疗领域知识推理不仅可以补全医学知识图谱,还可以为医疗人
员和病患者提供临床知识及相关诊疗方案进行辅助诊断
[17]
,促进并推动了医疗
诊断智能化的改革与进程。
本文首先针对医学知 识图谱的相关构建技 术和基于知识推理 的医学辅助
诊断进行了总结与归纳。其次重点回顾了医学知识推理的研究现状,并对其推
理方法进行了分类,即:基于逻辑规则的医学推理、基于表示学习的医学推理
以及基于深度学习的医学推理。最后,本文总结了医学知识推理目前面对的一
些挑战和重要问题,并展望了其发展前景和研究趋势。
1 医学知识 图谱 的构 建
本章首先结合标准知识图谱的构建流程,并从医学知识的表示、医学知识
抽取、医学知识融合和质量评估这几个方面结合知识推理来介绍医学知识图谱
的构建
[18-19]
。首先,通过医学知识抽取和表示从大量的非结构化、半结构化和结
构化的医学数据和医学知识中提取出实体、关系和属性等基本要素,并以合理
高效的三元组形式保存到医学知识库中
[20]
。然后,通过医学知识融合中的数据
整合、实体对齐、知识消歧和知识加工分别对医学知识库的知识进行清理和整
![](https://csdnimg.cn/release/download_crawler_static/87191947/bg3.jpg)
合,消除冗余和偏差信息,确保知识的质量,提升知识和数据内部的逻辑性和层
次性。通过知识推理,推断出缺失或者隐藏的知识,自动把医学知识图谱中的旧
知识进行更正与更新,并为知识图谱补充新的知识
[21]
。质量评估主要是通过人
工或者定义规则丢弃构建过程中置信度比较低的医学知识,来提高医学知识图
谱的可信性和准确率,从而确保医学图谱知识和数据的质量。针对以上流程,图
1 描述了医学知识图谱构建的框架和详细过程。
图 1
图 1 医学知识图谱的构建流程
Fig.1 Construction process of medical knowledge graph
1.1 医学 知 识 抽 取
医学知识抽取方式可以划为人类 专家抽取和以机器学习方法自动 的抽取。
人类专家抽取是专家根据经验制定相应的规则从医学信息中提取知识。基于机
器学习方法的医学知识抽取是利用机器学习方法和技术,从原始医学数据中自
动抽取出医学知识。由于人类专家提取的代价较大,通过机器学习方法设计自
动提取技术是知识抽取当前的重点研究方向。医学知识抽取主要是从非结构化、
半结构化和结构化的海量医学知识中提取出实体、关系和属性等基本要素。
1.1.1 医 学 实 体 抽 取
早期的医学实体抽取方法基于医学词典和规则。该方法主要是通过医学专
家定义规则生成医学词典或使用现有医学词典从语料中抽取疾病名、药物名、
![](https://csdnimg.cn/release/download_crawler_static/87191947/bg4.jpg)
症状名等医学实体。Wu 等
[22]
通过 CHV 和 SNOMED- CT 两个医学词典对医疗
诊所笔记中的医学信息进行识别,取得了较好的实验结果。Friedman 等
[23]
通过
自定义语义模式和语法来识别电子病历中的医学信息。Hanisch 等
[24]
通过基于
规则的方法和预处理的同义词词典用于识别生物医学文本中可能出现的实体
名,并将识别结果对齐至蛋白质和基因数据库。Savova 等
[25]
提出了一种临床文
本分析和知识提取系统,采用流水线结构以及基于规则和机器学习的技术来从
电子病历和临床记录中提取信息。Yang 等
[26]
提出一种基于字典的生物医学实
体名称识别方法,并设计了医学术语缩写识别算法对生物医学实体词典进行扩
充。然而,该类方法面临以下挑战:(1)目前没有一个完整的医学词典可以包
括所有类型的医学实体,因此简单的文本匹配算法不足以强大来对实体进行识
别;(2)相同的单词或短语其意义往往根据上下文语境的改变而改变;(3)很
多药物和疾病实体拥有多个名称。因此,该类方法虽然有较高的提取准确度,却
依赖专家编写的规则和医学词典,难以适应数据不断变化的现实情况。
随之,研究者将机器学习算法应用于医学实体抽取中,利用医学数据的特点
对模型进行训练,然后识别实体。与基于规则和词典的方法不同,机器学习方法
需要标准的标注数据集以及合适的算法,然后利用样本数据的统计特征和参数
来构建模型。目前使用到的机器学习算法有隐马尔科夫模型(hidden Markov
model,HMM)、 支持向 量机( support vector machine,SVM)和条件 随机场
(conditional random field,CRF)等。Kazama 等
[27]
使用支持向量机进行生物
医学命名实体识别,同时为了提高训练效果,引入了词缓存和无监督训练等方法。
实验结果表明了所提方法提取准确率高于对比方法,并能应用于大规模知识库
中。Zhou 等
[28]
通过一系列特征训练隐马尔科夫模型,包括词的构成特征、形态
特征、文献内名称别名等,其医学知识的识别准确率达到了 66.5%。Tang 等
[29]
提出 了一 种 结构 支 持向 量 机算 法 来识 别 临床 记 录中 的 实体 名,该算 法结 合 了
CRF 和 SVM 的优点以及单词嵌入的有效表示,取得了高效的识别效果。然而,
基于机器学习的方法需要高质量的数据进行训练,因而对人工标注的专业性要
求较高。
为了降低对数据标注依赖,利用海量未标注数据提升模型性能,深度学习近
些年来也被广泛应用于实体抽取。Collobert 等
[30]
提出一个深层神经网络模型,
取 得 了 超 越 传 统 算 法 的 识 别 效 果 。 Wei 等
[31]
基 于 CRF 和 双 向 循 环 神 经 网 络
(recurrent neural network,RNN)生成特征,再使用 SVM 进行疾病命名实体识
![](https://csdnimg.cn/release/download_crawler_static/87191947/bg5.jpg)
别。 Jagannatha 等
[32]
实现 了 CRF 、 BiLSTM (bi-directional long short-term
memory)和 BiLSTM-CRF 三种模型以及一些改进模型在英文电子病历命名实
体 识 别 中 的 效 果 , 实 验 结 果 表 明 基 于 LSTM 的 模 型 比 CRF 效 果 更 好 , 并 且
BiLSTM 结合 CRF 模型能够进一步提高评测结果的准确率。深度学习方法的
优势在于无需专家制定复杂的抽取特征,神经网络模型可以自动学习到句子中
隐含的语义表示。总结了不同的医学实体抽取方法如表 1 所示。
表 1 医学实体抽取方法
Table 1 Medical entity extraction methods
方法
优点
不足
基于
医学
词典
和规
则
根据医学词典和规则抽取,准确率高
依赖专家编写的规则和医学词典,
难以适应数据不断变化的现实情况
基于
机器
学习
方法
利用医学数据特点进行模型训练,相对简便,识
别效率较高
需要高质量的数据进行训练,因而
对人工标注数据的专业性要求较高
基于
深度
学习
方法
无需专家制定复杂的抽取规则,降低了数据标
注依赖,可利用海量未标注数据提升模型性能
准确率较差,需要人工进行抽取审
核来进一步保证抽取质量
新窗口打开| 下载 CSV
1.1.2 医 学 关 系 抽 取
医学关系抽取的目的是解决医学实体间的语义链接问题。早期的关系抽取
主要是通过人工构造语义规则以及模板的方法识别实体关系。因为人工构造规
则难以应对大规模数据量,所以各种关系抽取模型被提出。这些模型的做法通
常是在两个实体间预定义好要抽取的关系类型,再将抽取任务转换为分类问题
来处理。Uzuner 等
[33]
在句子层面抽取了六类医疗实体关系,使用实体顺序和距
离、链接语法和词汇特征来训练六个 SVM 分类器,实验结果证明了所提方法的
剩余24页未读,继续阅读
资源评论
![avatar-default](https://csdnimg.cn/release/downloadcmsfe/public/img/lazyLogo2.1882d7f4.png)
![avatar](https://profile-avatar.csdnimg.cn/3f07197aad004e4fa57ac5a008eb6aaf_weixin_57147647.jpg!1)
罗伯特之技术屋
- 粉丝: 3969
- 资源: 1万+
![benefits](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-1.c8e153b4.png)
下载权益
![privilege](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-2.ec46750a.png)
C知道特权
![article](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-3.fc5e5fb6.png)
VIP文章
![course-privilege](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-4.320a6894.png)
课程特权
![rights](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-icon.fe0226a8.png)
开通VIP
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![voice](https://csdnimg.cn/release/downloadcmsfe/public/img/voice.245cc511.png)
![center-task](https://csdnimg.cn/release/downloadcmsfe/public/img/center-task.c2eda91a.png)
最新资源
- 全国大学生建模大赛教程.docx
- 华为HCIA-WLAN 3.0 课程视频(45 STA无法上线故障排查.mp4)
- 华为HCIA-WLAN 3.0 课程视频(44 AP无法上线故障排查(下).mp4)
- 华为HCIA-WLAN 3.0 课程视频(43 AP无法上线故障排查(上).mp4)
- python实现基于U-net和MRI图像的膀胱壁边缘以及膀胱肿瘤检测(高准确率)+源码+开发文档+模型训练(毕业设计&课程设计
- 华为HCIA-WLAN 3.0 课程视频(42 WLAN系统维护的方法及故障处理命令.mp4)
- 华为HCIA-WLAN 3.0 课程视频(41 WLAN故障处理一般流程(下).mp4)
- C++基于OpenCV+Qt的人脸识别考勤系统-毕业设计+源代码+文档说明.zip
- python爬虫资源下载
- 华为HCIA-WLAN 3.0 课程视频(40 WLAN故障处理一般流程(上).mp4)
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
![feedback](https://img-home.csdnimg.cn/images/20220527035711.png)
![feedback](https://img-home.csdnimg.cn/images/20220527035711.png)
![feedback-tip](https://img-home.csdnimg.cn/images/20220527035111.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![dialog-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/green-success.6a4acb44.png)