**医药领域知识图谱:**
发现特定领域的知识图谱,用模板来实现还是挺简洁的。虽然模板会被诟病为维护难、难扩展,给人死板的印象。但仔细分析数据类型、查询语句的结构,还是能提取到许多共同点。这些共同点可用于实体、属性、关系的扩展。
实体数量:4万4左右。
关系数量:29万左右。
<br>
**文件说明:**
一、MedicineSpider:使用scrapy进行医药数据爬取,存储到MongoDb中。
二、0.extract_ontology.py:将爬取保存到MongoDB的数据进行二次处理,得到更简洁的数据存到MongoDB。
三、1.build_medical_graph.py:创建实体、属性、关系,建立医药领域知识图谱,保存到neo4j中。
四、question_classifier.py:利用模板关键词,构建Actree作索引,对用户的提问进行分类。
五、question_parser.py:对用户的提问类别,组成对应的查询语句。
六、answer_search.py:根据问题类别,制作相应的回答模板。将查询得到的结果放入模板中。
七、5.chatbot_graph.py:最终效果运行demo,输入问题得到答案。
<br>
**引用说明:**
引用了[liuhuanyong](https://github.com/liuhuanyong/QASystemOnMedicalKG)博士的一个开源项目,将爬虫部分从Request请求换成了scrapy进行爬取。当作练习scrapy。此外,对抽取了一些实体的共同点,简化了代码实现,逻辑更加清晰了,也更便于维护、扩展。
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
知识图谱是一种结构化的知识表达形式,它以图形的方式组织和存储了大量实体(如人、地点、事件等)及其相互关系。在知识图谱中,实体作为节点,实体之间的各种语义关联则通过边进行连接,形成了一个庞大的数据网络。 知识图谱的核心价值在于其能够精确、直观地表示复杂世界中的知识,并支持高效的知识查询与推理。例如,在搜索引擎中,知识图谱可以提升搜索结果的相关性和准确性,为用户提供直接的答案而非仅仅是网页链接。同时,知识图谱还能支撑高级的人工智能应用,比如问答系统、推荐系统、决策支持等领域。 构建知识图谱的过程通常包括数据抽取、知识融合、实体识别、关系抽取等多个步骤,涉及到自然语言处理、机器学习、数据库技术等多种技术手段。知识图谱的不断完善有助于实现从海量信息中挖掘深层次、有价值的知识,从而推动人工智能向着更加理解人类世界的智慧方向发展。 总之,知识图谱是一个大规模、多领域、多源异构知识集成的载体,是实现智能化信息系统的基础工具和关键基础设施,对于提升信息检索质量、推动智能应用研发具有重要作用。
资源推荐
资源详情
资源评论
收起资源包目录
搭建医药领域知识图谱.zip (38个子文件)
SJT-code
5.chatbot_graph.py 1024B
0.extract_ontology.py 4KB
1.build_medical_graph.py 11KB
.idea
codeStyles
codeStyleConfig.xml 142B
vcs.xml 180B
question_parser.py 3KB
MedicineSpider
Util.py 134B
scrapy.cfg 271B
MedicineSpider
__init__.py 0B
pipelines.py 1008B
spiders
__init__.py 161B
medicine.py 6KB
__pycache__
medicine.cpython-36.pyc 6KB
__init__.cpython-36.pyc 151B
items.py 425B
settings.py 3KB
__pycache__
pipelines.cpython-36.pyc 2KB
settings.cpython-36.pyc 590B
__init__.cpython-36.pyc 143B
items.cpython-36.pyc 524B
middlewares.py 4KB
dyliuti.txt 18.61MB
my_logger.py 2KB
answer_search.py 3KB
question_classifier.py 6KB
.gitignore 64B
README.md 1KB
Common
Util.py 8KB
max_cut.py 4KB
Data
medical.json 44.96MB
dict
food.txt 73KB
producer.txt 496KB
drug.txt 73KB
disease.txt 173KB
symptom.txt 97KB
deny.txt 227B
check.txt 70KB
department.txt 593B
共 38 条
- 1
资源评论
JJJ69
- 粉丝: 6216
- 资源: 5783
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于图像的三维模型重建C++源代码+文档说明(高分课程设计)
- 基于聚焦法的工件立体测量方案,根据数据进行三维重建 使用HALCON处理图像,MATLAB拟合数据+源代码+数据集+效果图
- 锄战三国村 修改:货币使用不减 v1.10(2) 原创 (中文).apk
- 基于python实现的单目双目视觉三维重建+源代码+图像图片(高分课程设计)
- 基于C+++OPENCV的全景图像拼接源码(课程设计)
- 基于Python+OpenCV对多张图片进行全景图像拼接,消除鬼影,消除裂缝+源代码+文档说明+界面截图(高分课程设计)
- 基于C++实现的全景图像拼接源码(课程设计)
- 基于SIFT特征点提取和RASIC算法实现全景图像拼接python源码+文档说明+界面截图+详细注释(95分以上课程大作业)
- 基于matlab实现眼部判别的疲劳检测系统+源代码+全部数据+文档说明+详细注释+使用说明+截图(高分课程设计)
- 基于Matlab的异常姿势识别系统+源代码+全部数据+文档说明+详细注释+使用说明+截图(高分课程设计)
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功