## Project description
* 本项目在[liuhuanyong/QASystemOnMedicalKG](https://github.com/liuhuanyong/QASystemOnMedicalKG)基础上改进
* 完善代码(增加、删除部分逻辑),部分代码重构
* 完善数据爬取脚本(原代码好像有些问题)
* **增加可视化部分**
* **如果觉得有帮助,给个star吧**
## KGQA Design
### 1.实体类型
| 实体类型 | 中文含义 | 实体数量 | 举例 |
| ---------- | -------- | -------- | ----------- |
| Disease | 疾病 | 8792 | 感冒 |
| Department | 科室 | 54 | 内科 |
| Check | 检查项目 | 3342 | 血常规 |
| Drug | 治疗药品 | 1204 | 布洛芬片 |
| Food | 食物 | 4854 | 蜂蜜 |
| Symptom | 症状 | 6556 | 腹腔积血 |
| Total | 总计 | 24802 | 约2.5万实体 |
### 2.实体关系三元组
* <Disease,belongs_to,Department> **疾病所属科室**
* <Disease,inspection_item,Check> **疾病检查项目**
* <Disease,common_drug,Drug> **疾病常用药物**
* <Disease,has_symptom,Symptom> **疾病症状**
* <Disease,good_food,Food> **疾病宜吃食物**
* <Disease,avoid_food,Food> **疾病忌吃食物**
* <Disease,recommand_recipes,Food> **推荐食谱**
* <Disease,has_complication,Symptom> **疾病并发症**
### 3.实体关系信息
| 实体关系类型 | 中文含义 | 关系数量 | 举例 |
| ----------------- | -------- | -------- | --------------------------------------------- |
| belongs_to | 属于 | 8784 | <哮喘,belongs_to,内科> |
| common_drug | 常用药物 | 13477 | <小儿肺炎,common_drug,小儿肺热平胶囊> |
| good_food | 宜吃食物 | 34221 | <胸椎骨折,good_food,黑鱼> |
| avoid_food | 忌吃食物 | 34215 | <感冒,avoid_food,猪油> |
| check_item | 检查项目 | 39098 | <肾结石,check_item,尿液颜色> |
| recommand_recipes | 推荐食谱 | 39663 | <肝病,recommand_recipes,芝麻小米粥> |
| has_complication | 并发症 | 19151 | <痔疮,has_complication,直肠癌> |
| has_symptom | 疾病症状 | 58398 | <冠心病,has_symptom,心慌;呼吸困难;心力衰竭> |
| Total | 总计 | 247,007 | 近25万实体关系 |
### 4.疾病(中心)节点介绍
| 属性类型 | 中文含义 | 举例 |
| ------------------ | ------------ | -------------------------------------------------------- |
| name | 疾病名称 | 感冒 |
| desc | 疾病描述 | 发热伴寒战;咽痛;流鼻涕 |
| cause | 疾病病因 | 当有受凉,淋雨,过度疲劳 |
| prevent | 预防措施 | 补充维生素E、维生素C |
| treat_cycle | 治疗周期 | 7-14天 |
| treat_way | 治疗方式 | 感冒可以尝试如下治疗:对症治疗;中医治疗;支持性治疗 |
| cure_prob | 治愈概率 | 97% |
| susceptible_people | 易感人群 | 无特定人群 |
| medical_insurance | 是否医保疾病 | 未知 |
| transmission_way | 传染方式 | 呼吸道传播 |
| treat_cost | 治疗费用 | 根据不同医院,收费标准不一致,市三甲医院约(500-1000元) |
| nursing | 护理方法 | 日常护理xxx |
### 5.可解决的问题类型
| question_type | 问题类型 | 举例 |
| -------------------------- | ---------------------- | ---------------------- |
| disease_symptom | 已知疾病查看症状 | 小儿肺炎有什么症状 |
| symptom_disease | 已知症状查看可能的疾病 | 最近老是流鼻涕怎么办 |
| disease_cause | 疾病原因 | 总是失眠是什么原因 |
| disease_complication | 疾病并发症 | 感冒有哪些并发症 |
| disease_drug | 疾病常用药物 | 白内障一般吃什么药 |
| drug_disease | 药物能治疗啥疾病 | 阿莫西林胶囊能治疗啥 |
| disease_avoid_food | 疾病忌口 | 肝病不能吃什么 |
| disease_good_food | 疾病宜吃 | 肺结核吃什么好 |
| food_avoid_disease | 什么疾病不能吃的食物 | 什么人最好不要吃蜂蜜 |
| food_good_disease | 食物适合哪些人吃 | 腰果适合哪些人吃 |
| disease_check | 疾病检查项目 | 怎么查出来是不是脑膜炎 |
| check_disease | 已知检查找疾病 | 血常规能查出来啥病 |
| disease_prevent | 疾病预防方法 | 怎么样才能防止肾虚 |
| disease_treat_way | 疾病治疗方法 | 高血压要怎么治 |
| disease_cure_prob | 疾病治愈概率 | 肺结核能治好吗 |
| disease_susceptible_people | 疾病易感人群 | 什么人容易得高血压? |
| disease_department | 疾病去哪个科室 | 痔疮属于哪个科室的 |
| disease_treat_cost | 疾病治疗费用 | 治疗肾结石要多少钱 |
| disease_medical_insurance | 某病是医保疾病吗 | 肾结石是医保疾病吗 |
| disease_treat_cycle | 某疾病的治疗周期 | 感冒要多久才能好 |
| disease_desc | 疾病概述 | 抑郁症 |
### 6.实现思路
* **图谱构建**
* 数据爬取
* 数据预处理
* 实体类型构建
* 关系类型构建
* 创建neo4j数据库
* 知识图谱可视化
* **问答系统**
* 自然语言查询(Question Query)
* 意图识别(Intention Recognition)
* 实体识别(Entity Recognition)
* 实体链接(Entity Linking)[目前未实现]
<!-- * 关系识别(Relation Detection) -->
* 查询语句构建(Query Construction)
* 返回查询结果(Return Answering)
### 7.关键技术方法
* **数据获取**
* scrapy-spider : 普通的页面解析或分布式爬虫(防止中断数据丢失)
* 数据存储:redis、mongodb等
* **实体识别**
* **目前采用的方法**
* 根据提取的领域关键词,基于trie树构建快速查询AC Tree。
* 用AC Tree对输入的自然语言问句,匹配潜在的关键词,作为候选实体
* **其他方法弊端(针对此项目)**
* 因为缺乏大量领域监督数据,无法基于现有的热门方法BiLSTM+CRF训练模型进行识别。
* HanLP等平台的工具基本都不提供实体识别方法,并且这些工具的训练语料很少涉及垂直领域知识。
* **意图识别:**
* **我们采用的方法**
* **基于词典模板的规则分类方法,意图对应项目中的question_type**
* **该方法需要领域专家构建模板**
* **缺乏大量的监督数据,相比以下其它方法,该方法是较好的选择**
* **其他常用方法**
* 基于词典模板的规则分类
* 基于过往日志匹配(适用于搜索引擎)
* 基于分类模型进行意图识别(CNN,RNN,MachineLearning)
* **实体链接:**
* 缺乏大量监督数�
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【资源说明】 基于Python知识图谱的疾病知识问答系统源码+数据集+详细文档(高分毕业设计).zip基于Python知识图谱的疾病知识问答系统源码+数据集+详细文档(高分毕业设计).zip基于Python知识图谱的疾病知识问答系统源码+数据集+详细文档(高分毕业设计).zip 【备注】 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如软件工程、计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载使用,也可作为毕设项目、课程设计、作业、项目初期立项演示等,当然也适合小白学习进阶。 3、如果基础还行,可以在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。 欢迎下载,沟通交流,互相学习,共同进步!
资源推荐
资源详情
资源评论
收起资源包目录
基于Python知识图谱的疾病知识问答系统源码+数据集+详细文档(高分毕业设计).zip (165个子文件)
bootstrap.css 155KB
bootstrap.min.css 124KB
style.css 48KB
font-awesome.css 37KB
font-awesome.min.css 30KB
elegant-fonts.css 25KB
swiper.css 21KB
swiper.min.css 19KB
themify-icons.css 16KB
custom.css 1KB
fontawesome-webfont.eot 162KB
themify.eot 77KB
ElegantIcons.eot 58KB
.gitattributes 66B
.gitattributes 66B
question_answer.html 5KB
index.html 3KB
test.html 940B
show_graph.html 123B
KGQA.iml 591B
c.jpg 164KB
m.jpg 137KB
hero-bg.jpg 131KB
single-post.jpg 118KB
single-course-featured-img.jpg 104KB
single-courses-bg.jpg 78KB
n.jpg 63KB
courses-header.jpg 62KB
j.jpg 35KB
event-1.jpg 34KB
5.jpg 25KB
2.jpg 24KB
b-3.jpg 24KB
b-4.jpg 23KB
h.jpg 21KB
g.jpg 21KB
6.jpg 21KB
b-5.jpg 20KB
b-6.jpg 20KB
b-2.jpg 20KB
4.jpg 19KB
3.jpg 18KB
b-1.jpg 18KB
1.jpg 18KB
l.jpg 17KB
k.jpg 17KB
o.jpg 17KB
b.jpg 15KB
d.jpg 15KB
i.jpg 15KB
event-3.jpg 12KB
ads.jpg 12KB
event-2.jpg 12KB
a.jpg 12KB
team-3.jpg 11KB
team-4.jpg 11KB
team-2.jpg 11KB
team-1.jpg 8KB
e.jpg 8KB
t-2.jpg 5KB
t-4.jpg 5KB
instructor.jpg 4KB
t-3.jpg 4KB
user-2.jpg 4KB
user-1.jpg 4KB
user-3.jpg 4KB
t-1.jpg 4KB
course-author.jpg 3KB
swiper.js 227KB
swiper.min.js 112KB
jquery.js 95KB
jquery-3.4.1.js 86KB
masonry.pkgd.min.js 24KB
custom.js 2KB
jquery.collapsible.min.js 2KB
custom.js 975B
medical.json 55.27MB
medical_9.json 3.91MB
medical_1.json 3.68MB
medical_12.json 3.61MB
medical_0.json 3.43MB
medical_7.json 3.43MB
medical_4.json 3.21MB
medical_6.json 3.2MB
medical_5.json 3.19MB
medical_8.json 3.18MB
medical_3.json 3.16MB
medical_10.json 3.15MB
medical_13.json 3.09MB
medical_11.json 3.05MB
medical_2.json 2.91MB
medical_16.json 2.81MB
medical_15.json 2.74MB
medical_14.json 2.08MB
medical_17.json 1.42MB
README.md 9KB
FontAwesome.otf 132KB
my.pdf 370KB
blog-post-img.png 499KB
video-screenshot.png 299KB
共 165 条
- 1
- 2
资源评论
- wqywqy123562024-04-28资源有很好的参考价值,总算找到了自己需要的资源啦。
不走小道
- 粉丝: 3200
- 资源: 5125
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功