# LSTM-CRF-medical
构建医疗实体识别的模型,包含词典和语料标注,基于python构建
数据集合标注
数据集合标注可以基于词典,通过最大匹配获得实体位置,然后标注实体类型。
词典构造
目前构造的词典包括疾病词典、症状词典和身体部位词典。疾病词典包括互联网爬取的疾病名称、疾病别名、ICD10疾病名称,去重后共39615条数据;症状为互联网爬取的症状描述,去重后共7457条数据;身体部位为互联网爬取的身体部位描述,去重后共1929条数据。示例如下:
疾病名称:1型糖尿病性急性牙周脓肿,妊娠合并系统性红斑狼疮,结石性胆囊炎,药物性股骨坏死,晚期梅毒性脉络膜炎,腹型过敏性紫癜
症状:胀痛,耳后长包,睡觉流口水,鼻塞,粉红色泡沫样痰,孕妇气喘,痔疮便血,头昏眼花
身体部位:鼻唇沟,鼻处,鼻子,鼻子尖,鼻孔,鼻尖,鼻窦软骨,鼻翼,鼻黏膜
实体检索
选取了ICD10中的5000条疾病描述,根据已有词典进行实体的最大匹配。
以疾病为例,对于输入的疾病描述进行规范化,去掉空格、换行符,去掉无意义的句头和句尾字词等。
对规范化的句子,使用词典中的每个词进行全匹配,记录匹配的词、词的起始index、词的结束index和实体类型。
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
毕业设计:python医疗问句中的实体识别算法的研究(源码 + 数据库 + 说明文档) 2 相关技术介绍 3 2.1 B/S架构说明 3 2.2 Python语言 3 2.3 MySQL数据库 3 2.4 知识图谱 4 3 系统需求分析 4 3.1 可行性分析 4 3.1.1 经济可行性 4 3.1.2 运行可行性 5 3.1.3 技术可行性 5 3.2 性能需求分析 5 3.3 非功能需求分析 6 3.4 功能需求分析 6 3.5 系统设计原则 6 4 系统总体设计 7 4.1 系统开发架构设计 7 4.2 系统功能模块设计 8 4.3 E-R图 9 4.4 数据表设计 9 5 系统实现 11 5.1 登录页面 11 5.2 后台页面 11 5.3 问句识别管理页面 11 5.4 问句识别查询页面 12 6 结论与展望 12
资源推荐
资源详情
资源评论
收起资源包目录
毕业设计:python医疗问句中的实体识别算法的研究(源码 + 数据库 + 说明文档) (490个子文件)
neostore.transaction.db.0 250MB
neostore.transaction.db.1 29.03MB
neostore.counts.db.a 2KB
neostore.counts.db.a 96B
all_data 13.38MB
neostore.propertystore.db.arrays 4MB
neostore.propertystore.db.arrays 2.16MB
auth 113B
neostore.counts.db.b 2KB
neostore.counts.db.b 832B
cypher-shell.bat 2KB
neo4j.bat 1KB
neo4j-import.bat 1023B
neo4j-shell.bat 1022B
neo4j-admin.bat 1022B
neo4j.cert 1002B
_1w1r.cfe 305B
_0.cfe 305B
_1w1r.cfs 30KB
_0.cfs 5KB
checkpoint 195B
neo4j.conf 10KB
bootstrap.min.css 115KB
layui.css 68KB
font-awesome.min.css 30KB
templatemo-style.css 16KB
layer.css 14KB
layui.mobile.css 10KB
login.css 8KB
laydate.css 7KB
code.css 1KB
style.css 991B
diseaseMatch.csv 5.07MB
symptomMatch.csv 773KB
model-520.data-00000-of-00001 31.22MB
model-260.data-00000-of-00001 31.22MB
model-390.data-00000-of-00001 31.22MB
model-130.data-00000-of-00001 31.22MB
neostore.propertystore.db 14.11MB
neostore.relationshipstore.db 9.45MB
neostore.schemastore.db 4MB
neostore.relationshipgroupstore.db 4MB
neostore.nodestore.db 4MB
neostore.relationshiptypestore.db 4MB
neostore.propertystore.db 4MB
neostore.labeltokenstore.db 4MB
neostore.relationshipstore.db 4MB
neostore.nodestore.db 648KB
neostore.relationshipgroupstore.db 176KB
neostore.schemastore.db 8KB
neostore.relationshiptypestore.db 8KB
neostore.labeltokenstore.db 8KB
events.out.tfevents.1676343251.DESKTOP-OL9JJ6L 11.01MB
disease.dic 1.09MB
disease_new.dic 880KB
disease_new2.dic 879KB
symptom.dic 329KB
symptom_new.dic 149KB
symptom_new2.dic 129KB
body中文身体部位名称.dic 15KB
disonly 20KB
python医疗问句中的实体识别算法的研究-开题报告.doc 54KB
python医疗问句中的实体识别算法的研究.docx 1.06MB
文档.docx 12KB
fontawesome-webfont.eot 162KB
iconfont.eot 40KB
err 2KB
prunsrv-amd64.exe 107KB
prunsrv-i386.exe 85KB
failure-message 16KB
failure-message 16KB
59.gif 10KB
22.gif 10KB
24.gif 8KB
13.gif 7KB
16.gif 7KB
39.gif 6KB
64.gif 6KB
63.gif 6KB
50.gif 6KB
loading-0.gif 6KB
4.gif 6KB
1.gif 5KB
42.gif 5KB
71.gif 5KB
21.gif 5KB
20.gif 5KB
29.gif 5KB
70.gif 4KB
5.gif 4KB
17.gif 4KB
27.gif 4KB
9.gif 4KB
44.gif 4KB
11.gif 4KB
8.gif 4KB
3.gif 4KB
23.gif 4KB
34.gif 4KB
41.gif 4KB
共 490 条
- 1
- 2
- 3
- 4
- 5
资源评论
学习资源网
- 粉丝: 940
- 资源: 2101
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功