# 大创项目
## 中医药知识图谱的构建
**目前进度**:
~~1.利用Python的scrapy框架对网络上的公开药材网进行药材爬取~~
2.通过利用pandas库对数据清洗等初步处理后以实现基本实体及实体关系的确认,可实现将现有数据导入neo4j数据库形成基本的图谱
**接下来目标:**
1.利用TensorFlow建立训练模型对【来源】,【用法用量】,【主治功能】,【性味】等存在大段文字的实体进行进一步的抽取,争取做到抽出准确词语。
2.利用远程监督的方式(或者是其他的方式),对实体关系进行抽取,目前要使用的技术工具还未知。
没有合适的资源?快使用搜索试试~ 我知道了~
大创项目:中医药知识图谱构建
共86个文件
py:32个
pyc:19个
csv:11个
需积分: 5 4 下载量 100 浏览量
2024-04-13
19:52:26
上传
评论
收藏 12.95MB ZIP 举报
温馨提示
目前进度: 1.利用Python的scrapy框架对网络上的公开药材网进行药材爬取 2.通过利用pandas库对数据清洗等初步处理后以实现基本实体及实体关系的确认,可实现将现有数据导入neo4j数据库形成基本的图谱 接下来目标: 1.利用TensorFlow建立训练模型对【来源】,【用法用量】,【主治功能】,【性味】等存在大段文字的实体进行进一步的抽取,争取做到抽出准确词语。 2.利用远程监督的方式(或者是其他的方式),对实体关系进行抽取
资源推荐
资源详情
资源评论
收起资源包目录
traditional_Chinese_medicine-master 2.zip (86个子文件)
traditional_Chinese_medicine-master
性味提取.rar 2.61MB
pandas_test.py 2KB
yaocai_yongfa.csv 333KB
medicinetwo.xlsx 1.89MB
medicine.xlsx 1.97MB
zhuzhi.csv 1.34MB
yaocai.csv 1.53MB
yaocai_xingwei.csv 333KB
yongfa.csv 862KB
爬虫代码.zip 15KB
zhailu.csv 402KB
laiyuan.csv 1.14MB
medicine
BiLSTMCRF
utils.py 3KB
data_manager.py 6KB
main.py 10KB
data
predict_entity.txt 499KB
train 246KB
all.txt 7.65MB
test 251KB
dev 250KB
medicine .txt 3.83MB
model.py 19KB
models
params.pkl 791KB
data.pkl 17KB
config.yml 209B
__pycache__
data_manager.cpython-37.pyc 4KB
utils.cpython-37.pyc 1KB
model.cpython-37.pyc 7KB
data_process.py 501B
scrapy.cfg 259B
.idea
workspace.xml 7KB
misc.xml 185B
inspectionProfiles
profiles_settings.xml 174B
modules.xml 268B
medicine.iml 467B
medicine
__init__.py 0B
pipelines.py 2KB
runspider.py 176B
spiders
__init__.py 161B
medicinespider.py 13KB
__pycache__
medicinespider.cpython-37.pyc 2KB
__init__.cpython-37.pyc 156B
items.py 510B
settings.py 3KB
__pycache__
items.cpython-37.pyc 488B
pipelines.cpython-37.pyc 1KB
settings.cpython-37.pyc 594B
__init__.cpython-37.pyc 148B
middlewares.py 4KB
entity
data_manage.py 6KB
to_file.py 1KB
disambiguation.py 2KB
调试记录.md 529B
relations_test.py 2KB
xingwei.csv 441KB
yaocai_zhuzhi.csv 333KB
zhongyiyaoSpider
__init__.py 45B
scrapy.cfg 275B
zhongyiyaoSpider
__init__.py 0B
pipelines.py 813B
spiders
__init__.py 161B
zhongyiyao1.py 1KB
zhongyiyao.py 2KB
zhongyiyao2.py 2KB
zhongyiyao3.py 2KB
__pycache__
zhongyiyao1.cpython-37.pyc 1KB
test.cpython-37.pyc 2KB
zhongyiyao2.cpython-37.pyc 2KB
__init__.cpython-37.pyc 188B
zhongyiyao.cpython-37.pyc 2KB
zhongyiyao3.cpython-37.pyc 1KB
test.py 3KB
zhongyiyao4.py 363B
items.py 475B
settings.py 3KB
__pycache__
items.cpython-37.pyc 526B
pipelines.cpython-37.pyc 1KB
settings.cpython-37.pyc 525B
__init__.cpython-37.pyc 180B
middlewares.py 4KB
yaocai_laiyuan.csv 333KB
yaocai_zhailu.csv 285KB
实体标注
伪_实体标注.py 9KB
pandas_excel.xlsx 1.78MB
README.md 686B
项目现需求.md 4KB
共 86 条
- 1
资源评论
geobuins
- 粉丝: 2036
- 资源: 1209
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 华为ENSP基本配置!!!
- 山东理工大学 SDUT 中外OS 操作系统 学习笔记 2024
- 山东理工大学 SDUT 中外OS 操作系统 学习笔记 2024
- TurboWarp-Setup-1.12.3-x64.exe
- 船检测4-YOLO(v5至v9)、COCO、CreateML、Darknet、Paligemma、TFRecord数据集合集.rar
- 提升工程效率的必备工具:IPAddressApp-无显示器远程调试的新选择
- 山东理工大学2024 离散数学思维导图
- IOS面试常问的问题及回答
- 船只检测13-YOLO(v5至v9)、COCO、CreateML、Darknet、Paligemma、TFRecord、VOC数据集合集.rar
- 51单片机的温度监测与控制(温控风扇)
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功