Chinese Medical Intent Dataset(CMID)
====
This dataset is used for Chinese medical QA intent understanding task.
More details will be updated soon.
Dataset format:
======
All the data is stored in a JSON file. There are 5 fields in the file. An example as follows:
{
"originalText": "间质性肺炎的症状?",
"entities": [{"label_type": "疾病和诊断", "start_pos": 0, "end_pos": 5}],
"seg_result": ["间质性肺炎", "的", "症状", "?"],
"label_4class": ["病症"],
"label_36class": ["临床表现"]
}
The JSON field details
-------
The "originalText" field holds the input information.
The "entities" field holds the Named entity recognition information with Deep learning model. The tag of the entity follows the CCKS2019 Task1 standard: https://www.biendata.com/competition/ccks_2019_1/Evaluation/.
The "seg_result" field holds the information after sentence segmentation.
The "label_4class" field holds the manually annotated medical intent classification information.
The "label_36class" field holds the manually annotated medical intent classification information.
Inclusion of 4class and 36class
-------
label_4class is the primary type that contains:
病症 药物 治疗方案 其他
label_36class is the secondary type that contains:
病症:定义,病因,临床表现,相关病症,治疗方法,推荐医院,预防,所属科室,禁忌,传染性,治愈率,严重性
药物:作用,适用症,价钱,药物禁忌,用法,副作用,成分
治疗方案:方法,费用,有效时间,临床意义/检查目的,治疗时间,疗效,恢复时间,正常指标,化验/体检方案,恢复
其他:设备用法,多问,养生,整容,两性,对比,无法确定
Final Words
======
Thanks for using our corpus! Please don't forget to let us know if our dataset advance the current state of the art forward in your Chinese natural language processing task.
Contacts
======
CMID cannot be used for projects other than scientific research.
Please contact us if necessary: cssxd@imu.edu.cn, liutongyang1995@gmail.com
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
基于python知识图谱医疗领域问答系统实现. 完整代码+数据可直接运行,该项目是个人毕设项目,答辩评审分达到98分,代码都经过调试测试,确保可以运行!欢迎下载使用,可用于小白学习、进阶。该资源主要针对计算机、通信、人工智能、自动化等相关专业的学生、老师或从业者下载使用,亦可作为期末课程设计、课程大作业、毕业设计等。项目整体具有较高的学习借鉴价值!基础能力强的可以在此基础上修改调整,以实现不同的功能。 基于python知识图谱医疗领域问答系统实现. 完整代码+数据可直接运行基于python知识图谱医疗领域问答系统实现. 完整代码+数据可直接运行基于python知识图谱医疗领域问答系统实现. 完整代码+数据可直接运行基于python知识图谱医疗领域问答系统实现. 完整代码+数据可直接运行基于python知识图谱医疗领域问答系统实现. 完整代码+数据可直接运行基于python知识图谱医疗领域问答系统实现. 完整代码+数据可直接运行基于python知识图谱医疗领域问答系统实现. 完整代码+数据可直接运行基于python知识图谱医疗领域问答系统实现. 完整代码+数据可直接运行基于python
资源推荐
资源详情
资源评论
收起资源包目录
基于python知识图谱医疗领域问答系统实现. 完整代码+数据可直接运行.zip (59个子文件)
KBQA_medical-master
KBQA_medical
CasRel2
utils.py 5KB
data_loader.py 6KB
model.py 5KB
run.py 2KB
build_baiduie_data.py 3KB
__pycache__
data_loader.cpython-37.pyc 4KB
utils.cpython-37.pyc 5KB
model.cpython-37.pyc 4KB
utils
json_utils.py 703B
__pycache__
json_utils.cpython-37.pyc 950B
NLU4
sklearn_Classification
data
intent_recog_data.txt 4KB
model_file
vec.pkl 65KB
id2label.pkl 98B
LR.pkl 55KB
gbdt.pkl 5.68MB
svc_clf.pkl 47KB
train.py 3KB
__pycache__
clf_model.cpython-37.pyc 1KB
clf_model.py 1KB
bert_intent_recognition
app.py 2KB
data
CMID.json 5.11MB
train.csv 595KB
diseases.json 234KB
README.md 2KB
test.csv 64KB
bert_model.py 2KB
data_helper.py 11KB
label 153B
train.py 3KB
__pycache__
bert_model.cpython-37.pyc 2KB
data_helper.cpython-37.pyc 8KB
run.py 3KB
modules.py 6KB
NER1
checkpoint
best_bilstm_crf_model.h5 5.81MB
bilstm_crf_model.h5 5.81MB
word_tag_id.pkl 37KB
diseases.json 234KB
crf_layer.py 31KB
metrics.py 13KB
app.py 5KB
bilstm_crf_model.py 2KB
data_helpers.py 4KB
train.py 3KB
build-kg
data
medical.json 44.96MB
create-kg.py 13KB
EntityNormality3
checkpoint
word2id.pkl 32KB
data
yidu-n7k
code.txt 345KB
train.csv 4.15MB
test.csv 66KB
predict.py 2KB
bm25_retrival.py 944B
data_helper.py 7KB
esim.py 8KB
train.py 2KB
__pycache__
bm25_retrival.cpython-37.pyc 2KB
data_helper.cpython-37.pyc 6KB
esim.cpython-37.pyc 7KB
config.py 7KB
README.md 1021B
共 59 条
- 1
资源评论
yava_free
- 粉丝: 3222
- 资源: 1370
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 中国光伏电站安装时间的多边形地理空间数据集(2010-2022年)-最新出炉.zip
- 几种常见简单滤波器用于二维图像降噪,包括均值、中值、高斯、低通、双边滤波器,语言是python
- 二手车管理系统,pc端,小程序端,java后端
- 2011-2022年中国光伏电站遥感识别面矢量数据-最新出炉.zip
- 基于深度学习的边缘计算网络的卸载优化及资源优化python源码+文档说明(高分项目)
- 基于yolov5+超声图像的钢轨缺陷检测python源码+数据集(高分毕设)
- 基于大语言模型的智能审计问答系统python源码+文档说明(高分项目)
- C++程序设计编程题库
- javase停车场管理系统答辩PPT(高级版)
- javase的停车场管理系统(高级版)
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功