# cMedQA2
This is updated version of the dataset for Chinese community medical question answering. The dataset is in version 2.0 and is available for non-commercial research. We will update and expand the database from time to time. In order to protect the privacy, the data is anonymized and no personal information is included.
The older version of cMedQA is v1.0. You can [click here](https://github.com/zhangsheng93/cMedQA)
# Overview
| DataSet | #Ques | #Ans | Ave. #words per Question | Ave. #words per Answer| Ave. #characters per Question | Ave. #characters per Answer |
| :-: | :-: | :-: | :-: | :-: | :-: | :-: |
|Train|100,000|188,490|-|-|48|101|
|Dev|4,000|7,527|-|-|49|101|
|Test|4,000|7,552|-|-|49|100|
|Total|108,000|203,569|-|-|49|101|
* **questions.csv** All Questions and their content.
* **answers.csv** All Answers and their content.
* **train_candidates.txt** **dev_candidates.txt** **test_candidates.txt** The split of training set, development set and test set respectively.
# Paper
**Multi-Scale Attentive Interaction Networks for Chinese Medical Question Answer Selection.** [link to the paper](https://ieeexplore.ieee.org/abstract/document/8548603)
Please cite our paper when you use the dataset.
```
@ARTICLE{8548603,
author={S. Zhang and X. Zhang and H. Wang and L. Guo and S. Liu},
journal={IEEE Access},
title={Multi-Scale Attentive Interaction Networks for Chinese Medical Question Answer Selection},
year={2018},
volume={6},
number={},
pages={74061-74071},
keywords={Biomedical imaging;Data mining;Semantics;Medical services;Feature extraction;Knowledge discovery;Medical question answering;interactive attention;deep learning;deep neural networks},
doi={10.1109/ACCESS.2018.2883637},
ISSN={2169-3536},
month={},}
```
没有合适的资源?快使用搜索试试~ 我知道了~
基于sqlite数据库以及深度学习lstm实现的检索式聊天机器人.zip
共41个文件
py:13个
csv:7个
pyc:4个
需积分: 5 0 下载量 190 浏览量
2024-04-16
22:49:52
上传
评论
收藏 76.34MB ZIP 举报
温馨提示
众所周知,人工智能是当前最热门的话题之一, 计算机技术与互联网技术的快速发展更是将对人工智能的研究推向一个新的高潮。 人工智能是研究模拟和扩展人类智能的理论与方法及其应用的一门新兴技术科学。 作为人工智能核心研究领域之一的机器学习, 其研究动机是为了使计算机系统具有人的学习能力以实现人工智能。 那么, 什么是机器学习呢? 机器学习 (Machine Learning) 是对研究问题进行模型假设,利用计算机从训练数据中学习得到模型参数,并最终对数据进行预测和分析的一门学科。 机器学习的用途 机器学习是一种通用的数据处理技术,其包含了大量的学习算法。不同的学习算法在不同的行业及应用中能够表现出不同的性能和优势。目前,机器学习已成功地应用于下列领域: 互联网领域----语音识别、搜索引擎、语言翻译、垃圾邮件过滤、自然语言处理等 生物领域----基因序列分析、DNA 序列预测、蛋白质结构预测等 自动化领域----人脸识别、无人驾驶技术、图像处理、信号处理等 金融领域----证券市场分析、信用卡欺诈检测等 医学领域----疾病鉴别/诊断、流行病爆发预测等 刑侦领域----潜在犯罪识别与预测、模拟人工智能侦探等 新闻领域----新闻推荐系统等 游戏领域----游戏战略规划等 从上述所列举的应用可知,机器学习正在成为各行各业都会经常使用到的分析工具,尤其是在各领域数据量爆炸的今天,各行业都希望通过数据处理与分析手段,得到数据中有价值的信息,以便明确客户的需求和指引企业的发展。
资源推荐
资源详情
资源评论
收起资源包目录
基于sqlite数据库以及深度学习lstm实现的检索式聊天机器人.zip (41个子文件)
content
bp_convert.py 6KB
running
model
bidirectional_lstm
checkpoint 172B
bidirectional_lstm.ckpt-6800.index 2KB
bidirectional_lstm.ckpt-6700.index 2KB
bidirectional_lstm.ckpt-6800.data-00000-of-00001 17.95MB
bidirectional_lstm.ckpt-6700.meta 1.43MB
bidirectional_lstm.ckpt-6800.meta 1.43MB
bidirectional_lstm.ckpt-6700.data-00000-of-00001 17.95MB
graph
bidirectional_lstm
train
events.out.tfevents.1640423321.DESKTOP-MLERUN1 2.61MB
events.out.tfevents.1640424047.DESKTOP-MLERUN1 3.33MB
dev
events.out.tfevents.1640424053.DESKTOP-MLERUN1 2.59MB
events.out.tfevents.1640423325.DESKTOP-MLERUN1 2.59MB
demo
answer_data_sqlite3.py 2KB
answer_data_mysql.py 1KB
chat_robot_wep_api_demo.py 737B
问答对数据转换_数据库.py 696B
sqllite3_demo.py 2KB
utils
__init__.py 0B
data_help.py 10KB
__pycache__
data_help.cpython-37.pyc 7KB
__init__.cpython-37.pyc 194B
net
bidirectional_lstm.py 4KB
__pycache__
text_cnn_lstm.cpython-37.pyc 4KB
bidirectional_lstm.cpython-37.pyc 3KB
bp_demo.py 2KB
similarity_data
dev.csv 715KB
train_1.csv 479B
train.csv 7.02MB
test.csv 718KB
train_similarity_model.py 24KB
que_ans_data
q_a_data.csv 0B
LICENSE 37KB
question.csv 17.24MB
answer.csv 68.07MB
README.md 2KB
search_chat_robot.py 24KB
README.md 4B
config
__init__.py 0B
stop_word.txt 5KB
mapping_file.pkl 152KB
bidirectional_lstm.pb 6.11MB
共 41 条
- 1
资源评论
生瓜蛋子
- 粉丝: 3685
- 资源: 2901
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- open_setting.mobileprovision
- zidongdianjiqi.apk
- 卷积神经网络(Convolutional Neural Networks,CNN)是深度学习领域中一种非常重要的神经网络结构,特
- DHT11温湿度传感器是一款高性能、低成本的数字温湿度复合传感器 它集成了温度感应和湿度感应功能,可以准确地测量环境中的温度和湿
- eMMC的压力测试工具
- JUC代码演示 Java多线程并发
- 基于matlab实现的数据挖掘机期末大挖掘.rar
- 基于matlab实现的势函数非线性和感知机线性三分类,并画出分界图.rar
- 基于matlab实现的为2天线,BPSK调制模式 自己写的Space time code simulation提供给大家.rar
- 基于matlab实现的元胞自动机模拟的渗流集群,非常好的一个程序.rar
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功