# 智能阅读模型
## 概述
总体分为两部分:第一部分关键词匹配,第二部分精准匹配,最后选择置信度最高的正确回答。
第一部分可使用 TF-IDF、LSI 等传统方法。
第二部分可使用 基于深度学习的问答系统。
本文主要构建第二部分,第一部分可参考:https://github.com/littleredhat1997/doc-similarity
## 下载数据
1. http://www.tipdm.org/jingsa/1253.jhtml
train_data_complete.json、test_data_sample.json、submit_sample.txt => main/data 文件夹
2. https://spaces.ac.cn/archives/4338
me_train.json => generalization/data 文件夹
## 运行项目
```
$ ......
1. word2vec/step.ipynb ->
word2vec/word2vec.ipynb
2. main/data/data.ipynb ->
main/data/1xxxxxx.ipynb
main/data/2xxxxxx.ipynb
main/data/3xxxxxx.ipynb
main/data/4xxxxxx.ipynb
main/data/5xxxxxx.ipynb
-> main/evaluate.ipynb
3. test/data/newdata.ipynb ->
test/data/data.ipynb ->
test/predict.ipynb ->
test/evaluate.ipynb
$ tree
.
├── word2vec
│ ├── step.ipynb
│ └── word2vec.ipynb
├── main
│ ├── data
│ │ └── data.ipynb
│ ├── 1_FastText.ipynb
│ ├── 2_CNN1.ipynb
│ ├── 3_CNN2.ipynb
│ ├── 4_BiLSTM.ipynb
│ ├── 5_Attention.ipynb
│ └── evaluate.ipynb
└── test
├── data
│ ├── data.ipynb
│ └── newdata.ipynb
├── evaluate.ipynb
└─── predict.ipynb
```
## 模型设计
1. FastText
![alt text](docs/FastText.png "title")
2. CNN
![alt text](docs/CNN.png "title")
3. Bi-LSTM
![alt text](docs/Bi-LSTM.png "title")
4. Attention
![alt text](docs/Attention.png "title")
没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
收起资源包目录
基于潜在语义索引(LSI)和卷积神经网络(CNN)的深度智能阅读模型.zip (61个子文件)
基于潜在语义索引(LSI)和卷积神经网络(CNN)的深度智能阅读模型_ebook-lsi-cnn
项目内附说明
如果解压失败请用ara软件解压.txt 42B
ebook-lsi-cnn-master
word2vec
step.ipynb 6KB
word2vec.ipynb 7KB
docs
FastText.png 16KB
CNN.png 37KB
report
答辩一种基于潜在语义索引和卷积神经网络的智能阅读模型.pdf 3.12MB
一种基于潜在语义索引和卷积神经网络的智能阅读模型.pdf 1.74MB
答辩-一种基于潜在语义索引和卷积神经网络的智能阅读模型.pptx 3.39MB
一种基于潜在语义索引和卷积神经网络的智能阅读模型.docx 780KB
通知.pdf 314KB
Attention.png 22KB
Bi-LSTM.png 18KB
test
data
data.ipynb 4KB
newdata.ipynb 19KB
models.py 10KB
evaluate.ipynb 107KB
predict.ipynb 9KB
img
Score3.png 11KB
Score4.png 51KB
map.jpg 7KB
Score1.png 8KB
Score2.png 10KB
mrr.jpg 7KB
predict
BiLSTM.txt 7.89MB
Average.txt 4.14MB
CNN1.txt 7.95MB
FastText.txt 7.89MB
Vote.txt 4.14MB
CNN2.txt 7.9MB
Attention.txt 7.91MB
Weight.txt 4.14MB
main
3_CNN2.ipynb 376KB
data
data.ipynb 74KB
models.py 10KB
evaluate.ipynb 110KB
img
CNN1.png 266KB
Score3.png 11KB
FastText.png 83KB
BiLSTM.png 120KB
Score4.png 54KB
map.jpg 7KB
Score1.png 8KB
Score2.png 10KB
Attention.png 90KB
mrr.jpg 7KB
CNN2.png 266KB
2_CNN1.ipynb 376KB
5_Attention.ipynb 132KB
1_FastText.ipynb 122KB
predict
BiLSTM.txt 31KB
Average.txt 17KB
CNN1.txt 31KB
FastText.txt 31KB
Vote.txt 17KB
CNN2.txt 31KB
Attention.txt 31KB
Weight.txt 17KB
model
.gitignore 56B
log
.gitignore 56B
4_BiLSTM.ipynb 172KB
README.md 2KB
共 61 条
- 1
资源评论
好家伙VCC
- 粉丝: 1743
- 资源: 9089
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于Java、HTML、CSS和JavaScript的儿童玩具市场网页设计源码
- 基于Odoo框架的图书管理、待办事项、省市联动及养老机构三级联动设计源码
- 基于Java和HTML的micro-play网络有声小说播放器设计源码
- 基于Java的高考志愿填报系统后端设计源码
- 基于Java语言的在线问卷调查系统后端代码设计源码
- 基于HTML/CSS/JavaScript的睡眠健身打卡系统设计源码
- 基于Python及多语言融合的TD打工人华为算子开发挑战赛参赛源码
- 基于Java和JavaScript的HTML软件机房设计源码
- 基于jline3注解驱动的Java命令行交互库设计源码
- 基于SpringBoot框架的医疗物资审批系统管理平台设计源码
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功