没有合适的资源?快使用搜索试试~ 我知道了~
A-Probabilistic-Visual-Question-Answering-Model-Based-VQA:视觉问答(V...
共19个文件
txt:12个
sav:3个
md:1个
需积分: 37 3 下载量 191 浏览量
2021-04-13
19:12:42
上传
评论 1
收藏 6.26MB ZIP 举报
温馨提示
基于概率视觉问题的回答模型 视觉问答(VQA)是一个系统,该系统将图像作为输入和关于图像的问题,并使用复杂的推理生成自然语言的答案。 因此,VQA需要对图像有详细的了解,并需要复杂的原因来预测答案。 该项目引入了一种预训练模型(VGGNet)来提取图像特征,并使用Word2Vec嵌入单词,使用LSTM来从问题中获取单词特征,将结果组合后将预测出具有最高概率的答案。 所需的包 spacy tensorflow == 2.2.0 Keras == 2.3.1随机泡菜gc运算符集合itertools numpy pandas scipy scikit-learn matplotlib Craft.io流程图: 该模型基本上是作为输入并从数据集中获取图像,然后提取文本特征和图像特征,并在组合这些特征后以最高概率预测答案。 对于问题,我们使用Word2Vec提取功能。 对于图像,我们将从预先训练的
资源推荐
资源详情
资源评论
收起资源包目录
A-Probabilistic-Visual-Question-Answering-Model-Based-VQA-main.zip (19个子文件)
A-Probabilistic-Visual-Question-Answering-Model-Based-VQA-main
Pre-processed Data
requirements.txt 128B
ques_val_id.txt 927KB
answer_val.txt 656KB
val_images_id.txt 808KB
ques_train_id.txt 1.85MB
ques_val_len.txt 251KB
answer_train.txt 1.3MB
ques_train_len.txt 513KB
vgg_IDMap.txt 1.52MB
ques_train.txt 7.56MB
label_encoder_lstm.sav 71KB
label_encoder_lstm.pkl 71KB
images_id.txt 1.61MB
label_encoder.sav 6.06MB
label_encoder_lstm_2classes.sav 285B
ques_val.txt 3.7MB
README.md 2KB
VQA_Word2Vec_LSTM.py 16KB
VQA_Word2Vec_LSTM.ipynb 60KB
共 19 条
- 1
资源评论
黄荣钦
- 粉丝: 36
- 资源: 4539
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功