没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
资源包含文件:设计报告word+Python项目源码 Visual Question Answer (VQA) 是对视觉图像的自然语言问答,作为视觉理解 (Visual Understanding) 的一个研究方向,连接着视觉和语言。问题的格式是给定一张图片,并提出关于这张图片的问题,获得该问题的回答。 使用了BOW词袋模型和Word To Vector单词矩阵化的技术来分别处理label和输入的单词向量,及LSTM网络和Attention机制,VIS+LSTM网络结构,搭建了VQA问题的新模型。在我们的模型中,拥有3个LSTM网络分别处理:文本,图像,文本和图像。在可视化输出结果中,正确回答在Top5回答中的可能性很高。 详细介绍参考:https://blog.csdn.net/newlw/article/details/123083831
资源推荐
资源详情
资源评论
收起资源包目录
基于Visual Question Answerin的视觉图像文本图像处理系统.zip (34个子文件)
基于Visual Question Answerin的视觉图像文本图像处理系统 Python设计源码
pre_train_net.py 10KB
dict_maker.py 3KB
test.py 4KB
batch_maker.py 6KB
yuki_visual.py 3KB
demo_old.py 2KB
my_gensim_data_maker.py 2KB
train_net_tester.py 548B
glove_gensim_data_maker.py 920B
visual_test.py 10KB
__pycache__
yuki_visual.cpython-36.pyc 3KB
path_set.cpython-36.pyc 955B
data_dealer.cpython-36.pyc 2KB
data_reader.cpython-36.pyc 3KB
vqaTools
vqa.py 7KB
__pycache__
__init__.cpython-36.pyc 133B
vqa.cpython-36.pyc 7KB
__init__.py 24B
data_dealer.py 2KB
vgg19.py 9KB
path_set.py 1KB
data_reader.py 3KB
test.jpg 1.38MB
data_tester.py 955B
pic_1.gif 74KB
截图
图片1.png 421KB
图片2.png 721KB
91MIP@Y5M)K$`6Y)K]%}GYK.png 166KB
J7(7P(B)OWOVHXE807@9Y2H.png 173KB
(WR%0_VSXI2NVH_V)}K6J10.png 50KB
图片3.png 1.36MB
VV5)U1)[[PM_`F1W~P{3L(B.png 200KB
T1EP10PO2JX3IFLQWC8XBSY.png 32KB
基于Visual Question Answerin的视觉图像文本图像处理系统 设计报告.doc 528KB
共 34 条
- 1
资源评论
- hongyuyahei2023-12-18果断支持这个资源,资源解决了当前遇到的问题,给了新的灵感,感谢分享~
shejizuopin
- 粉丝: 9594
- 资源: 1288
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功