基于Visual Question Answerin的视觉图像文本图像处理系统.zip

共34个文件

py：17个

png：8个

pyc：6个

1.该资源内容由用户上传，如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款（资源遇到问题，请及时私信上传者）

版权申诉

视觉图像

文本处理

图像处理系统

Python

5星 · 超过95%的资源 1 下载量 73 浏览量 2022-06-11 11:04:13 上传评论收藏 4.91MB ZIP 举报

温馨提示

资源包含文件：设计报告word+Python项目源码 Visual Question Answer (VQA) 是对视觉图像的自然语言问答，作为视觉理解 (Visual Understanding) 的一个研究方向，连接着视觉和语言。问题的格式是给定一张图片，并提出关于这张图片的问题，获得该问题的回答。使用了BOW词袋模型和Word To Vector单词矩阵化的技术来分别处理label和输入的单词向量，及LSTM网络和Attention机制，VIS+LSTM网络结构，搭建了VQA问题的新模型。在我们的模型中，拥有3个LSTM网络分别处理：文本，图像，文本和图像。在可视化输出结果中，正确回答在Top5回答中的可能性很高。详细介绍参考：https://blog.csdn.net/newlw/article/details/123083831

资源推荐

资源详情

资源评论