声化
EMNLP 2020论文“ 通过上下”的PyTorch代码(Hao Tan和Mohit Bansal)。
大纲
注意:我建议首先关注“ Wiki103”,并输入与“英语Wikipedia”相关的代码块。 “英语维基”可能需要很长时间才能完成。
安装
pip install -r requirements.txt
需要python 3.6及更高版本(以支持havingface变形器)。
上下文相关的跨模态匹配(xmatching)
在这个模块(相当于秒的3.2纸),我们要学会从句子的图像对准数据(即图像字幕数据)令牌的图像匹配模型。 模型“上下文地”测量标记(即单词)和图像之间的相关性。 术语“上下文”强调以下性质:在测量令牌图像相关性分数时会考虑句子(上下文)。
下载图像和字幕数据
下载MS COCO图片:
# MS COCO (Train 13G, Valid 6G)
评论0
最新资源