OpenViDial:OpenViDial数据集的代码，模型和数据集

共45个文件

py：26个

sh：8个

png：5个

Python

需积分: 12 0 下载量 63 浏览量 2021-05-14 12:52:28 上传评论收藏 1.56MB ZIP 举报

温馨提示

打开视频此存储库包含有关OpenViDial数据集的下载说明，以及用于在论文中重现结果的代码（请参见）。介绍当人们交谈时，说话者接下来要说的话很大程度上取决于他所看到的。 OpenViDial是用于此目的的大规模多模块对话数据集。对话转弯和视觉上下文是从电影和电视连续剧中提取的，其中每个对话转弯都与发生对话的相应视觉上下文配对。 OpenViDial总共包含110万个对话回合，因此图像中存储了110万个可视上下文。以下是视觉上下文至关重要的两个简短对话。 OpenViDial的详细统计属性价值转弯数量 110万图片数量 110万 BPE之前的语音量 70K BPE后的口音大小 30K 每集的平均时长 14 每转平均长度 7.6 下载数据集 ***** 2021年3月12日新功能：测试/有效数据集上的新cnn / rcnn功能***** 我们修复了有效/测试数据集

资源推荐

资源详情

资源评论