没有合适的资源?快使用搜索试试~ 我知道了~
OpenViDial:OpenViDial数据集的代码,模型和数据集
共45个文件
py:26个
sh:8个
png:5个
需积分: 12 0 下载量 63 浏览量
2021-05-14
12:52:28
上传
评论
收藏 1.56MB ZIP 举报
温馨提示
打开视频 此存储库包含有关OpenViDial数据集的下载说明,以及用于在论文中重现结果的代码(请参见)。 介绍 当人们交谈时,说话者接下来要说的话很大程度上取决于他所看到的。 OpenViDial是用于此目的的大规模多模块对话数据集。 对话转弯和视觉上下文是从电影和电视连续剧中提取的,其中每个对话转弯都与发生对话的相应视觉上下文配对。 OpenViDial总共包含110万个对话回合,因此图像中存储了110万个可视上下文。 以下是视觉上下文至关重要的两个简短对话。 OpenViDial的详细统计 属性 价值 转弯数量 110万 图片数量 110万 BPE之前的语音量 70K BPE后的口音大小 30K 每集的平均时长 14 每转平均长度 7.6 下载数据集 ***** 2021年3月12日新功能:测试/有效数据集上的新cnn / rcnn功能***** 我们修复了有效/测试数据集
资源推荐
资源详情
资源评论
收起资源包目录
OpenViDial-main.zip (45个子文件)
OpenViDial-main
.gitignore 2KB
README.md 8KB
video_dialogue_model
tasks
video_dialogue_task.py 4KB
__init__.py 228B
extract_features
build_rcnn_mmap.py 3KB
rcnn_dataset.py 3KB
run_rcnn.py 13KB
extract_features.md 1KB
run_resnet.py 3KB
__init__.py 0B
model
image_transformer.py 8KB
object_transformer.py 8KB
__init__.py 105B
__init__.py 122B
data
feature_dataset.py 2KB
object_dataset.py 3KB
utils.py 1KB
__init__.py 108B
text_and_object_dataset.py 6KB
stopwords.txt 954B
text_and_image_dataset.py 5KB
tests
task.py 626B
train
train.py 12KB
generate.py 15KB
stats.py 3KB
scripts
preprocess_text_data.sh 791B
reproduce_baselines
text_and_img_feature.sh 1KB
text_only.sh 1KB
text_and_img_objects.sh 2KB
mmi
mmi_generate.sh 2KB
train.sh 795B
README.md 318B
preprocess.sh 1KB
combine_bidirectional_score.py 2KB
split_nbest.py 2KB
preprocess_video_data.sh 470B
requirements.txt 103B
demo_data
model1.png 15KB
model3.png 223KB
dataset.png 637KB
model2.png 94KB
attention_over_objects.png 587KB
preprocess
preprocess_video_data.py 4KB
preprocess_nmt_data.py 2KB
truncate_data.py 2KB
共 45 条
- 1
资源评论
租租车国内租车
- 粉丝: 19
- 资源: 4599
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功