基于深度学习的视听场景感知对话模型.zip资源-CSDN文库

共33个文件

pyc：17个

py：14个

yml：1个

版权申诉

深度学习

机器学习

74 浏览量 2023-12-20 11:53:27 上传评论收藏 61KB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

基于深度学习的视听场景感知对话模型.zip （33个子文件）

基于深度学习的视听场景感知对话模型

evaluate.py 7KB

encoders

__init__.py 190B

lf.py 6KB

lf.pyc 5KB

__init__.pyc 436B

__pycache__

lf.cpython-36.pyc 4KB

__init__.cpython-36.pyc 343B

convert_json_to_visdial_style.py 665B

svqa_utils.py 2KB

utils

__init__.py 105B

eval_utils.py 2KB

dynamic_rnn.py 2KB

__init__.pyc 313B

eval_utils.pyc 2KB

__pycache__

dynamic_rnn.cpython-36.pyc 2KB

__init__.cpython-36.pyc 270B

eval_utils.cpython-36.pyc 1KB

dynamic_rnn.pyc 3KB

decoders

__init__.py 206B

disc.py 2KB

__init__.pyc 442B

__pycache__

disc.cpython-35.pyc 2KB

disc_realdialogs.cpython-36.pyc 2KB

__init__.cpython-35.pyc 400B

__init__.cpython-36.pyc 348B

disc.cpython-36.pyc 2KB

disc.pyc 2KB

env.yml 1KB

dataloader.py 14KB

prepro.py 12KB

makejson_with_options.py 9KB

train.py 10KB

README.md 1KB

# 基于深度学习的视听场景感知对话模型 ## Data * download 'split'.json data at: video-dialog.com * Extracted video, audio, and dialog features can be downloaded from [here](https://drive.google.com/drive/folders/14zlHmNFkCgptiGttwWKrsaaz5vVUFs00?usp=sharing) ## Workflow * 使用 ```makejson_with_options.py``` 构建带有选项的对话框 json 文件（输出：'split'_options.json） * 使用 ```convert_json_to_visdial_style.py``` 调整 JSON 格式（输出：'split'_options_2.json 可以重命名为 'split'_options.json） * 使用“prepro.py”构建标记化标题、对话框和图像路径（输出：dialogs.h5 和 params.json） * 使用 [batra-mlp-lab/visdial-challenge-starter-pytorch][2 中的 ```prepro_img_vgg16.lua``` 或 ```prepro_img_resnet.lua``` 构建图像特征（如果使用图像） ]（输出：data_img.h5） * 构建视频功能 I3D（输出：data_video.h5）[https://github.com/piergiaj/pytorch-i3d.git][5] * 构建音频功能AENET（输出：data_audio.h5）[https://github.com/znaoya/aenet.git][4] * 训练：python train.py * 评估：python评估.py --use_gt

评论收藏

内容反馈

版权申诉