没有合适的资源?快使用搜索试试~ 我知道了~
用卷积滤波器matlab代码-fv-cnn-caption:基于MatConvNet的代码库可对Flickr8k图像中的FV-C...
共33个文件
m:27个
png:4个
md:1个
需积分: 9 1 下载量 32 浏览量
2021-05-21
13:03:49
上传
评论
收藏 1.36MB ZIP 举报
温馨提示
用卷积滤波器matlab代码改进用于字幕生成的深层CNN图像编码 概述 我们使用此代码使用来自VGG的ImageNet预训练的CNN在Flickr8k图像上生成CNN功能。 由于Flickr8k图像没有类别标签,因此无法使用常见的分类损失和低学习率直接在其上微调网络。 因此,我们使用高斯混合模型以无监督的方式适应Flickr8k图像,然后使用Fisher向量编码来获得比原始ImageNet预训练网络特征更适合Flickr8k数据集的特征。 这是基于ImageNet和Flickr之间的域有足够的转移的假设。 我们还将探索诸如Fisher向量之类的模型的无序合并阶段如何通过丢弃空间信息而导致性能下降,以及如何通过在局部特征中明确包含粗糙的空间信息来克服这种情况。 代码说明 该存储库包含使用VLFEAT的MATLAB代码,并在run_experiment.m脚本中的各种设置下提取Fisher矢量特征。 不幸的是,我们无法清理并上传LSTM的训练代码来对视觉特征进行图像字幕。 从本质上讲,这只是用我们的功能替换VGG-16的功能,并运行摘自的Andrej Karpathy的培训代码。 CNN功
资源推荐
资源详情
资源评论
收起资源包目录
fv-cnn-caption-master.zip (33个子文件)
fv-cnn-caption-master
run_experiments_train.m 675B
run_experiments.m 4KB
src
setup.m 387B
imdb_cnn_train.m 11KB
imdb_cnn_train_binary.m 11KB
model_train.m 12KB
get_bcnn_features.m 3KB
visualize_filter_patch.m 6KB
get_dcnn_features.m 5KB
flickr8k_get_database.m 1KB
vl_bilinearnn.m 8KB
saveNetwork.m 1KB
montage_datasets.m 1KB
vl_l2norm.m 414B
cub_get_database.m 1KB
vl_nnsqrt.m 87B
facescrub_get_database.m 1KB
compute_confusion.m 423B
vl_nnbilinearpool.m 377B
encoder_save.m 197B
radar_get_database.m 12KB
model_setup.m 6KB
vl_nnbilinear.m 429B
savefast.m 2KB
print_dataset_info.m 1KB
get_rcnn_features.m 2KB
imdb_get_batch.m 3KB
README.md 7KB
downloads
fv_cnn.png 32KB
Loss.png 75KB
dog.png 500KB
cnn_rnn_model.png 37KB
DL_report_final_aahw.pdf 722KB
共 33 条
- 1
资源评论
weixin_38628626
- 粉丝: 5
- 资源: 944
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功