没有合适的资源?快使用搜索试试~ 我知道了~
STAM:正式实施“图像值16x16的单词,什么是视频值?” (2021纸)
共13个文件
py:10个
license:1个
txt:1个
需积分: 14 0 下载量 112 浏览量
2021-04-01
17:57:52
上传
评论
收藏 16KB ZIP 举报
温馨提示
图像值得16x16字,什么是视频值得? 官方PyTorch实施 Gilad Sharir,Asaf Noy,Lihi Zelnik-Manor 阿里巴巴集团DAMO学院 抽象的 动作识别领域中的领先方法试图从输入视频的空间和时间维度中提取信息。 达到最新技术(SotA)准确性的方法通常使用3D卷积层作为从视频帧中提取时间信息的一种方式。 使用这种卷积需要从输入视频中采样短剪辑,其中每个剪辑都是紧密采样帧的集合。 由于每个短剪辑都覆盖了输入视频的一小部分,因此在推断时会采样多个剪辑,以便覆盖视频的整个时间长度。 这导致计算量增加,并且对于实际应用是不切实际的。 我们通过显着减少推理所需的帧数来解决计算瓶颈。 我们的方法依赖于一个临时转换器,该转换器将全球注意力施加到视频帧上,从而更好地利用每个帧中的显着信息。 因此,我们的方法具有很高的输入效率,并且可以利用一部分数据(每个视频的帧数),计算
资源推荐
资源详情
资源评论
收起资源包目录
STAM-master.zip (13个子文件)
STAM-master
LICENSE 11KB
src
models
temporal_aggregation.py 2KB
transformer_model.py 9KB
__init__.py 60B
layers
drop.py 1KB
__init__.py 0B
utils
__init__.py 60B
factory.py 704B
utils
utils.py 4KB
__init__.py 0B
requirements.txt 67B
README.md 4KB
infer.py 1KB
共 13 条
- 1
资源评论
林海靖
- 粉丝: 61
- 资源: 4728
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- FLUENT UDF代码,读取外部文件网格节点赋值
- 可修改或添加标签,最多可添加5个标签
- XHer是一款虚拟人物沉浸式互动聊天APP,提供二十四小时陪伴体验,随时随地开聊
- HTML5小游戏【iphone桌面图标,仿iphone桌面】游戏源码分享下载 - games.zip
- MT6877 android12系统相机添加多个摄像头切换
- ARM架构与分类,ARM小知识逻辑思维导图
- HTML5小游戏【自带角标的头像生成器-一起逼死强迫症】游戏源码分享下载 - games.zip
- FastStone Capture
- 基于C#的winform框架的书店销售管理系统(源码+数据库).7z
- ConfluenceMemshell
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功