没有合适的资源?快使用搜索试试~ 我知道了~
一个Web网站,用于使用Sora 生成AI视频.zip
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 141 浏览量
2024-04-22
09:26:51
上传
评论
收藏 527KB ZIP 举报
温馨提示
Open Sora团队计划复现Sora的技术架构主要由以下三部分组成: Video VQ-VAE:用于视频压缩至潜在空间的模型,支持可变时长的处理。 Denoising Diffusion Transformer(去噪扩散型Transformer):核心的去噪和扩散模型,用于对批量潜变量进行去噪处理。 Condition Encoder(条件编码器):用于添加额外条件信息,如类别、位置等,以指导生成过程 可变长宽比 为复现Sora视频的可变长宽比,Open Sora团队采用了一种动态掩码策略。该策略参考了上海AI Lab提出的FiT(Flexible Vision Transformer for Diffusion Model)方法,在并行批量训练的同时保持灵活的长宽比。具体实施时,将高分辨率视频下采样至最长边为256像素,同时在右侧和底部用零填充至一致的256x256分辨率,便于模型的批量处理和注意力掩码的应用
资源推荐
资源评论
资源评论
野生的狒狒
- 粉丝: 2717
- 资源: 2219
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功