OpenAI 发布了最新文生视频大模型 SORA,可以生成 1 分钟长视频,效果显著,在生成的视频细节,内容一致性和指令遵循能力独树一帜。SORA 模型在训练中将不同类型视觉素材统一为时空 Latent Patch,采用Diffusion-transformer 结构并大规模训练,再次展现“暴力美学”。SORA 模型已具备了一定的涌现能力,虽然也存在“幻觉问题”,但我们认为文生视频的 GPT-3 时刻已来
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~