Sora 由 OpenAI 开发的一种人工智能模型
能够生成长达 1 分钟的高清视频,涵盖广泛的视觉数据类型和分辨率。Sora通过在视频和图像的压缩潜在空间中训练,将其分解为时空位置补丁,实现了可扩展的视频生成。
Video Diffusion Models是一个专注于视频生成的研究项目,它利用扩散模型(diffusion models)来生成高质量视频。这些模型在图像生成和音频生成领域已经取得了显著的成果,并且正在探索在视频数据上的新应用。
Video Diffusion Models项目展示了扩散模型在视频生成领域的潜力,通过创新的梯度条件方法和自回归扩展技术,生成了具有高度时间连贯性和质量的视频样本。这项工作为视频生成领域提供了新的视角,并为未来的研究和应用奠定了基础。