Phenaki一个能够根据文本提示生成视频的模型编辑

2个月前发布 17 0 0

Phenaki是一个能够根据文本提示生成视频的模型，它支持随时间变化的提示，并能够生成长达几分钟的视频。主要特点：文本到视频的生成：根据文本提示生成视频，提示可以是变化...

收录时间：

2024-10-31

打开网站手机查看

AI视频大模型

Phenaki一个能够根据文本提示生成视频的模型

🌐 经济型：买域名、轻量云服务器、用途：游戏网站等《腾讯云》特点：特价机便宜适合初学者用点我优惠购买

🚀 拓展型：买域名、轻量云服务器、用途：游戏网站等《阿里云》特点：中档服务器便宜域名备案事多点我优惠购买

🛡️ 稳定型：买域名、轻量云服务器、用途：游戏网站等《西部数码》特点：比上两家略贵但是稳定性超好事也少点我优惠购买

Phenaki是一个能够根据文本提示生成视频的模型，它支持随时间变化的提示，并能够生成长达几分钟的视频。

主要特点：

文本到视频的生成：根据文本提示生成视频，提示可以是变化的。
视频长度：能够生成长达几分钟的视频。
交互式示例：用户可以选择不同的上下文词组合来创建关于宇航员的视频。
从静态图像生成视频：输入是第一帧图像加上提示，生成视频。

主要功能：

文本提示序列：根据一系列文本提示生成视频。
视频压缩：使用新的因果模型学习视频表示，将视频压缩成离散标记的小表示。
变长视频处理：使用因果注意力机制处理不同长度的视频。
双向遮蔽变换器：用于从文本生成视频标记。

使用示例：

示例1：生成一个在旧金山海洋中游泳的逼真泰迪熊的视频。
示例2：生成一个在海滩上放松的泰迪熊的视频。
示例3：生成一个在火星上行走、跳舞、遛狗并观看烟花的宇航员的视频。

总结：

Phenaki模型通过文本提示合成现实感视频，解决了生成视频的计算成本、高质量文本-视频数据量有限以及视频长度可变等挑战。它通过联合训练大量图像-文本对和少量视频-文本示例，实现了超越现有视频数据集的泛化能力。Phenaki是首个研究生成随时间变化提示视频的模型，并且在视频的空间-时间质量和每视频标记数方面超越了文献中使用的每帧基线方法。

数据统计

Phenaki一个能够根据文本提示生成视频的模型编辑

主要特点：

主要功能：

使用示例：

总结：

数据统计

相关导航

海螺AI—MiniMax 旗下生产力产品，你的AI伙伴，10倍速提升工作学习效率

Video Diffusion Models一个专注于视频生成的研究项目

Sora 由 OpenAI 开发的一种人工智能模型

百度智能云千帆大模型平台

Luma AI

腾讯智影

通义tongyi.ai视觉大模型 通义万相

新壹科技视频大模型

通义tongyi.ai视觉大模型通义万相