任何人都可以很快成为下一个斯科塞斯或斯皮尔伯格,而无需任何电影制作经验。
这是许多人工智能视频生成工具背后的公司做出的承诺。但如今这些文本转视频工具有多好呢?他们是否有足够的能力制作一部高质量、成熟的电影?
在本文中,我将分享五款值得一试的文本转视频人工智能工具:
- Stable Video Diffusion
- Runway ML
- Pika Labs
- Emu Video
- Canva AI Video
让我们开始吧。
Stable Video Diffusion
https://stability.ai/
Stable Video Diffusion是 Stability AI 发布的最新模型,Stability AI 是流行的开源 AI 图像生成器 Stable Diffusion 背后的初创公司。它采用图像或文本提示作为输入,并输出长达 4 秒的流畅多帧视频剪辑。
帧之间的插值看起来非常流畅。
SVD 仍处于研究预览阶段,因为它尚未用于实际应用。那些渴望尝试的人可以在这里加入候补名单,但更广泛访问的发布日期仍然未知。还可以下载模型并在本地计算机上运行它。
Runway ML
https://research.runwayml.com/gen2
Runway Gen2于 2023 年 7 月发布,已成为许多创作者的首选 AI 视频生成工具。它可以生成带有文本或图像输入的四秒视频。
以下是我使用免费帐户生成的示例视频。
每月订阅费用为 15 美元,这将为您带来以下好处:
- 高档分辨率
- 去除水印
- 等待时间更短
- 125秒的视频
还有 Pro 级别,每月 28 美元或 35 美元,可提供更多积分。
Pika Labs
https://discord.com/
Pika Labs 最近发布了他们最新的 AI 视频模型Pika 1.0 。目前,没有专门的前端应用程序来尝试该工具,但可以通过Discord bot访问它。
Pika 1.0 将包括以下功能:
- 文本转视频和图像转视频
- 视频到视频:将现有视频转换为不同的风格,包括不同的角色和对象
- 扩展:扩展视频的画布或宽高比
- 改变:用AI编辑视频内容,例如改变某人的衣服、添加另一个角色或改变环境
- 延长:延长现有视频的长度
以下是我生成的一些示例视频:
如果您想了解有关 Pika 的更多详细信息和更新,请查看他们的X和Product Hunt页面。
Emu Video
https://ai.meta.com/
Meta 最近加入了 AI 视频派对,发布了自己的 AI 模型,名为EMU video,它代表 Expressive Media Universe。
该模型在同类最大的数据集上进行训练——1000 万个合成样本,包含输入图像、任务描述和目标输出图像。这使其成为迄今为止同类中最大的数据集。
目前,Emu Video还处于基础研究阶段,还不是真正的产品。Meta在这里发布了一个演示网站,可查看Emu Video生成的视频集合。
Canva AI Video
https://www.canva.com/zh_cn/
Canva 最近添加了一个人工智能工具,可以根据简单的文本描述生成视频。这项新的文本转视频功能是Canva 最近推出的Magic Studio 的一部分,Magic Studio 是一系列人工智能驱动的工具,可提高工作效率。
该工具由 Runway ML 的 Gen2 技术提供支持,因此您可以期待与上面的 Runway ML 示例视频类似的结果。
需要记住的几件事
- 可获得 50 个世代积分,每月重置一次。每一代视频相当于一个学分。
- 这仍然是一项实验性技术,因此在视频中看到的人或动物可能看起来不正确。
- 必须是 Canva Pro 用户才能使用文本转视频功能。Canva Pro 的价格为每月 5 美元或每年 40 美元。
注意:此处列出的一些工具仍处于实验阶段,因此生成的视频的质量可能会有所不同。此外,本文并非由名单上的任何人工智能公司赞助。