Google 推出新的视频生成工具后,如何使用 Google VideoPoet 的问题就开始在科技界引起共鸣。
Google VideoPoet 是对传统视频生成模型的重大改进,提供了广泛的令人兴奋的特性和功能。 借助 MAGVIT-2 的训练,谷歌再次瞄准人工智能工具领域的第一把交椅。
但如何使用 Google VideoPoet 以及为什么有人应该考虑尝试一下呢? 让我们解释一下。
如何使用 Google VideoPoet
不幸的是,Google VideoPoet 尚未公开。 虽然它早在 2023 年 5 月就已宣布并展示了一些令人印象深刻的功能,但目前仍处于开发阶段,无法供一般使用。 所以我们还不能告诉您如何使用 Google VideoPoet。
然而,有几种方法可以发现 Google VideoPoet 的功能,尽管您不会亲自尝试。
网站演示
不幸的是,VideoPoet 还没有一个可公开访问的平台。 不过,研究团队发布了一个演示网站,您可以在其中体验其一些功能: https://sites.research.google/videopoet/
在这里,您可以找到展示不同风格和功能的预先生成的视频示例。
研究论文
要更深入地了解 VideoPoet 的内部工作原理,您可以深入研究研究论文: https://blog.research.google/2023/12/videopoet-large-language-model-for-zero.html
本文详细介绍了该工具的技术方面、局限性和潜力。
请记住,VideoPoet 仍在研究中,其可访问性和功能将来可能会发生变化。 然而,通过探索可用资源并保持更新,您可以随时了解这项令人兴奋的人工智能技术及其对视频创作的潜在影响。
Google VideoPoet 有哪些突出功能?
现在我们已经解释完如何使用 Google VideoPoet,让我们来看看这个人工智能工具的奇迹。
VideoPoet 是一种革命性的视频生成模型,可以通过简单的文本提示生成高动态的可变长度视频。 这个强大的工具能够生成与输入视频匹配的音频,而不需要任何额外的文本指导。
VideoPoet 令人印象深刻的能力背后的秘密在于其简单而有效的组件。 它利用预先训练的 磁力V2 视频分词器和 SoundStream 音频分词器,可将图像、视频和音频剪辑转换为统一的词汇表。 然后,自回归语言模型使用该词汇表,该模型可以学习各种模式(包括文本)来生成高质量的视频。

VideoPoet 最显着的功能之一是它能够生成各种大的、有趣的和 高保真动作。 这是由于模型具有跨不同模式学习的能力,使其能够合成和编辑具有高度时间一致性的视频。 因此,了解如何使用 Google VideoPoet 将让您毫不费力地创建高质量视频。
VideoPoet 的另一个令人兴奋的功能是它能够讲述 视觉故事。 通过随着时间的推移改变提示,用户可以创建在他们眼前展开的引人入胜的叙述。 此外,VideoPoet 支持生成方形或纵向视频,使其成为短格式内容的理想选择。
Google VideoPoet 的运行情况如何? 您可以在 YouTube 视频中亲自观看 谷歌研究 以下。
VideoPoet 还提供交互式编辑功能,允许用户扩展输入视频并从示例列表中进行选择以精细控制所需的动作。 此功能对于创建与特定文本提示匹配的自定义视频特别有用。
该模型的可控视频编辑功能还不止于此。 还可以 编辑主题以遵循不同的动作,例如舞蹈风格,并生成与给定文本提示匹配的视频。 此外,VideoPoet 可以根据文本提示对输入视频进行风格化,展示风格上令人愉悦的提示遵守情况。
用户还可以在其中编写样式和效果 文本到视频生成 只需将样式附加到基本提示即可。 此功能提供了无限的创作可能性,使 VideoPoet 成为内容创作者的宝贵工具。

最后,VideoPoet 提供 零镜头可控相机运动,使用户能够在文本提示中指定相机拍摄的类型。 此功能是 VideoPoet 预训练的一个新兴属性,证明了该模型生成高质量摄像机运动定制的能力。
我们的如何使用 Google VideoPoet 文章已经结束。 谷歌最近在人工智能方面的投资是显而易见的。 如果您对人工智能感兴趣,我们建议您关注 双子座人工智能 和 深度思维 密切。
特色图片来源: 谷歌视频诗人。