谷歌有 宣布 推出两种生成式人工智能模型 Veo 和 Imagen 3,可供使用 Vertex AI(其人工智能工具云平台)的企业使用。 Veo 旨在根据图像和文本提示生成高清视频,而 Imagen 3 则专注于从简单的文本输入生成逼真的图像。
谷歌推出面向企业的生成式人工智能模型 Veo 和 Imagen 3
Veo 由 Google DeepMind 开发,可生成具有逼真人物和动物的视频。用户可以通过上传与文本提示相关的图像或单独输入文本来创建内容。目前,部分企业可以通过私人预览版访问 Veo。它可生成长达六秒的 1080p 视频剪辑,支持每秒 24 或 30 帧。谷歌云产品管理高级总监 Warren Barkley 表示,企业对生成式 AI 的反应非常积极,有报告显示,集成这些技术的公司收入增长了 86%。
迅速的: 北极光在北极天空中舞动,星星闪烁,白雪覆盖的景观
视频:谷歌
图像3同样是新推出的,被誉为 Google 最高质量的图像生成模型。它可以创建逼真的图像并提供高级编辑功能,例如添加、删除或扩展图像中的元素。从下周开始,所有 Vertex AI 客户都将可以使用 Imagen 3。吉百利、奥利奥和 Milka 等品牌是首批在营销策略中使用这些模型的品牌之一。
两种模型都利用 Google DeepMind 的 SynthID 技术,结合了数字水印,以防止错误信息和错误归属。此外,它们还包括内置的保护措施,以防止滥用和有害内容的生成。重要的是,这两个模型都没有接受客户数据的训练。
Veo 的功能和限制
Veo 的私人预览版将使 Quora 和 Mondelez International 等企业能够探索创意应用程序,例如为其平台生成视频内容。 Veo 能够创建具有特定视觉风格的场景是其突出的功能之一。它可以生成动态内容,包括风景照片和延时视频。然而,该模型并非没有缺陷。物体消失和不切实际的物理现象(例如倒车车辆)等问题凸显了其当前的局限性。
迅速的: 一辆快速车道驶过一条绿树成荫的郊区住宅街道。白天有清澈的蓝天。色彩饱和、对比度高
视频:谷歌
Veo 接受了各种镜头的培训,以增强其能力。当被问及其培训来源时,巴克利提到,根据与内容创作者的协议,它“可能”包含来自 YouTube 的内容。他强调,谷歌专注于使用高质量、精选的数据,遵守安全标准。与其他人工智能模型一样,人们对版权和专有内容也存在担忧,尤其是模型有可能输出与现有作品几乎相同的副本。
谷歌声称它已经实施了提示级过滤器来管理潜在有害的输出。此外,该公司计划在 Vertex AI 上的 Veo 普遍可用后对其输出进行赔偿,为使用该工具的企业提供一些保护。
谷歌正在逐步将 Veo 整合到其产品套件中,今年早些时候在最初发布公告后将其引入谷歌实验室就证明了这一点。 9 月,该模型被纳入 YouTube Shorts,让创作者可以轻松制作背景场景和简短的视频剪辑。
特色图片来源: 谷歌深度思维