Google DeepMind首席执行官Demis Hassabis透露了最终将公司的双子座AI与其VEO视频生成器融合的计划,旨在在最近的一次露面中教授更多有关物理世界的人工智能 可能的 播客。
Hassabis解释了该策略与他们对能够在现实情况下能够帮助用户的“通用数字助手”的愿景保持一致。他在Reid Hoffman共同主持的播客中说:“我们一直在建立了我们的基础模型Gemini,成为多模式。”
此举反映了更广泛的行业向多功能“ Omni”模型转变。 Google最新的双子座版本已经处理了音频,图像和文本生成 图像创建 在chatgpt和亚马逊 打算 启动“任何一无所人”模型。
开发这些综合模型需要跨越视频,图像,音频和文本的大量数据集。 Hassabis暗示,视频数据燃烧VEO很大程度上起源于Google拥有的平台YouTube。
他阐述了通过处理广泛的YouTube内容,VEO了解了现实世界的物理学。 “[Veo 2] 您知道,您知道世界的物理学。
Google以前已承认 TechCrunch 它的模型“可能会受到“一些” YouTube内容的培训,与与创作者的协议一致。报告表明,Google去年更新了其服务条款,有可能扩大用于AI培训目的的数据的访问。