DeepMind 有 介绍 Genie 2,一种先进的人工智能模型,能够从简单的文本描述和图像生成交互式 3D 世界。 Genie 1 的后继产品于 2024 年 12 月 4 日发布,它创建了多样化的虚拟环境,允许用户通过键盘和鼠标控制动态参与,模拟跳跃和游泳等动作。它接受了各种视频的训练,可以对交互、物理和 NPC 行为进行建模。
DeepMind 推出 Genie 2,一款针对 3D 世界的革命性人工智能
Genie 2 能够可视化各种 3D 场景,提供类似于 AAA 视频游戏的功能。通过处理提示,模型可以产生一致的环境,包括持续 10 到 20 秒的第一人称和等距视角,有些甚至长达一分钟。 DeepMind 声称该模型可以记住场景中超出直接视图的部分,并在重新出现时准确地渲染它们。这与 Decart 的 Minecraft 模拟器等现有模型形成鲜明对比,后者经常在一致性和分辨率方面遇到困难。
这些泄露的 Battlemage Intel GPU 是游戏怪兽
Genie 2 的基本元素涉及处理与文本提示配对的参考图像,从而简化高度交互环境的生成。例如,“树林里有一个可爱的人形机器人”这样的提示可以让模型创建相应的场景。复杂的交互的加入,例如让玩家能够弹出气球或导航环境,展示了其强大的物理引擎。尽管具有这些功能,但人们仍然担心模型对输入的解释,特别是由于缺乏有关训练数据源的详细信息,它是否无意中复制了受版权保护的游戏元素。
Genie 2 训练数据所产生的知识产权影响引发了重大问题。 DeepMind 受益于谷歌对 YouTube 的广泛访问,可能会利用视频内容进行模型训练。这种访问导致人们猜测所观察到的游戏会产生未经许可的复制品,这可能会成为法律审查的问题。随着人工智能模型模糊了原创性的界限,未经授权的复制的担忧日益凸显。
调查结果来自 有线 调查强调,包括动视暴雪在内的大公司正在采用人工智能技术来简化流程,这可能会导致失业。 Genie 2 的推出可能会使情况进一步复杂化,人工智能工具加速开发,同时挑战传统工作角色。
DeepMind 强调 Genie 2 在为 AI 代理开发多样化评估任务方面的作用。虽然该模型的计算要求和商业化前景尚未公开,但不断的进步表明人工智能和游戏设计之间的关系正在不断发展。各种报告表明,对世界模型技术的投资大量涌入,这标志着人工智能研究和互动游戏体验的关键转变。这一趋势与人们对人工智能重塑创意产业的潜力日益浓厚的兴趣产生了共鸣。
DeepMind 集中的招聘工作凸显了其对开拓性发展的承诺。他们从其他领先的人工智能公司战略性地招募人才,强化了他们保持在生成人工智能技术前沿的意图。
特色图片和视频来源: 谷歌深度思维