Google AI Project Astra 在 Google I/O 2024 上亮相,有望成为 Google AI 武器库中的关键工具。 Astra 被设计为“对日常生活有帮助的通用人工智能代理”,融合了以下功能: 谷歌助理 和 谷歌双子座,通过新功能和对话界面增强它们。
这代表了人工智能技术的重大进步,超越了现有的聊天机器人和语音助手。
Google AI Project Astra 提供多模式、对话式 AI 体验
虽然 Astra 的核心功能(回答问题、生成文本或分析图像)可能听起来很熟悉,但其区别在于其多模式功能、快速处理和对话能力,如下所示: 谷歌 I/O 2024。 谷歌的设想 阿斯特拉计划 作为一个多功能的人工智能代理,能够理解和响应各种类型的输入——文本、图像、视频和音频。
谷歌 AI Project Astra 能够实时工作、维护上下文并记住过去的对话,这使其与当前的 AI 模型区分开来。 演示表明 Astra 在手机和智能眼镜上发挥作用, 谷歌 Gemini 人工智能模型,表明可能集成到 Gemini 应用程序中。
Project Astra 的整合之路
谷歌表示,“其中一些代理功能将于今年晚些时候出现在 Gemini 应用等谷歌产品中”。
然而,成熟的 Project Astra 体验可能不会立即向公众开放。 虽然 Astra 的元素可能会在 2024 年逐渐出现在 Google 应用程序中,但可能涉及专用硬件的完整体验可能会稍后推出。
Project Astra 的早期演示展示了其功能。 在一个示例中,Astra 使用手机的摄像头来识别场景中的对象,并响应提示以突出显示特定组件。 其他演示包括识别绘图中的地标、记住列表、理解代码片段以及解决数学问题。 Astra 的多模式功能将视觉和听觉输入与自然语言处理相结合,是其增强功能的核心。
硬件是 Google AI Project Astra 的主要障碍
虽然谷歌已经在智能手机和智能眼镜上展示了 Astra,但它也暗示了与其他设备的兼容性。 未来可能会出现集成到无线耳塞或其他外形尺寸中的可能性。 然而,Astra 实时功能所需的处理能力提出了挑战,需要大量的机载处理或快速的云连接。
随着 Project Astra 的推出,谷歌表明了其对推进人工智能技术的持续承诺。 随着 OpenAI 等竞争对手对自己的人工智能模型进行重大升级,谷歌的目标是保持人工智能创新的前沿。 随着 Project Astra 迈向更广泛的可用性和集成,未来将有更多与 Project Astra 相关的公告和开发。
特色图片来源: 谷歌