Google I/O 是 Google 的年度开发者大会,于今年 2024 年 5 月 14 日以虚拟方式举行。这次活动深受科技爱好者和开发者的期待,为 Google 提供了一个展示其在人工智能、软件更新方面最新进展的平台和硬件创新。
今年的I/O 尤其值得注意的是,它强调谷歌人工智能技术Gemini在各种产品和服务中的持续开发和集成。
增强的 Google 搜索
- 视频搜索:Google Lens 现在可以通过分析录制的视频进行搜索。 用户可以在视频中提出问题,谷歌的人工智能将尝试在线寻找相关答案。
- 人工智能概述:Google 搜索正在接受人工智能改造。 用户将看到“人工智能概述”(以前称为“搜索生成体验”),其中包含来自网络的汇总答案,类似于 Perplexity 或 Arc Search 等人工智能搜索工具。
跨产品的人工智能集成
- 询问照片:今年夏天推出的一项新功能允许用户使用 Gemini 询问有关其 Google 照片库的问题。 它可以检索超出基本照片识别的特定信息。
- 工作空间中的双子座:最新的 Gemini 型号 (1.5 Pro) 将集成到文档、表格、幻灯片、云端硬盘和 Gmail 的 Workspace 侧边栏中。 它将充当通用助手,从您的云端硬盘内容中获取信息并执行撰写电子邮件或设置提醒等任务。
新的人工智能模型和工具
- 双子座1.5闪存:Google 推出了新的 AI 模型 Gemini 1.5 Flash,针对特定任务的快速响应进行了优化。 它以更广泛的功能补充了现有的 Gemini 1.5 Pro 型号。
- 阿斯特拉计划:这个雄心勃勃的项目旨在创建一个万能的人工智能助手,它可以理解视觉信息、记住物体的位置并代表你执行操作。
- 维奥:Google 对 OpenAI 的 Sora 的回应,Veo 是一种生成式 AI 模型,可根据文本、图像和视频提示创建 1080p 视频。 它已经被一些 YouTube 创作者使用,并有望在电影中使用。
- 宝石:与 OpenAI 的 GPT 类似, 宝石 允许用户针对特定交互和专业化定制 Gemini。 它适用于 Gemini Advanced 订阅者。
人工智能改善用户体验
- 双子座直播:这项新功能旨在让与 Gemini 的语音聊天感觉更加自然。 该语音将具有更多的个性,用户可以打断或要求它分析他们的摄像头输入并提供实时信息。
- 圈圈搜索:Android 用户现在可以在屏幕上圈出数学问题并接收解决该问题的分步指导,从而防止学生简单地复制答案。
- 人工智能驱动的诈骗检测:Android 手机将利用设备上的 Gemini Nano AI 根据对话模式中的危险信号识别潜在的诈骗电话并警告用户。
- 用于设备上任务的人工智能:Android 设备很快将允许用户询问有关屏幕上视频的问题,并根据自动字幕提供答案。 此外,Android 上的 Gemini Advanced 用户可以利用 Gemini 进行 PDF 分析和信息提取。
Chrome 中的人工智能集成
- Chrome 中的 Gemini Nano:桌面版 Google Chrome 将集成 双子座纳米,AI模型的轻量级版本。 这个内置助手将利用设备上的人工智能为社交媒体帖子、产品评论等直接在 Chrome 中生成文本内容。
人工智能内容安全
- SynthID 升级:谷歌正在扩展其人工智能水印技术 SynthID 的功能。 现在,它可以将水印嵌入到使用 Veo 创建的内容中,并且还可以检测人工智能生成的视频。
Google I/O 2024 让我们得以一睹科技的未来,展示 Google 在人工智能、软件开发和负责任的人工智能实践方面的进步。
谷歌对负责任的人工智能开发的承诺表明了对围绕这项强大技术的道德考虑的认识。 凭借这些进步,谷歌将自己定位在技术创新的前沿,为未来几年令人兴奋的可能性铺平了道路。
特色图片来源: 谷歌