OpenAI 有 推出 ChatGPT 中的实时视频功能,通过视觉理解增强其高级语音模式。该功能于 12 月 12 日开始推出,允许用户通过摄像头与 AI 交互,以获得上下文帮助。此次集成标志着人工智能对话能力的显着进步,特别是对于订阅 ChatGPT Plus、Team 或 Pro 的用户来说。
OpenAI 通过实时视频功能增强 ChatGPT
高级语音模式现在包括实时视频分析和屏幕共享功能。用户可以将手机指向物体以获得立即响应,或共享屏幕以获取设置或问题的详细说明。这一新增功能建立在之前的功能之上,可提供更具交互性的用户体验。 OpenAI 在直播中演示了该功能,展示了其参与随意对话并根据视觉输入提供见解的能力。
至于可用性,推出时间为 12 月 12 日,并将持续到下周。然而,欧洲用户以及 ChatGPT Enterprise 和 Edu 订阅者可能会面临延迟;这些用户将于明年初获得访问权限。此次扩展表明 OpenAI 专注于增强用户与 AI 的交互,这与其在其产品套件中提供高级功能的总体目标保持一致。
与 iOS 18.2 集成
在并行开发中,Apple 最近 介绍 iOS 18.2,整合了 Siri、写作工具和视觉智能等多项 ChatGPT 功能。与 Siri 的集成使语音助手能够识别超出其范围的查询并将其重定向到 ChatGPT。用户将收到通知,并且必须批准此操作才能继续。
对于使用 iPhone 16 设备的用户,视觉智能使他们能够将相机对准物体或情况,以通过 ChatGPT 或 Google 检索信息。此外,写作工具功能现在包括一个新的“撰写”工具,可以使用 ChatGPT 的功能从头开始创建内容。这些功能强调实用性和用户控制,其结构符合 ChatGPT 的使用限制,确保有组织的体验。
“OpenAI 12 天”的更新
OpenAI 组织了一场名为“OpenAI 12 天”的活动,从 12 月 5 日开始,每天都有直播会议展示新功能或产品。首席执行官萨姆·奥尔特曼 (Sam Altman) 将此次活动描述为重大更新和小幅改进的结合。其中值得注意的公告是为高级语音模式引入了新的圣诞老人语音,用户可以通过雪花图标激活该语音。
此外,该活动 揭幕 OpenAI 的新视频模型 Sora 现已推出 ChatGPT 专业版 和 Plus 用户。该模型可以生成文本到视频和视频到视频内容,显着拓宽了用户可用的创意途径。其他值得注意的更新包括 公告 面向所有 Web 用户的 Canvas(以前是测试版功能)可实现更加集成的项目管理体验。
展望未来,OpenAI 计划扩展其产品,包括完整版本的 o1 语言模型,以进一步增强推理能力。该公司的目标是让强化微调得到更广泛的应用,目前正在向研究机构和大学寻求应用程序,以针对特定任务微调人工智能模型。
特色图片来源: 开放人工智能