据报道,OpenAI 在过去两个月里统一了工程、产品和研究团队,彻底修改其音频模型,为预计在大约一年内推出的音频优先个人设备做好准备。 信息。此次检修的目标是超越当前限制,改进 OpenAI 的音频功能。该公司的新音频模型计划于 2026 年初发布,将产生听起来更自然的语音。它将以类似于真实对话伙伴的方式管理中断。该模型还将使人工智能能够在用户说话时同时说话,这是现有模型无法执行的功能。 OpenAI 计划推出一系列采用这种先进音频技术的设备。可能的设计包括眼镜或无屏智能扬声器。这些设备旨在作为伴侣而不仅仅是工具,无缝融入日常互动。
苹果前设计总监乔尼·艾维 为 OpenAI 的硬件计划做出贡献。 OpenAI 在 5 月份以 65 亿美元收购了他的公司 io。 Ive 优先考虑音频优先的设计原则来解决设备成瘾问题。正如 The Information 所指出的,艾维将这种方法视为“纠正过去消费电子产品错误”的机会。音频接口的发展与更广泛的行业发展相一致。超过三分之一的美国家庭配备了具有语音助手功能的智能扬声器。这些设备已将语音交互确立为标准的家庭元素。 Meta 为其引入了一项功能 雷朋智能眼镜 采用五个麦克风阵列。此设置可帮助用户在嘈杂的环境中听到对话。该技术有效地将眼镜转变为放置在脸上的定向聆听设备。谷歌于 6 月份启动了“音频概述”。此功能将搜索结果转换为通过音频传递的对话摘要。用户收到的是语音概述而不是视觉列表,从而方便了免提信息访问。 Tesla 将 Grok 和其他大型语言模型整合到其车辆中。该集成创建了能够进行自然对话的会话语音助手。这些助手通过语音命令和响应来管理导航和气候控制等任务。初创公司追求类似的以音频为中心的硬件,但结果好坏参半。的 人性化的AI Pin一款无屏幕可穿戴设备,在成为该行业的警示故事之前消耗了数亿美元的资金。 Friend AI吊坠就像一条项链,记录用户生活的方方面面,同时提供陪伴。该设备引发了隐私问题以及用户存在恐惧的报道。其他初创公司开发的 AI 环预计将于 2026 年首次亮相。Sandbar 代表了一项努力。另一个涉及 Pebble 创始人埃里克·米吉科夫斯基 (Eric Migicovsky)。这些戒指使佩戴者能够直接与手上的设备进行对话。这些项目的外形各不相同——可穿戴设备、吊坠、戒指——但都强调音频作为主要界面。家庭、汽车甚至脸部等空间都演变成交互式音频环境。





