Meta Platforms Inc将通过即将推出的人工智能版本Llama 4的版本来增强其语音功能 金融时报。这一发展与Meta的策略相吻合,该战略将专注于对话AI代理而不是传统的基于文本的互动。
Meta的Llama 4:通过语音功能转换AI
预计在接下来的几周中,预计在Llama 4中引入了改进的语音功能,旨在促进双向自然对话,用户可以中断AI而不是严格遵守问答格式。这种转变表明了元对改变用户与AI技术的交互的承诺。
首席执行官马克·扎克伯格(Mark Zuckerberg)概述了该公司的雄心勃勃的目标,将2025年指定为其AI产品系列的关键年份,在OpenAI,Microsoft和Google等公司的竞争中,该公司正在开发中。为了承担这些举措,Meta计划在2025年投资高达650亿美元,主要将这笔支出集中在数据中心基础设施上。
除了Llama 4的进步外,Meta还探索了其AI助手Meta AI的高级订阅可能性,这将使IT能够执行诸如预订预订和视频创建之类的任务。该公司还考虑在Meta AI的搜索结果中实施付费广告或赞助帖子。
首席产品官克里斯·考克斯(Chris Cox)表示,骆驼4将作为“ Omni模型”运行,允许语音在系统中本地运行,从而消除了将语音转化为文本和背面的必要性。他强调了这种能力在Morgan Stanley Technology,Media&Telecom会议上的重要性,并指出:“我认为我们仍在围绕着强大的力量扎根。”
Meta一直在评估是否减少这些限制的同时,积极地讨论了最新的Llama模型的必要护栏。这些讨论是在竞争性压力中出现的,因为Openai和Elon Musk的Xai等竞争对手也在部署语音功能方面取得了长足的进步,包括Openai的独特个性产品和Grok 3,该功能具有“无兴奋的模式”,以故意令人反感的方式做出响应。
去年,元对其批评 美洲驼2型这是不愿通过在Llama 3中揭示更灵活的版本来回答良性查询的。语音命令的集成也是Meta的Ray-Ban智能眼镜的关键特征,这些镜头已经在消费者中获得了知名度,进一步表明该公司将轻量级头脑作为未来的主要计算设备的策略。
特色图片来源: Dima Solomin/Unsplash