在 Copilot AI 系列的新更新中,微软 发射 一系列改进预计将使与设备的交互变得更加容易。其中,Copilot Vision、Think Deeper、Copilot Voice 进一步旨在在 Windows、iOS、Android 和 Web 上提供以用户为中心、及时且上下文感知的体验。
所有这些功能都以某种方式属于微软正在采取的更广泛的方法,让 Copilot 融入人们的日常活动,将人工智能解决方案与保护用户隐私相结合。
Copilot Vision:使用万维网的全新观点和方法
在新功能中,有 Copilot Vision,它可以让用户就屏幕上的内容提出各种问题 – 无论是网页上的文本还是图像。 例如,在使用该网站时,可以询问照片中描绘的特定食谱或家具建议。然后,Copilot Vision 会扫描用户正在消费的内容,并根据内容实时响应用户。
Copilot Vision 可通过 Microsoft Edge 在地址栏中输入“@copilot”进行访问,作为 Copilot Labs 的一部分提供,一个独家选择加入计划,为选定的用户组提供实验性功能。虽然这一功能并不完全是开创性的——谷歌的 Android 平台提供了类似的功能——微软声称 Copilot Vision 更进一步,确保不存储或使用任何数据来训练人工智能模型。
微软一直热衷于通过该工具强调其对隐私的承诺。在最近的一篇博客文章中,该公司强调 Copilot Vision 会在对话后立即删除所有处理过的数据,不存储任何音频、图像或文本。这可能是为了回应人们对人工智能系统中数据滥用的日益担忧,在对其人工智能产品过去发生的事件进行法律审查后,微软一直在小心翼翼地解决这一问题。
然而,Copilot Vision 也有一定的局限性。目前,该工具无法分析来自付费网站或敏感网站的内容,其功能仅限于预先批准的网络属性列表。这一限制似乎是为了避免类似于微软面临《纽约时报》的法律挑战,《纽约时报》指责该公司允许其人工智能工具绕过付费墙并访问优质内容。
深入思考:利用人工智能推理解决复杂问题
Copilot 套件的另一个重要补充是 Think Deeper,该功能利用高级推理模型来帮助用户导航复杂的任务。 无论是解决复杂的数学问题还是比较多个家居装修选项,Think Deeper 都旨在分解和分析复杂的场景。
微软将 Think Deeper 描述为一种提供分步指导的工具,使其对日常挑战和更专业的问题都很有用。该公司指出,该功能由“推理模型”提供支持,需要额外的时间来响应,以确保得到更彻底和准确的答案。尽管微软对所使用的具体模型一直守口如瓶,但它很可能是 OpenAI o1 模型的定制版本,微软为此进行了微调。
目前,Think Deeper 仅适用于美国、英国、加拿大、澳大利亚和新西兰等国家/地区的部分 Copilot Labs 用户,并计划在未来扩大可用性。
副驾驶语音:由您指挥的对话式人工智能
微软人工智能功能中的最后一个是副驾驶语音,能够向副驾驶发出指令并发出命令。 Copilot Voice 首先在美国、英国、加拿大、澳大利亚和新西兰推出,通过口头回答扩展了 Copilot 的精神。
与 ChatGPT 中 OpenAI 的语音一样,Copilot Voice 能够感知语音音调,并做出相应的响应。该应用程序的某些功能使其更具吸引力:例如,用户可以在对话期间暂停 Copilot 或在句子中间打断其回答。该应用程序的特点是四种合成声音,触感非常自然和逼真。
然而,用户与 Copilot Voice 的互动程度是有限的。 Microsoft 实施了基于时间的使用限制,Copilot Pro 订阅者可以根据总体需求获得额外的分钟数。
个性化:根据您的喜好定制 Copilot
除了主要功能更新之外,微软还为 Copilot 引入了个性化选项。 这些设置允许人工智能根据用户过去的交互来定制建议,从其他微软应用程序和服务的活动中获取洞察。据微软称,这将有助于 Copilot 提供更多相关建议并更快地访问有用的功能。
然而,个性化的推出在某些地区被推迟。目前,此功能将不再在欧盟或英国提供,因为微软将继续权衡如何适应这些地区严格的数据保护法。它遵循了苹果、Meta等领先IT企业以及其他公司在欧盟推出人工智能解决方案时所执行的策略。
微软表示,该公司期待在这些领域为用户提供个性化服务,同时满足《数字服务法》等法律规定,该法规范了欧盟人工智能的使用和数据保护。过去,该公司曾收到过某些监管问题,特别是欧洲经济区 (EEA) 最近向微软提出警告,称其可能因未提供有关其生成式人工智能产品的足够详细信息而受到处罚。 隐私和责任是核心
在这些新功能的推出过程中,微软始终坚持隐私和用户反馈是其开发过程的核心。该公司强调,Copilot Vision、Think Deeper 或 Copilot Voice 处理的任何数据都不会用于人工智能训练或在即时会话之外存储。
特色图片来源: 微软