Dataconomy CN
Subscribe
No Result
View All Result
Dataconomy CN
Subscribe
No Result
View All Result
Dataconomy CN
No Result
View All Result

据称,阿里巴巴框架将 AI 代理代币的使用量减少了 99%

Aytun ÇelebibyAytun Çelebi
3 7 月, 2026
in 研究
Home 研究
Share on FacebookShare on Twitter
Google Preferred Source

阿里巴巴的研究人员开发了 SkillWeaver,这是一个旨在改进企业人工智能系统中子任务路由的框架。 SkillWeaver 为任务创建执行图并为每个节点选择适当的技能。该框架采用了技能感知分解(SAD),这是一种使用反馈循环进行迭代工具选择的技术,将其与一次性选择工具的框架区分开来。

SkillWeaver 专为现实世界的人工智能应用程序而设计,例如通过模型上下文协议 (MCP) 协调多个工具以进行各种业务操作,包括数据处理和报告。测试表明,与将代理暴露于整个工具库相比,SkillWeaver 的方法提高了准确性,同时减少了 99% 以上的令牌消耗。

人工智能系统面临的主要挑战是任务分解的粒度,因为实际查询通常涉及需要多种技能的组合请求。技能被定义为利用结构化自然语言文档的模块化、可重用的规范。当前的人工智能框架通常将工具路由视为单一技能选择任务,这对于复杂的工作流程来说是不够的。

SkillWeaver 的操作由三个阶段组成:Decompose、Retrieve 和 Compose。在分解阶段,LLM 将复杂的用户查询分解为可管理的子任务。接下来,检索阶段采用嵌入模型从技能库中识别每个子任务的候选工具。最后,Compose 阶段评估这些工具的兼容性,并制定一个概述执行计划的有向无环图 (DAG)。

SkillWeaver 还通过实施 SAD 反馈循环解决了法学硕士生成通用描述的问题。该机制让法学硕士起草初步计划,检索匹配技能,并根据检索到的工具细化其分解,确保与特定技术词汇保持一致。

为了评估有效性,研究人员创建了 CompSkillBench,这是一个基于 2,209 项现实技能的 300 个多步骤查询的基准。核心引擎采用70亿参数模型(Qwen2.5-7B-Instruct)进行分解过程和语义搜索检索器。测试表明,SAD 反馈回路将分解精度从 51.0% 提高到 67.7%,更高的模型达到 92% 的精度。

结果强调,较少的指导可能会导致较大模型的性能下降。由于不必要的任务故障,使用较大模型的普通设置比较小模型的性能更差。研究表明,与工具词汇的正确对齐通常比简单地使用更大的模型更具影响力。

值得注意的是,SkillWeaver 将上下文窗口消耗从每个查询的约 884,000 个令牌减少到约 1,160 个令牌,从而显着节省了令牌,从而降低了 API 成本并加快了响应时间。相比之下,LLM-Direct 方法在工具检索方面的准确率仅为 21.1%,而 ReAct 风格的代理则达到了 0% 的准确率。

尽管SkillWeaver的源代码尚未发布,但研究人员已经提供了提示模板,开发人员可以使用LangChain和LlamaIndex等现有库来实现。该框架需要对工具库进行初始矢量化并构建 FAISS 索引,这可以在短时间内完成,从而最大限度地减少检索期间的延迟。

SkillWeaver 的一个局限性是它缺乏多步骤工具链中的错误恢复。该研究表明,如果一个步骤失败,就会危及整个链条,这突出表明需要改进框架内的错误处理机制。

<小时/>

精选图片来源

Related Posts

Penn Medicine 推出 AI-人类系统以加速 CAR T 癌症靶点发现

Penn Medicine 推出 AI-人类系统以加速 CAR T 癌症靶点发现

1 7 月, 2026
Meta 称 Brain2Qwerty v2 将大脑活动转化为文本

Meta 称 Brain2Qwerty v2 将大脑活动转化为文本

1 7 月, 2026
Gartner 指出代理和物理 AI 是 2026 年供应链的首要趋势

Gartner 指出代理和物理 AI 是 2026 年供应链的首要趋势

1 7 月, 2026
OpenAI 表示,Codex 的使用正在扩展到知识工作中

OpenAI 表示,Codex 的使用正在扩展到知识工作中

1 7 月, 2026
CrowdStrike 警告称,到 2025 年,即时注入攻击将袭击 90 多家公司

CrowdStrike 警告称,到 2025 年,即时注入攻击将袭击 90 多家公司

29 6 月, 2026
无线充电多消耗约 40% 的电量

无线充电多消耗约 40% 的电量

25 6 月, 2026
Please login to join discussion

Recent Posts

  • 据称,阿里巴巴框架将 AI 代理代币的使用量减少了 99%
  • 特斯拉将长轴距 Model Y 引入美国
  • GitHub 以有限的公共存储库 CD 赠品来嘲笑 PlayStation
  • 微软探索对 Xbox 游戏的光盘到数字支持
  • 索尼将于 2028 年停止实体 PlayStation 游戏光盘

Recent Comments

您尚未收到任何评论。
Dataconomy CN

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies to improve your experience. You can choose to accept or reject them. Visit our Privacy Policy.