Hugging Face发布了开放式计算机代理,这是一种免费的,云的AI工具,可以在预装诸如Firefox之类的应用程序预加载的虚拟Linux计算机上执行任务。可以通过网络访问的代理可以提示完成诸如浏览Google Maps或搜索信息之类的任务。
类似于Openai的运营商 打开计算机代理 通过打开必要的程序并弄清完成任务所需的步骤来工作。但是,在TechCrunch的测试中,它在更复杂的请求中苦苦挣扎,例如搜索航班,并且经常遇到无法解决的验证测试。
根据需求,用户还可能会经历从几秒钟到几分钟的等待时间。拥抱Face代理团队的成员Aymeric Roucher说,目标是证明开放的AI模型变得越来越有能力和便宜,可以在云基础架构上运行。
“随着视觉模型变得越来越有能力,它们就能为复杂的代理工作流提供动力,” Aymeric Roucher, 陈述 在X上的帖子中。[Some of these models] 支持内置接地,即 [the] 能够通过其坐标中找到图像中的任何元素, [and] 因此 [can] 单击任何项目 [in a virtual machine]。”
Roucher指出,诸如QWEN-VL之类的视觉模型的进步,通过支持内置接地,使它们可以在图像中找到并与元素进行交互,从而启用复杂的代理工作流程。该版本旨在展示开放AI模型的潜力。
随着企业希望提高生产力,代理技术的发展吸引了大量投资。毕马威(KPMG)的一项调查发现,有65%的公司正在尝试AI代理商,并且市场和市场项目将从2025年的78.4亿美元增长到2030年的526.2亿美元。