人工智能的下一阶段不会仅由更好的答案来定义。
它将由能够根据上下文行动、深度感知并模拟他们需要改变的世界的系统来定义。
下一个人工智能问题不仅仅是模型知道什么
人工智能对话开始超越聊天机器人界面。
在过去的几年里,人工智能最明显的形式是语言。人们输入问题,模型产生答案,行业通过推理、编码、写作、总结和搜索来衡量进展。这个阶段还没有结束。语言智能仍然变得更加有用、更加嵌入式、更加商业化。
但这不再是故事的全部。
现在更重要的问题是,当人工智能系统不仅生成响应,而且开始使用工具、管理工作流程、理解空间并推理物理世界时,会发生什么。这就是行业开始转向的地方:从语言到动作,从文本到界面,从静态答案到动态环境。
自 HumanX 以来,这种转变变得更加清晰。 全球人工智能支出现在正受到基础设施和代理工具的拉动。问题不仅仅在于出现了另一种模型。代理正在成为企业堆栈的一部分。
这就是为什么旧金山的 HumanX 对话仍然很重要。该事件已经过去,但它捕捉到了现在变得更加明显的转变:人工智能正在从对话系统转向行动系统,从处理语言的模型转向需要对世界有一定了解的模型。
“人工智能从能够回答问题到现在能够做事。”
-黄仁勋
人工智能的第三次浪潮
黄仁勋直接描述了这一演变。他认为,人工智能比大型语言模型要广泛得多。语言是编码信息的一种形式,但信息也被编码在基因、蛋白质、化学物质、物理、工具、软件和环境中。只要有结构,人工智能就可以学习表示它。
这个框架很重要,因为它使人工智能不再被理解为一个单一的类别。聊天机器人很重要,但它们只是更大技术的一种表达。更深层次的转变是人工智能正在成为跨领域表示、预测和行动的一种方式。
黄将当前时刻描述为第三波浪潮的开始。现代人工智能的第一波浪潮是生成式的:可以将一种信息形式转化为另一种信息形式的模型。第二波浪潮是推理,模型变得更加扎实和有用。在他看来,第三波浪潮是代理性的。
“现在发生的事情是人工智能从能够回答问题到现在能够做事,”他说。
这是描述新重心的简洁方式。提示不再只是一个问题。它越来越多地成为一种行动请求:构建某些内容、分析某些内容、使用这些工具、访问这些文件、迭代直到工作完成。
黄最有用的一句话可能更简单:“人工智能是使用软件的软件。”
这个想法改变了应用层的含义。软件行业是围绕人类使用的工具建立的。文字处理器、电子表格、设计套件、企业系统、开发人员工具、CRM、ERP 和分析平台都是为坐在屏幕前的人们而设计的。如果人工智能代理成为工具用户,软件的用户数量就会急剧增加。
结果不仅仅是更加自动化。它是对软件本身使用方式的重新发明。
编码来管理代理
HumanX 上的 OpenAI/Codex 对话使软件工程内部也发生了同样的转变。
Srinivas Narayanan将编码工具描述为已从辅助转向代理。工程师不再仅使用人工智能来自动完成功能或解释代码。它们是生成软件、审查软件和修复错误的指导系统。用他的话来说,这项工作已经变成“主要不是编写软件,而是管理代理”。
这条线与知识工作中正在发生的事情直接相关。编码是这种代理模式变得高度可见的第一个领域,因为软件是异常可验证的。可以编写测试。存储库是有限的。错误是可以重现的。可以检查输出。
但更深层次的主张是,编码可能是其他形式工作的预演。 Narayanan 将 Codex 和编码模型描述为成为多种知识工作的基础工具,从法律和财务工作流程到业务流程自动化。
这就是代理不仅仅是开发人员工具的地方。它们成为通用的工作界面。如果他们可以操作文件、访问系统、使用应用程序以及在护栏内操作,那么使它们对代码有用的相同原语也可以使它们对其他工作流程有用。
限制不是想象力。它是环境、安全和访问。座席是否了解公司的系统 – 它是否了解工作流程 – 它是否具有正确的权限 – 是否可以被监控 – 当座席开始与其他座席交互时是否可以信任 –
这些问题就是为什么代理未来不仅仅是一场模型竞赛。这是一个基础设施、治理和接口问题。
从文字到世界的转变
如果说 Jensen 和 OpenAI 展示了从回答到行动的转变,那么李飞飞将对话推向了另一个前沿:空间智能。
她的论点并不是说语言智能已经结束。事实上,她明确表示语言模型仍然至关重要。但人类的智能不仅仅在于语言。我们通过空间、运动、物体、身体、几何、相互作用和时间来理解世界。为了让机器在物理和虚拟环境中变得更加有用,它们需要某种版本的空间理解。
李将这种意识的缺失描述为黑暗中的智慧。她说,当动物意识到自己的身体以及它们与世界的关系时,智力就迅速进化。对于人工智能来说,这意味着观察和推理世界并不是智能的附属品。它是它的核心。
她对世界模型的定义很精确:一个能够理解空间、推理几何、交互性、物理和动力学,并最终生成 3D 和 4D 空间的系统,就像今天的计算机生成文字一样。
这与打造更好的聊天机器人是不同的目标。它指向可以为机器人创建训练环境、帮助设计体验、支持医疗成像、为虚拟世界提供动力以及对物理环境的下一个状态进行建模的系统。
Li 在舞台上讨论的 World Labs 的 Marble 是该方向的早期表达:真正的 3D 一致世界的生成模型。重点不仅在于可以生成这样的世界。它们可以成为其他系统学习、测试、模拟和行动的环境。
下一阶段是行动加上世界理解
总而言之,HumanX 对话表明人工智能的下一阶段将不会由一个界面来定义。
代理商需要工具。企业需要护栏。软件需要上下文。机器人技术需要空间数据。视频模型需要时间理解。世界模型需要计算、新架构和训练环境,而这些在互联网规模上尚不存在。
共同点是人工智能正在离工作更近,离世界更近。模型仅仅产生可信的语言已经不够了。他们需要采取行动、操作软件、了解环境并生成可验证、使用和可信的输出。
这也是为什么旧金山仍然是一个如此有用的镜头的原因。 HumanX 不仅仅是人工智能高管和创始人的聚会。这是该行业下一个争论的快照:前沿正在从文字转向工作流程,从工作流程转向世界。
但这并没有降低语言的重要性。它使其成为更大系统的一部分。
第一个大众市场人工智能体验是对话。下一个可能是授权。之后,它可能是模拟:代理在他们可以理解、建模和改变的环境中工作。
这就是 HumanX 捕捉到的瞬间的真正意义。人工智能的下一阶段不仅仅是更智能的答案。这些系统可以根据环境采取行动,进行深度感知,并最终推理出他们需要改变的世界。
<小时/>





