拉斯维加斯的能源是电力 AWS re:Invent 2025 目前正在如火如荼地进行中,主题演讲中涌出的公告正在立即重塑云和企业技术的未来。今年,重点集中在自主人工智能、下一代基础设施和战略合作伙伴关系上。
扩大 Amazon Nova 型号系列并推出 Nova Forge
亚马逊是 显着扩大 其专有的 Nova AI 模型系列随着 亚马逊新星2 模型。这些新模型旨在为各种任务提供业界领先的性价比,并可通过 Amazon Bedrock 获取。
新型号包括:
-
Nova 2 精简版:一种快速、经济高效的推理模型,适用于客户服务聊天机器人和文档处理等日常任务。它支持一百万个令牌上下文窗口,并且可通过监督微调(SFT)进行定制。
-
新星2 Pro:AWS 最智能的模型,已提供预览版,专为高度复杂的多步骤代理任务(例如视频推理和软件迁移)而设计。
-
Nova 2 索尼克:对话式人工智能的新语音到语音模型。
-
Nova 2 全向:一种多模态推理和生成模型,可处理和生成文本、图像、视频和语音。
除了模型之外,AWS 还推出了 新星锻造,首创“开放培训”服务。 Nova Forge 使组织能够通过将自己的数据与 Nova 的原始训练数据和检查点混合来构建自己专有的、定制的前沿模型,称为“Novellas”。该服务旨在减轻 灾难性遗忘,这是模型在使用训练后的新数据进行微调后忘记基本功能的风险。
AWS 正在引入自主边境代理
AWS 正在进入一个新的强大类别, 自主人工智能代理 设计为在没有持续人工干预的情况下工作数小时甚至数天,将它们定位为客户软件开发团队的延伸。这些代理在会话之间维护持久的上下文,这意味着它们不会耗尽内存或忘记过去的指令。
引入了三个最初的“边境特工”:
-
Kiro 自主代理:充当虚拟开发人员,可以从待办事项中分配复杂的任务。它独立地计算出如何完成跨多个存储库的工作,并创建经过验证的拉取请求。它 了解团队喜欢如何工作 并随着时间的推移不断加深对代码库和标准的理解。例如,AWS 首席执行官马特·加曼 (Matt Garman) 描述了分配 Kiro 来更新 15 个微服务 在一个提示中。
-
AWS 安全代理:在编写代码时独立工作,识别安全问题,对其进行测试,并提供修复建议,将渗透测试从缓慢的手动过程转变为按需功能。
-
AWS 开发运营代理:自动化操作任务,例如测试新代码的性能问题或与其他软件和环境的兼容性,帮助自主查明性能问题的根本原因。
推出用于 AI 训练的 Trainium3 UltraServers
为了支持训练下一代 AI 模型所需的大规模规模,AWS 推出 这 Amazon EC2 Trn3 Ultra服务器。这些系统由新的 Trainium3芯片,建立在AWS的第一个 3纳米 人工智能硅。
Trn3 UltraServer 的主要规格:
-
他们提供高达 性能提高 4.4 倍 以及以上 性能功耗比提高 4 倍 与之前的 Trn2 UltraServer 相比。
-
单个 UltraServer 最多可托管 144 个 Trainium3 芯片,提供高达 362 MXFP8 PFLOP 的计算。
-
该系统具有高达 20.7TB HBM3e(高带宽内存)和 706 TB/秒 聚合内存带宽。
-
Trainium3 芯片据称是 能源效率提高 40% 比上一代。
-
展望未来,AWS 还公布了路线图 培训4,这将支持 Nvidia 的 NVLink Fusion 互连技术,允许与 Nvidia GPU 互操作。
新的人工智能驱动的数据库储蓄计划
AWS正在推出 数据库储蓄计划,一种新的消费模式,旨在帮助客户保持成本效率,同时保持数据库服务和部署选项的灵活性。
此外,还推出了 Amazon RDS for SQL Server 和 Oracle 的新功能,包括 对 SQL Server 的开发版支持 和支持 M7i/R7i 实例 具有优化的CPU。这些服务的存储选项也在扩展,以支持多达 256 钛硼。
宣布推出适用于本地主权 AI 的 AWS AI Factory
AWS 介绍 一个名为 AWS 人工智能工厂 满足具有严格数据主权和监管要求的企业和政府。该产品允许这些客户运行 AWS 的完整 AI 系统,包括计算、存储以及 Bedrock 和 SageMaker 等 AI 服务, 在自己现有的数据中心内。
AWS AI Factory 是与 英伟达 并且可以配备 Nvidia 最新的 Blackwell GPU 或 Amazon 的新 Trainium3 芯片。该服务旨在像私有 AWS 区域一样运行,提供对 AI 基础设施的安全、低延迟访问,同时确保数据保留在本地。 AWS 负责集成基础设施的部署和管理。
用于代理开发的 Amazon Bedrock AgentCore 增强功能
Amazon Bedrock AgentCore,用于构建和部署生成式 AI 应用程序的平台, 已收到 主要的新功能旨在帮助开发人员构建和扩展可用于生产的人工智能代理,并具有更好的控制力。
-
AgentCore 中的策略:允许开发人员使用自然语言为代理操作设置边界,从而实现更强有力的治理。例如,可以设置一个边界,以便代理可以自动发放退款,最多可达 100 美元 但必须让人类参与更大的事情。
-
AgentCore 评估: 一套 13个预建评估系统 监控代理行为的正确性、安全性和工具选择准确性等因素。
-
代理核心内存:引入新的情景功能,帮助代理开发一段时间内的用户信息日志(例如航班或酒店偏好),为未来的决策提供信息。
AWS Interconnect:与 Google Cloud 合作的多云
在一项重要的多云开发中,AWS 推出了 AWS Interconnect – 多云 与 Google Cloud 合作,利用 Google 的跨云互连。这项新的网络服务旨在允许客户在两个竞争对手的云平台之间建立高度自动化的私有高带宽连接。
该解决方案使客户能够按需提供专用带宽并在 分钟,而不是几周。该伙伴关系基于共同开发的 开放规范 用于网络互操作性,并通过利用四冗余和 MACsec 加密来增强安全性,从而实现高弹性。
亚马逊开始测试“超快速”30分钟送货
亚马逊 宣布 在特定地区推出新的“超快速”交付选项 西雅图 和 费城,承诺交付 30分钟或更短 涵盖杂货、化妆品、电子产品和必需品等一系列商品。
这项新服务称为 亚马逊现在,已集成到亚马逊主要应用程序和网站中。
-
高级会员 可以使用此选项,运费从 3.99 美元 每个订单。
-
非Prime会员 支付 13.99 美元。
-
一个 1.99 美元 小篮费用适用于以下订单 15 美元。
为了实现这一速度,亚马逊正在利用战略上靠近客户生活和工作地点的小型专业配送设施,从而缩短配送合作伙伴的出行距离。该国内试点项目是继 10 月份在阿拉伯联合酋长国推出类似举措之后推出的,该公司在阿联酋提供 15 分钟送货服务。




