亚马逊网络服务(AWS)有 介绍 Amazon Route 53 的“加速恢复”是一项重要的架构更新,旨在将全球 DNS 管理与其美国 East-1(弗吉尼亚北部)区域的脆弱性脱钩。该功能于 2025 年 11 月 26 日发布,解决了 2025 年 10 月 20 日大规模事件中暴露的一个严重漏洞 停电,DynamoDB API 内的 DNS 解析失败导致该区域瘫痪并蔓延到整个互联网。
此更新解决的核心问题是 DNS“数据平面”(回答查询)和“控制平面”(进行更改)之间的区别。虽然 Route 53 具有用于回答查询的 100% 可用性服务级别协议 (SLA),但能够 更新 这些记录历来在很大程度上依赖于美国 East-1 控制飞机。在 10 月份的事件中,当该地区的 DynamoDB 端点发生故障(通俗地称为“DynamoDNS”问题)时,客户发现自己无法将流量重新路由到发生故障的基础设施,因为进行这些更改的 API 本身已关闭。
加速恢复通过将公共托管区域的控制平面复制到美国 West-2(俄勒冈)区域来缓解这一问题。 AWS 现在承诺恢复时间目标 (RTO) 为 60 分钟或更短。如果美国 East-1 发生故障,系统将对 API 进行故障转移,从而使客户能够执行关键的灾难恢复计划,例如将流量重新指向备用数据中心。高级解决方案架构师 Micah Walter 确认,此功能不需要更改现有的自动化脚本或 API;故障转移在后端处理。
至关重要的是,此功能可以立即使用,无需额外付费,尽管它目前仅限于公共托管区域;尚不支持用于内部网络路由的私有托管区域。此举是对长期批评(包括 Gartner 在 2022 年发出的警告)的直接回应,即北弗吉尼亚关键控制平面的集中化代表了全球云生态系统的单点故障。





