当前位置:首页 > 科技资讯 > 正文

亚马逊AWS全球宕机事件:互联网服务大面积瘫痪

亚马逊AWS的一次服务故障,如同一次数字地震,让半个互联网陷入瘫痪。

由于亚马逊AWS服务器宕机,大量互联网服务被迫中断,连ChatGPT也未能幸免。

故障发生在美国东部us-east-1区域,这是AWS全球服务最核心的部分。

根据故障追踪平台Downdetector的数据,当天累计收到超过650万份用户故障报告,反映了影响的广泛性。

亚马逊AWS全球宕机事件:互联网服务大面积瘫痪 AWS故障  云服务中断 互联网依赖 全球影响 第1张

非完全列举

AWS这波事故,导致Reddit等社交平台服务崩溃,用户甚至难以在线吐槽。

更讽刺的是,AWS自己的客户支持系统也瘫痪了,用户报错无门。

不过,马斯克的X平台未使用AWS,因此未受影响,为网友提供了讨论此事的空间。

有网友用表情包调侃,马斯克成为这波事件的最大赢家。

亚马逊AWS全球宕机事件:互联网服务大面积瘫痪 AWS故障  云服务中断 互联网依赖 全球影响 第2张

但玩笑归玩笑,受事件影响的人们,可能一点也笑不出来……

亚马逊服务故障波及各行各业

亚马逊的这次宕机波及面究竟有多广?首先从开发者群体看起。

Docker作为关键的应用容器引擎,有开发者发现其全线瘫痪,多个核心服务集体中断。

亚马逊AWS全球宕机事件:互联网服务大面积瘫痪 AWS故障  云服务中断 互联网依赖 全球影响 第3张

除了Docker,另一重要开发工具npm也出现类似问题,还有受欢迎的AI编程工具Cursor、Vercel同样受影响。

除了开发者,其他职场人士也遭殃——视频会议软件Zoom、办公协作平台Slack,全部崩溃。

戏剧性的是,据说今年亚马逊内部会议改用Zoom,导致没有Zoom就无法召开线上会议,但AWS不修复,Zoom就用不了……

亚马逊AWS全球宕机事件:互联网服务大面积瘫痪 AWS故障  云服务中断 互联网依赖 全球影响 第4张

既然工作干不了,那干脆摸鱼呢?

也不行,因为游戏平台Epic、索尼PlayStation,以及Reddit等社交平台和Netflix、Disney+、Max等流媒体视频网站也宕机了。

那我学习总行了吧?抱歉,多邻国也崩了,学生群体无法登录作业平台Canvas

AI工具方面,著名的ChatGPT被认为受到波及,还有AI搜索工具Perplexity也上榜。

亚马逊AWS全球宕机事件:互联网服务大面积瘫痪 AWS故障  云服务中断 互联网依赖 全球影响 第5张

影响从线上蔓延到线下,打车软件、麦当劳、星巴克崩溃,日常叫车、点餐受阻。

航空公司如美联航和达美航空也受影响,无法办理值机和行李托运。

亚马逊AWS全球宕机事件:互联网服务大面积瘫痪 AWS故障  云服务中断 互联网依赖 全球影响 第6张

比上不了飞机更糟的是在飞机上下不去,小红书上网友分享,达美航空班机落地后无法停靠,乘客在跑道等待,机长广播称原因正是亚马逊宕机。

亚马逊AWS全球宕机事件:互联网服务大面积瘫痪 AWS故障  云服务中断 互联网依赖 全球影响 第7张

更惨的是智能门锁用户,网络问题导致无法解锁,但报警功能正常,引来警察上门。

亚马逊AWS全球宕机事件:互联网服务大面积瘫痪 AWS故障  云服务中断 互联网依赖 全球影响 第8张

当然,像Alexa等亚马逊自家的智能家居,也因网络服务中断而罢工。

事件甚至影响到大西洋另一边的英国。

例如英超官方宣布,由于AWS故障,西汉姆联对阵布伦特福德的比赛中半自动越位系统故障,必要时将采用人工画线方式辅助判定。

当然,除此之外,“受害者”名单还很长……

互联网为何如此脆弱

这次问题出在AWS的us-east-1服务器,直接原因是DNS(域名系统)解析故障。

AWS解释称,问题源于EC2内部网络的一个子系统,该系统用于监控和管理网络负载均衡器的健康状态。

该监控系统异常导致网络连接不稳、数据库访问延迟和部分API请求失败。连锁反应下,多项核心云服务出现大范围故障。

us-east-1是AWS最早建立的区域,基础设施历史最久,服务种类最多,大量企业在此部署核心服务。

us-east-1不仅是计算/存储资源的大本营,也是许多全球控制面服务的集中托管区,这意味着其他区域即使本地运行正常,部署、身份验证、权限变更等控制层操作仍依赖us-east-1

亚马逊AWS全球宕机事件:互联网服务大面积瘫痪 AWS故障  云服务中断 互联网依赖 全球影响 第9张

这使us-east-1相比其他AWS服务器更独特,其故障能影响全球。

而且这不是us-east-1第一次崩溃,过去几年(2020、2021、2023年)也发生过类似“大范围瘫痪”事件,每次都会影响大量线上服务。

故障本身难以避免,但波及面揭示了互联网的问题——

像亚马逊这样的大型云服务提升了全球网络安全和稳定性,但成也萧何,这种标准集中化服务意味着任何小故障都可能造成灾难性后果。

为避免这种情况,网站开发者需要建立弹性机制

Hacker News上有网友表示,其静态站点通过CloudFront连接多个区域,未全部押注us-east-1,因此在此次事件中未受影响。

亚马逊AWS全球宕机事件:互联网服务大面积瘫痪 AWS故障  云服务中断 互联网依赖 全球影响 第10张

这种原生多区域、故障转移的部署方式,技术上不复杂,成本也不会显著增加。

网络服务开发者们,是时候重新审视自己的部署策略了。

参考链接:

[1]https://www.theverge.com/news/802486/aws-outage-alexa-fortnite-snapchat-offline#comments

[2]https://www.wired.com/story/what-that-huge-aws-outage-reveals-about-the-internet/

[3]https://www.businessinsider.com/ring-starbucks-alexa-app-down-aws-outage-issues-2025-10

[4]https://www.cnbc.com/2025/10/20/amazon-web-services-outage-hits-airline-websites-other-major-sites.html

[5]https://news.ycombinator.com/item?id=45640838