IT之家 20小时前
亚马逊AWS云服务故障引发全球混乱
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

10月21日,亚马逊AWS云服务发生重大故障,导致全球互联网服务瘫痪,包括Snapchat、Canva等热门应用无法访问,航班延误,银行服务受阻。此次故障的核心原因是位于弗吉尼亚州US-EAST-1数据中心区域的DynamoDB API出现了DNS解析错误。DNS作为互联网的“地图”,其失效导致无法将用户流量导向托管的服务。尽管AWS是互联网的重要支柱,提供约三分之一的网络运作所需资源,但此次事件暴露了过度依赖单一云服务提供商的风险,以及现代数字服务高度互联和脆弱的基础设施问题。此次故障也非AWS US-EAST-1首次出现大规模中断。

🌐 **DNS解析错误是此次AWS故障的根本原因**:故障核心在于亚马逊位于弗吉尼亚州US-EAST-1数据中心区域的DynamoDB API出现了DNS解析错误。DNS系统负责将域名转换为IP地址,如同互联网的“地图”,其失效导致无法将用户流量正确导向各类在线服务,从而引发大范围的瘫痪。

💥 **全球范围内的服务中断凸显AWS的重要性与脆弱性**:作为全球约三分之一互联网运作的支撑者,AWS的故障直接影响了Snapchat、Canva等热门应用,并波及航班、银行等关键领域。此次事件暴露了现代数字服务对少数大型云服务提供商的高度依赖性,以及这种依赖带来的潜在风险。

💡 **过度依赖单一云服务提供商的风险被再次强调**:专家指出,此次事件恰恰说明了将业务完全寄托于一家服务提供商的危险性。尽管AWS是行业巨头,但其一次故障足以引发全球混乱,凸显了单一供应商的脆弱性,尽管替代方案有限。

🔄 **US-EAST-1数据中心区域频繁出现问题**:这是亚马逊US-EAST-1数据中心区域在过去五年中至少第三次引发大规模互联网瘫痪。尽管亚马逊正在全力修复,但该区域频繁出现的故障原因尚未得到充分解释,引发了对基础设施稳定性的担忧。

北京时间 10 月 21 日,美国当地时间周一,亚马逊 AWS 云服务发生重大故障,引发全球混乱,导致一些热门在线服务无法使用,航班延误,银行瘫痪。这究竟是怎么回事呢?

亚马逊 AWS 云服务

罪魁祸首

亚马逊 AWS 提供了工具和计算资源,使得约三分之一的互联网得以运作。它提供存储空间和数据库管理,使得企业无需维护自己昂贵的基础设施,同时还能将用户流量导向这些平台。

AWS 的服务销售方式可以概括为:“让我们替你管理企业的计算需求。”

但是在周一,一个十分普通的技术环节出了大问题:域名系统 (DNS) 错误,这是一种常见故障。

科技行业人听到这个情况可能会见怪不怪。这种常见错误也能引发巨大混乱。

“永远都是 DNS 的问题!”这是业内常说的一句话。

影响的服务

当有人点击应用或链接时,他们的设备基本上会发送一个请求,要求连接到该服务。DNS 本应发挥地图的作用,而 AWS 在周一却迷失了方向。Snapchat、Canva 和英国税务海关总署等平台仍然在那里,但它看不到它们的位置,无法将流量引导给它们。

故障原因

这些故障的发生原因多种多样。通常是维护问题或服务器故障。有时则是人为失误,比如某处的配置出错,极端情况下也可能是网络攻击,尽管目前尚无证据表明此次事件源于攻击。

亚马逊 AWS 表示,故障发生在该公司位于弗吉尼亚州北部的庞大数据中心区域 US-EAST-1,这是其运营历史最久、规模最大的数据中心集群。

US-EAST-1 是 AWS 最繁忙的数据中心之一,许多全球性的应用程序和网站都托管于此。问题的核心在于“DynamoDB API 的 DNS 解析”,这意味着系统无法正确找到名为 DynamoDB 的关键数据库服务的网络地址。解析失败会导致依赖该数据库的应用程序无法访问数据,从而引发连锁反应,造成服务中断或出现严重错误。这也解释了为何即使底层服务器可能仍在正常运行,用户却无法访问相关服务。

DNS

当 DNS 解析中断时,无论网站或服务的后端基础设施多么强大,用户的浏览器都无法定位到所需内容。这使得 DNS 成为网络架构中一个至关重要但极其敏感的环节。任何对 DNS 的干扰都可能导致大规模网络瘫痪,影响范围从单个网站到整个地区的互联网服务。亚马逊目前正在全力修复这一根本问题,但部分服务在问题解决后仍可能存在“重大错误”,需要时间恢复正常。

这也是过去五年中,亚马逊 US-EAST-1 数据中心区域至少第三次引发大规模互联网瘫痪。亚马逊并未解释为何该数据中心屡次出问题。

依赖一家公司

众多专家一致指出,周一的事件恰如其分地说明了将业务完全依赖单一服务提供商的风险。AWS 作为行业巨头,承载着数百万企业的运营命脉。专家们的观点固然正确,但问题在于,能达到 AWS 同等规模的服务商实在寥寥无几。

专家和学者表示,这一问题凸显了日常数字服务的高度互联性,以及它们对少数全球云服务提供商的依赖。一次小小的故障就可能对商业运营和日常生活造成巨大冲击。

“这次中断再次凸显了我们对相对脆弱的基础设施的依赖。”欧洲网络安全公司 ESET 全球网络安全顾问杰克・摩尔 (Jake Moore) 表示。

在英国,根据宕机追踪公司 Downdetector 英国网站的数据,劳埃德银行、苏格兰银行,以及电信服务提供商沃达丰和英国电信均受到影响,英国税务海关总署的网站也未能幸免。

“这个问题的主要原因在于,所有这些大公司都依赖着同一家服务提供商。”萨里大学计算机科学系研究主任尼桑・萨斯特里 (Nishanth Sastry) 表示。

拥有 Downdetector 的 Ookla 公司表示,此次事件导致超过 400 万用户报告了服务问题。

保险经纪公司 McGill and Partners 的美国网络业务负责人瑞安・格里芬 (Ryan Griffin) 表示:“对大型企业而言,数小时的云服务中断就意味着数百万美元的生产力和收入损失。”

然而,华尔街对此反应平淡,亚马逊股价不降反升,上涨 1.6% 至 216.48 美元。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

亚马逊AWS 云服务故障 DNS错误 互联网瘫痪 US-EAST-1 DyamoDB 技术中断 Amazon AWS Cloud Outage DNS Error Internet Disruption US-EAST-1 DyamoDB Tech Failure
相关文章