昨晚世界级CDN服务商 Cloudflare突然崩了,全球有超20%网站瘫痪了,甚至连 ChatGPT、X 都白屏,但即便这样:国际用户也不会轻易使用国内的云CND服务。

 

从大约北京时间19:48开始出了一个全球性的大故障。500 Internal Server Error,网站直接打不开或加载极慢,部分Zero Trust/WARP用户断网。受影响的知名服务包括:

(1)国外的:X(Twitter)有一段时间刷不了、ChatGPT / OpenAI、Discord、Spotify、拳头游戏(LOL、Valorant)

(2)国内的:知乎(部分图片打不开),少数派、V2EX、煎蛋网直接打不开,一些跨境电商平台,如SHEIN也打不开了。

无数中小网站(只要看到“Error 500 | Cloudflare”基本就是它挂了)

 

 

说白了,现在但凡你有点国际业务、国际网站的,十有八九都还用了Cloudflare,它不光是CDN服务,还有DNS、防火墙、防DDOS等服务。结果是这一宕机,全球有差不多超20%的网站受影响。(小字提示:根据 W3Techs 的统计,Cloudflare 被19.8%的网站使用。)

全球20%网站瘫痪,Cloudflare崩了,可国产云我们还是不敢用(图1)

事件原因分析

一开始网上疯传:“是不是新来的实习生第一天就搞垮了公司?”因为他在X上说,在Cloudflare第一天,推送了一些小更新,下午还休息了一会,然后Cloudflare就崩了。

全球20%网站瘫痪,Cloudflare崩了,可国产云我们还是不敢用(图2)

不过后来Cloudflare说了:“是因为“自动生成的 Bot 管理特征文件(feature file)条目数超出预期,文件变大后被全部推送到网络,导致网络流量传递核心服务崩溃”。”“这是 内部配置/软件逻辑失误,没有证据显示为恶意活动”。

说简单点:就是有人该了个小配置,没测好,结果搞的全服务器都抽风了。果然世界是个大的草台班子,这次搞配置的这哥们的年终奖估计没了。

全球网络的命脉,被美国几家公司握着

这件事暴露了一个大问题:你以为世界是去中心化的,实际上命脉就攥在几家美国公司手里。实际上大部分出海业务绕不开Cloudflare。

有人说:“阿里云、腾讯云、百度云技术不比 Cloudflare 差啊!为什么非要用Cloudflare?”简单说就是Cloudflare就是像全球通,一张卡可以走遍全球。

全球20%网站瘫痪,Cloudflare崩了,可国产云我们还是不敢用(图3)

(1)Cloudflare有310个数据中心,覆盖120+国家,几乎每个国家都有,国内云厂商不是技术不行,是环境限制了。

(2)Cloudflare 免费的太狠了,CDN能免费用、SSL证书能免费用、防攻击也能免费用。过国内大多是收费的。

(3)迁移成本非常高,你要知道普通人配置一个CDN要花一天甚至2-3天时间。你换一条CDN,很麻烦的,DNS切换有TTL 缓存、SSL证书绑定、WAF规则重配等等。

(4)国内的云厂商首要任务是【合规】,而不是加速。什么实名认证、备案、内容审查、日志留存都要有,非常麻烦,而且有种底裤都被人扒拉的感觉。

总之一句话:不是国内厂商不行,而中国云厂商有枷锁,它们在海外无法自由翱翔。

我就吃过好几次亏:以前我的博客使用阿里云OSS,结果因为图片“SH”,直接把全站的图片资源都屏蔽了,所有图片、JS全挂。还有一次我因为配资CDN错误,把整个松松软文后台给整崩了,当时有2个客户直接说,你们的产品太不靠谱了,三天两头的挂。

写在最后:

这次 Cloudflare 整体宕机,我能感觉出来,互联网比我们想象中的还要脆弱,一个代码、写错一个字母,都可能导致省个互联网瘫痪。

源自:卢松松