
Cloudflare R2对象存储发生1小时全球中断 人为错误将凭证部署到开发环境
声明:该文章来自(蓝点网)版权由原作者所有,K2OS渲染引擎提供网页加速服务。
R2 是 Cloudflare 推出的对象存储服务,主要帮助客户存储静态文件例如图片或者软件安装程序等,昨天夜里 R2 及相关服务发生 1 小时 7 分钟的全球中断。
这次中断导致全球范围内的用户出现 100% 的写入失败 (也就是添加新文件) 和 35% 的读取失败 (因为有 CDN 缓存所以并未出现 100% 失败)。
至于原因 Cloudflare 倒是很快就完成调查:R2 服务在进行凭证轮换时,凭证被错误地部署到生产环境而非开发环境,当旧凭证被删除时 R2 生产环境实际上没有有效的凭证。
但由于 R2 对象存储的工作方式,其发生中断后出现错误时循序渐进的,这导致 Cloudflare 未能及时发现问题,进而导致发生 1 个多小时后才完成修复。
问题发生原因里还有个细节,部署凭证轮换时有个命令行是 –env produciton,该命令行代表部署到生成环境,但这个命令行被忽略进而默认部署到测试环境。
Cloudflare 透露忽略这个命令行标志是工程师的人为错误,所以要求后续部署时使用自动化工具避免再次出现这类人为错误。
此次问题导致 R2 及其相关服务出现如下中断:
R2 对象存储:百分百写入失败和 35% 读取失败
缓存预留:由于读取失败导致源流量大幅度增加
图像和流:所有上传失败,图像传输率下降至 25%,流传输流下降至 94%
其他错误:导致电子邮件安全、矢量化、日志传送、计费、密钥透明度审计全部出现服务下降
目前 Cloudflare 正在改进凭证日志记录和验证,现在要求使用自动化工具来规避人为错误,在 2 月份的时候 Cloudfalre R2 也出现类似错误并且也是人为错误,当时 Cloudflare 工程师在处理钓鱼链接时不慎关闭了整个 R2 服务。
[超站]友情链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
- 1 博物馆的“千面新生” 7904486
- 2 病重男孩与全班拍毕业照次日离世 7809213
- 3 印度卫星发射失败:掌声刚停就下坠 7714281
- 4 6组数据透视中国市场强大吸引力 7619104
- 5 这是一张3000年前商朝王子的请假条 7521970
- 6 女生突发脑出血 症状是不会说英语 7423766
- 7 “谭木匠”940名员工有341人为残疾 7331787
- 8 男子遇夜跑大熊猫一开始以为是猪 7238098
- 9 数次地震不倒 联合国点赞中国黑科技 7140382
- 10 茅台股东大会前夜晚宴 茅台变蓝莓汁 7040009