-
Terraform state 死锁导致 12 团队 CI/CD pipeline 全线卡死 7 小时的 5 天复盘:残留 lock + force-unlock 滥用 + state 并发写竞争三重叠加 + 12 条 IaC 工程纪律
我们 60 人工程团队共用的 Terraform 仓库,因 CI runner 被 K8s 滚动更新 kill 后 DynamoDB 残留 lock,后续 12 个团队 plan/apply 全线卡死 7 小时,4 个 release window 受影响。5 天复盘找到三重根因:Terraform 无自动 lock TTL、SRE 未验证 owner 状态就 force-unlock、单 sta…- 0
- 0
-
Terraform IaC 工程化完全指南:从一次"机房灾备 4 小时拉不起来"看懂为什么写 resource 块远远不够
2023 年我们做一个跨境电商系统跑在 AWS 上主要服务部署在 us-east-1 us-west-2 两个 region 还有一组数据库副本在 eu-central-1 一开始基础设施都是工程师手点 AWS 控制台搞出来的 EC2 RDS VPC ELB 一个个配这种方式一开始还能撑但半年后我们陆续踩了一堆坑第一种最让我傻眼某次 us-east-1 故障我们想紧急在 us-west-2 启一套…- 12
- 0
IaC
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!


