-
从 Nginx 1.18 + HAProxy 2.0 + OpenResty + iptables → Nginx 1.27 + HAProxy 3.0 + Envoy 1.32 + Istio 1.24 Ambient + Cilium 1.16 + eBPF + HTTP/3 全栈升级 67 天踩坑录:17 反模式 + 19 修法
27 位 SRE + 网络工程师 67 天把公司"南北向网关 + 东西向 mesh + DNS + CDN + 全球加速 + 边缘节点"6 大网络底座,从 Nginx 1.18 + HAProxy 2.0 + OpenResty + ELB + iptables + BIND 重构到 Nginx 1.27 + HAProxy 3.0 + OpenResty 1.27 + Env…- 43
- 0
-
K8s 集群从 1.27 跳到 1.30 的 7 天蓝绿迁移复盘:跨 3 个 minor 版本 + 5 个兼容性坑 + 零停机切换
生产 K8s 集群在 1.27.10 拖了 18 个月被云厂商邮件逼着升级,目标 1.30 跨 3 个 minor 版本。选蓝绿不选原地,7 天双集群迁移完成,踩了 deprecated API、Helm chart 默认值、CNI 部署顺序、cert-manager CRD 兼容、Ingress 流量切换 5 个坑,沉淀出蓝绿升级 SOP + 10 条 K8s 升级纪律,业务全程零停机。- 4
- 0
-
监控集群 8TB 失控治理:VictoriaMetrics + 降采样 + 告警去噪实录
Prometheus 集群 3 个月 200GB 涨到 8TB,1200w series 查询 OOM,日维度看板 30s+。一个月迁移 VictoriaMetrics 集群 + 分层降采样 + 高基数治理 + recording rule 预计算 + 告警去噪。P99 30s→800ms,存储 -70%,告警 200→30/天。- 2
- 0
-
eBPF 性能诊断实战:Go 服务 sys 60% 的隐藏 fsync 案
Go 服务 CPU 80%、sys 60%,pprof 看不出问题。本文实录 eBPF 排障全过程:火焰图 + syscount + biotop + filetop + funclatency 五步走,定位日志库 fsync 1w/s 的隐藏元凶,附 10 个 SRE 必备 BCC/bpftrace 工具 + Parca/Pixie 落地。- 0
- 0
-
Prometheus 高基数治理实战:1850 万 series 砍到 180 万
Prometheus 内存吃 64GB,head series 1850 万,查询 30 秒,Alertmanager 评估失败。本文实录高基数定位 + 7 个常见陷阱 + 应用层 path 模板化 + relabeling + native histogram + sample_limit 门禁 + VictoriaMetrics 替代方案,内存降到 8GB。- 0
- 0
SRE
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!





