-
Redis 大 key 阻塞主线程导致集群级雪崩的复盘:18 分钟反复切换 + 5 种修法 + 9 条治理纪律
一次高价值用户标签 HGETALL 800MB 大 key 把 Redis 主线程阻塞 4.2 秒,Sentinel 误判反复切换 4 次,18 分钟内集群级雪崩。本文复盘完整排查过程、5 种修法(HSCAN/读 slave/分片/Sentinel 调参/SafeRedis 防护)、9 条治理纪律,以及 Redis 6.0 IO 多线程和持久化 fsync 的真相。- 10
- 0
-
Redis Cluster 与 Sentinel 高可用完全指南:从一次"3 哨兵全在同机房光纤挖断脑裂数据对账两天"看懂为什么 redis-cli cluster create 远远不够
2023 年我们公司业务量翻倍单 Redis 实例 32GB 内存撑不住决定上 Redis Cluster 6 主 6 从 18 个 hash slot 我们以为只是配置一下集群就行三个节点跑 redis-cli cluster create 自动分槽结果上生产第一周连续出 5 次 P1 故障第一种最让我傻眼的是有个开发用 MULTI EXEC 事务跨 slot 操作报错 CROSSSLOT Ke…- 5
- 0
-
一波流量把服务冲垮:一次接口限流改造的复盘
对外接口被一波突发流量冲垮,明明"有限流"却没拦住——固定窗口在窗口切换的临界点放进了 2 倍阈值的流量。几天重做限流体系:固定窗口临界缺陷、滑动窗口、漏桶与令牌桶、单机与分布式限流、Sentinel 调用方隔离与熔断降级。- 0
- 0
-
一个第三方接口拖垮整条交易链路:一次服务雪崩与限流熔断治理的复盘
一个第三方优惠券接口从 50ms 变慢到 5s,顺着调用链把整条交易链路全线拖垮。根因是服务对下游故障毫无防护:没限流、没熔断、没降级、没隔离。几天专项治理:令牌桶限流、熔断器三态、fallback 降级、舱壁模式线程池隔离、Sentinel 统一落地、故障演练。- 0
- 0
-
秒杀被黑产刷崩了下单:Sentinel 限流、熔断、热点防护实战
限时秒杀开始三分钟下单服务就挂了,黑产脚本把 QPS 刷到 21 万。一周接入 Sentinel 流量治理:QPS 流控(直接拒绝/Warm Up/排队)、关联与链路限流、慢调用比例熔断降级、热点参数限流精准防刷、系统自适应保护 + 网关流控。后面几场秒杀零宕机。- 5
- 0
-
大促网关 50w QPS 雪崩复盘:多维度限流 + Sentinel 系统保护实战
大促 50w QPS 限流失效雪崩复盘:Redis INCR 单点 CPU 100%。本文讲透 4 种限流算法对比 + 滑动窗口 Lua + 令牌桶 Redis 实现 + Spring Cloud Gateway 多维度叠加(IP/用户/API)+ Sentinel 热点参数 + 慢调用降级,附完整代码 + 压测数据。- 0
- 0
-
限流熔断降级完全指南:Sentinel 与 Resilience4j 的高可用三件套
"流量突然涨 10 倍,系统怎么活下去?" —— 这是每个互联网工程师都会碰到的问题。限流、熔断、降级是高可用三件套,它们不是"可选优化",而是任何对外服务的必备保险。这篇文章把令牌桶、漏桶、滑动窗口讲透,然后讲熔断器模式、降级策略,以及 Sentinel / Resilience4j 等主流框架的工程实践。 问题:没有保护的系统怎么死 真实事故场景: 某接…- 0
- 0
Sentinel
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!







