-
Kafka 消息可靠性工程化完全指南:从一次"机房故障 200 条订单消息丢失"看懂为什么默认配置远远不够
2023 年我们公司有一套订单系统上游产生事件下游有 6 个消费服务用 Kafka 做异步消息总线一开始我接手时配置很标准 3 个 broker 默认 partition 数 ack=1 producer 自动批 consumer auto-commit 看起来该有的都有测试环境跑得也挺顺但上线半年我们陆续踩了一堆坑第一种最让我傻眼某次机房故障一个 broker 挂了我以为副本机制应该自动转结果有…- 0
- 0
-
Redis 缓存穿透/击穿/雪崩三大场景实战指南:从一次"大促零点缓存命中率从 98% 掉到 12%"看懂为什么 Redis 加 TTL 远远不够
2022 年我所在的电商团队做大促活动零点开抢的瞬间整个商品详情页接口的 RT 从平时的 80 毫秒飙升到了 8 秒缓存命中率从平时的 98% 掉到了 12% 我当时正在值班看着监控曲线直接懵了我们的缓存策略其实做得不算简单商品详情用 Redis 缓存了 TTL 半小时按理说大促前已经预热过了为什么命中率会掉这么狠后来复盘才发现这一夜爆出了不止一个问题第一个问题最常见某个爆款商品的缓存恰好在零点过…- 0
- 0
-
Redis 分布式锁完全指南:从一次"同一笔订单被扣三次款"看懂 SET NX EX 为什么不是分布式锁
2023 年我接手一个老项目里面有个用 Redis 做的分布式锁场景是订单去重防止用户连续点击下单按钮造成重复扣款这套锁跑了两年没出过事我以为它就是稳的某天大促当晚一个用户疯狂连点付款页面客服那边几分钟后就传来同一笔订单被扣了三次的截图我打开日志一看三次请求确实都拿到了锁三次都执行了下单我去翻代码这把锁的实现是经典的 SET key value EX 30 NX 加锁成功就执行业务执行完 DEL …- 2
- 0
-
DNS 解析优化完全指南:从一次"接口偶发卡顿几秒钟"看懂为什么 DNS 不能甩给操作系统
2023 年我维护一个后端服务后面要调多个第三方 API 上线之后接口大部分时候都很快可 p99 偶尔会冒出几秒钟的尖刺我盯了一周代码层面没看出任何问题第一版我做得很顺手发请求就用 requests.get HTTP 客户端我心里很笃定 DNS 解析嘛操作系统底层的事我又不用管把域名甩给它它会自己查会自己缓存我应用层只管发请求就行可等我真去抓包定位一串麻烦冒了出来第一种最先把我打懵抓包发现那几次卡…- 8
- 0
后端架构
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!




