-
偶发 connection reset:连接池复用死连接避坑
有个服务调用下游接口平时好好的,可总会偶发地毫无规律报一个错:Connection reset by peer——连接被对端重置了,频率不高几百次请求一两次、重试又能成功,起初没太当回事,可流量增长后积累的失败量越来越扎眼。这个错最磨人的就是随机性:同样的代码同样的接口绝大多数都好好的偏偏隔一阵冒一个失败。抓了好久包对了好久日志才慢慢拼出真相,藏在一个我从没留意的细节里:这些失败几乎都发生在一段时…- 7
- 0
-
从古老网络通信体系 HTTP/1.1 短连接每次重建 TCP + 明文 HTTP 无 TLS 数据裸奔 + 阻塞 BIO 一连接一线程扛不住高并发 + 连接用完即弃不复用 + 手撸 TCP 粘包拆包经常错 + 调用无超时请求挂死拖垮线程 + 无重试无熔断无限流一处故障全线崩 + 轮询拉取实时数据延迟高 + 硬编码 IP 无服务发现单点故障 → 2026 现代网络体系 HTTP/2 多路复用与 HTTP/3 QUIC + 全站 HTTPS 与 TLS 1.3 + NIO 多路复用 epoll/Netty + 连接池与 keep-alive 复用 + gRPC/Protobuf 成熟协议自动处理粘包 + 全链路超时与重试熔断限流 Resilience4j + WebSocket/SSE 实时推送 + 负载均衡与服务发现 + 全链路追踪可观测 87 天战役复盘:47 套工程修法 + 7 个 P0 复盘 + 6 条工程哲学
15 位网络与基础架构工程师 87 天把一套跑了七年的粗放网络通信体系——HTTP/1.1 短连接每个请求都重新三次握手建连接慢得要死、明文 HTTP 传输数据在链路上裸奔可被中间人窃听 token、阻塞式 BIO 一连接一线程一万并发就要一万线程内存爆炸、连接用完即弃留下海量 TIME_WAIT 占满端口、自己手撸 TCP 粘包拆包经常出错、调用不设超时下游一卡死就把上游线程全占满雪崩、无重试无…- 0
- 0
-
WebSocket 被 AWS ALB idle_timeout 静默 RST 断线率飙到 14% 的 5 天复盘:应用层心跳 + TCP keepalive 双保险 + 12 条长连接保活纪律
实时协作产品 WebSocket 用户低活跃 10 分钟就断,客户端只看到 1006 不知道是谁干的。5 天定位 ALB idle_timeout 静默 RST,应用层 ping/pong 30 秒心跳上线后断线率从 14% 压到 0.3%,顺手立下 12 条长连接保活纪律 + CloudFront/conntrack/移动 NAT 全链路 idle timer 登记。- 4
- 0
-
Nginx 反向代理完全指南:从一次"灰度发布把会话切串了"看懂 proxy_pass 的尾斜杠为什么这么重要
2023 年我维护一个内部 API 服务用 Nginx 做反向代理前面挂着多个上游应用上线一年多一直很稳直到某次产品要做个大功能上线灰度需要按用户 ID 把 10% 的流量切到新版本服务我心里很笃定 Nginx 配置嘛简单加几个 upstream 加个 split_clients 切流量就行可等真把这套上线一串问题冒了出来第一种最先把我打懵新版本上线后旧版本依然有零星 504 客户端报 upstr…- 6
- 0
-
Nginx 反向代理与负载均衡完全指南:从一次"后端挂了一台、用户每三次请求就撞一次 502"看懂代理层
2022 年我给一个后端服务加了 Nginx 做负载均衡。原本服务只有一台机器扛不住量我加到三台前面挂一个 Nginx 分流。第一版我做得很省事写一个 upstream 把三台后端的地址填进去 location 里 proxy_pass 一指完事。本地一测真香请求轮着打到三台机器负载看着挺均匀。我心里很踏实负载均衡嘛不就是 upstream 里写几个后端地址 Nginx 自动帮我分流。可等它真正上…- 0
- 0
-
一致性哈希完全指南:从一次"缓存集群加了一台机器、命中率瞬间归零"看懂分布式分片
2020 年我做一个分布式缓存。业务的读压力越来越大单台 Redis 扛不住了我决定加机器上 4 台 Redis 把缓存数据分散到这 4 台上。要解决的核心问题只有一个一个 key 进来我怎么决定它该存到该去哪一台机器上读。第一版我做得很直接把 key 算个哈希值对机器数取模算出 0 1 2 3 就去对应那台。本地一测很顺几百万个 key 均匀地散在 4 台机器上每台四分之一读写都飞快缓存命中率稳…- 0
- 0
-
一致性哈希完全指南:从哈希环到 Jump Hash 与 Redis Cluster
"加一台机器,数据怎么重新分配?" —— 这是分布式存储和分布式缓存绕不开的核心问题。普通取模(node = hash(key) % N)在节点变化时会让所有数据重新映射,代价巨大。一致性哈希给出了优雅的答案:节点增减只影响相邻节点的数据。这篇文章把一致性哈希讲透,从原始算法到虚拟节点、到 Jump Hash、再到现代系统(Redis Cluster、DynamoDB、CDN)…- 0
- 0
负载均衡
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!







