-
从 HTTP/1.1 短连接 + TLS 1.2 + Nginx 全手工配置 + 应用间裸 HTTP + 内网明文裸奔 + 无网络可观测靠 tcpdump 救火 远古网络层 → 2026 HTTP/3 QUIC + TLS 1.3 0-RTT + Envoy 服务网格 + gRPC + mTLS 零信任 + eBPF 内核级可观测 现代网络体系 74 天战役复盘:47 套调优修法 + 7 个 P0 复盘 + 6 条工程哲学
13 位 SRE 与网络工程师 74 天把一套服役七年的 HTTP/1.1 短连接 + TLS 1.2 + Nginx 全手工配置远古网络层,零中断重构到 2026 年现代网络体系:HTTP/3 QUIC 消除队头阻塞 + TLS 1.3 0-RTT 握手 + Envoy 服务网格统一流量治理 + gRPC 强契约 + mTLS 零信任全链路加密 + eBPF 内核级无侵入可观测,跨服务 P99 …- 0
- 0
-
从 .NET Framework 4.8 + WCF + IIS + Windows Server + 自研日志 + 单进程部署 → .NET 9 + ASP.NET Core 9 + Minimal API + EF Core 9 + gRPC + Aspire + Orleans + YARP + Native AOT + Chiseled Ubuntu + OpenTelemetry 全栈现代化 87 天踩坑录:21 反模式 + 23 修法
27 位 .NET 工程师 87 天把公司 .NET Framework 4.8 + WCF + IIS + Windows Server + 自研日志 + 单进程部署 整体迁移到 2026 年 .NET 9 + ASP.NET Core 9 + Minimal API + EF Core 9 + gRPC + Aspire + Orleans + YARP + Native AOT + Chis…- 4
- 0
-
从 Go 1.21 + Gin + xorm + gRPC + go-zero → Go 1.23 + 1.24 RC + Echo + pgx v5 + sqlc + Connect-RPC + Temporal + Wire + slog + OpenTelemetry 全栈升级 51 天踩坑录:14 反模式 + 16 修法
26 位 Go 工程师 51 天把公司"网关 / 订单 / 支付 / 风控 / 用户中心 / IM"6 条核心微服务,从 Go 1.21 + gin + xorm + gRPC + go-zero + Consul + Jaeger 重构到 Go 1.23 + 1.24 RC + Echo v4.13 + gRPC-go 1.69 + Connect-RPC + sqlc + …- 0
- 0
-
.NET 9 gRPC 风控网关 HTTP/2 MaxConcurrentStreams 默认 100 雪崩 5 天复盘:上游 12 业务方接入 P99 飙 14 秒 + DEADLINE_EXCEEDED 47% + 漏拦欺诈 380 笔——Kestrel.MaxStreamsPerConnection 1000 + EnableMultipleHttp2Connections + KeepAlivePing + Polly 8 Resilience + dotnet-counters 6 套修法 + 13 条 gRPC 工程纪律
2026 年 3 月,我们一个核心风控网关(.NET 9 + Kestrel + gRPC 1.69 + 12 个上游业务方调用 + 7 个下游风控引擎服务、日均 RPC 调用 28 亿次、P99 SLO 80ms)在一次"上游业务方接入数量从 8 个扩展到 12 个"的灰度后第- 2
- 0
-
Go 1.22 gRPC 推送网关 P99 从 45ms 飙到 6.2 秒的 6 天并发雪崩复盘:map 并发读写 + channel 缓冲不足 + 单 Mutex 三重叠加 + 11 条 Go 并发纪律
我们一个 Go 1.22 + gRPC 推送网关,单 Pod 维护 60 万长连接、推送 QPS 280 万,在压测中 P99 从 45ms 飙到 6.2 秒,部分 Pod 被 K8s 重启,直播弹幕延迟 6 秒收 3000 工单。6 天定位发现 map 并发读写触发 throw + channel 缓冲不足 + 单 Mutex 保护 60w-entry 大 map 三重反模式叠加。修复路径分片 …- 2
- 0
-
gRPC HTTP/2 长连接被 AWS NLB 350 秒 idle timeout 悄悄 RST 的 5 天复盘:每天 1842 次 connection reset 噪音清零 + 三端 keepalive 协调纪律落地
推荐服务 order-service 调 inventory-service 每天 1842 次 connection reset 全部集中在低 QPS 时段,5 天复盘根因是 AWS NLB 350 秒 idle timeout + gRPC 默认不发 keepalive + HTTP/2 多路复用三层叠加,最终落地 client/server/LB 三端协调的 keepalive 工程纪律 +…- 2
- 0
-
gRPC 微服务通信完全指南:从一次"ClusterIP LB 让 99% 流量打一个 pod 单机 CPU 95%"看懂为什么 HTTP/2 + protobuf 远远不够
2023 年底我们公司启动微服务全栈改造把单体 Spring Boot 拆成 18 个 gRPC 服务期望解耦和性能提升架构师拍板 gRPC 性能比 REST 快 10 倍 type-safe IDL 优雅我们也信了开搞第一个月顺利上线性能压测确实快 3 倍服务间调用 P99 从 200ms 降到 60ms 大家很高兴但第二个月开始事故连连平均每周 2-3 次 P1 故障凌晨被告警叫醒 4 次然后…- 2
- 0
-
gRPC 微服务通信完全指南:从一次"长连接 hang 死整个支付服务雪崩 5 分钟"看懂为什么写完 proto 远远不够
2022 年我加入一家金融科技公司接手一个 30 个微服务的支付系统服务间用 HTTP REST 加 JSON 通信平时延迟 50ms 一切都还能跑后来业务量从日 100 万订单涨到日 1000 万我们做服务拆分调用链从 3 层涨到 8 层性能问题陆续暴露我决定把核心链路改成 gRPC 觉得 protobuf 加 HTTP2 性能秒杀 REST 切换很顺利灰度第一周性能从 P99 800ms 降到…- 0
- 0
-
gRPC 微服务超时与重试工程化完全指南:从一次"下游慢 800ms 上游 5 个服务全部雪崩"看懂为什么加 timeout 远远不够
2023 年我们公司有一套基于 gRPC 的微服务架构十几个服务互相调用拓扑大概有三四层深接手时表面看挺平静 QPS 不算高响应时间也还行可三个月里我们陆陆续续出了几次让我刻骨铭心的故障第一次是周五晚上一个下游的搜索服务因为索引重建延迟变高从 50ms 涨到 800ms 结果上游所有依赖它的服务的线程池被打满整个调用链上的 5 个服务全部超时雪崩业务被打挂 30 分钟第二次最莫名其妙某个接口压测时…- 2
- 0
-
gRPC 完全指南:从一次"加个字段老服务就错乱、一个慢服务拖垮整条链"看懂 RPC 框架
2023 年我把团队内部几个服务之间的调用从 REST JSON 改成了 gRPC。第一版我做得很省事写了个 proto 文件生成客户端和服务端代码服务之间直接互相调用。本地一测真香比 JSON 快还带类型检查改个字段编译器立刻报错。我心里很踏实gRPC 嘛不就是一个更快带类型的 HTTP 接口。可等它真正上线跑在真实的多服务环境里一串问题冒了出来。第一种我给 proto 加了一个字段重新发布结果…- 0
- 0
-
gRPC 长连接抖动复盘:Keepalive + 负载均衡 + 流控全链路治理
Go 微服务 100+ 服务全 gRPC,新版本上线后接口偶发慢、连接抖动、P99 飙到 500ms。三周治理:Keepalive 心跳 + round_robin 负载均衡 + MaxConnectionAge 连接轮换 + retryPolicy + 拦截器统一治理 + 流控分级。P99 30ms,连接重建归零。- 5
- 0
-
微服务 P99 8s 雪崩复盘:全链路超时预算 + 传递 + 重试治理
电商主链路 P99 8s 雪崩复盘:每个服务 3s 超时 + 2 次重试,5 跳叠加成 30s 黑洞。两周治理:gRPC context.WithTimeout 传递 + Spring X-Deadline header + 剩余预算分配 + 重试不突破总 deadline + 熔断降级配合。P99 8s→800ms,DeadlineExceeded < 0.1%。- 0
- 0
-
gRPC 内部 RPC 切换实录:P99 80ms→18ms 带宽 -71%
内部 RPC 从 REST+JSON 切到 gRPC 全实录:IDL 设计 + protobuf 字段规范 + Go 服务端 keepalive + Java 客户端连接池 + 错误码 status + 拦截器(recovery/tracing/metrics) + K8s Headless Service 客户端负载均衡 + 流式 RPC。P99 从 80ms 降到 18ms,带宽节约 71%。- 0
- 0
-
gRPC 全链路 deadline 传播实战:从下游被卡死到 5 分钟定位
A→B→C→D 链路客户端早超时退出,D 还在傻乎乎跑 30 秒,DB 连接池打满。本文讲透 gRPC deadline 自动传播机制 + Context 取消 + Java/Go 实现 + 客户端服务端拦截器 + 重试配合 + DB 层传 timeout。附完整代码 + 监控告警 + 团队规范。- 0
- 0
-
API 设计完全指南:REST、GraphQL 与 gRPC 的选型实战
"我们用 REST 还是 GraphQL 还是 gRPC?"—— 这是 API 设计阶段最常见的问题。三者并非互斥,各有适用场景。这篇文章把三种 API 风格的设计哲学、典型用法、性能特点、适配场景一次讲透,帮你做出有依据的选择。 REST:互联网的事实标准 REST(Representational State Transfer)是 Roy Fielding 2000 年博士…- 0
- 0
gRPC
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!















