-
Elasticsearch 集群 50TB 治理:索引合并 + 冷热分层 + JVM 调优实录
ES 7.10 集群日增 800GB,3 个月 50TB,8000 索引 6w 分片,heap 90% Full GC,P99 8s,集群频繁 yellow/red。三周治理:索引合并按周 + mapping strict + JVM G1 + ILM 冷热分层 + search_after + slowlog 告警。P99 80ms,存储 18TB,成本 -56%。- 0
- 0
-
Linux Page Cache 实战:日志服务 p99 从 200ms 降到 8ms
日志服务每天 200GB,半年后 IO util 95% p99 200ms。本文讲透 Linux Page Cache / Dirty Page / fsync / O_DIRECT / mmap / io_uring 底层机制 + iostat/iotop/blktrace 诊断 + 批量缓冲 + 内核参数调优 + posix_fadvise,p99 降到 8ms。- 0
- 0
-
线上 TCP CLOSE_WAIT 堆积排查实录:5 个方法定位到应用层 bug
网关 8 小时后 CLOSE_WAIT 几万个、接口大量超时。本文讲透 TCP 状态机 + 5 种诊断方法(ss/lsof/arthas/tcpdump/bpftrace)+ Apache HttpClient / Jedis / Tomcat / Netty 4 个真实泄漏案例 + 内核参数误解辟谣 + 监控告警 + 预防 checklist。- 0
- 0
-
线上服务周期性 Too many open files:fd 泄漏完整排查实录
服务跑 7 天集体崩,日志全是 Too many open files。本文写实记录排查:/proc/fd + lsof + ss + bpftrace + arthas + heapdump 定位到第三方 SDK 没 close,每天泄漏 9000 个 fd。附 Java/Go 4 种泄漏模式 + 系统层防御 + CI 检测规范。- 0
- 0
运维
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!




