-
一行 fstab 写错整台服务器开不了机:一次 Linux 开机挂载排查复盘
给服务器加数据盘往 /etc/fstab 写了一行,几周后一次例行重启机器再没起来,控制台停在 emergency mode 急救模式。排查梳理:fstab 不是可挂可不挂的清单,开机时 systemd 把每一行都变成必须完成的挂载任务,任意一行失败都会拖垮 local-fs.target 让系统进急救模式;第 1 列用 /dev/vdX 设备名很危险设备名会漂要用 UUID,systemd 找不…- 0
- 0
-
改完配置重启服务却没生效:一次 systemd daemon-reload 排查复盘
改了 systemd 的 unit 文件、systemctl restart 重启成功,ps 看进程却还是旧参数。排查梳理:systemd 启动时把所有 unit 文件读进内存建缓存,之后 start/stop/restart 用的都是这份缓存,根本不重读磁盘;改了 .service 文件必须先 systemctl daemon-reload 让 systemd 重读磁盘刷新缓存,而 daemon…- 0
- 0
-
服务跑着跑着报 Too many open files:一次 Linux 文件描述符限制排查复盘
一个网关服务流量爬升后开始大面积报 Too many open files,查遍代码的文件 close 却找不到泄漏。排查梳理:Linux 一切皆文件、socket 和管道都占文件描述符、压垮服务的是几千个网络连接而非磁盘文件;ulimit 软硬限制、/proc/PID/limits 看进程实际上限;systemd 服务不读 limits.conf 必须在 unit 配 LimitNOFILE;看…- 2
- 0
-
手动能跑交给 systemd 就启动失败:一次 unit 文件与 journalctl 排查复盘
一个手动跑得好好的前台常驻程序,写了 service 文件交给 systemd 管,systemctl start 卡 90 秒后报 failed、Result: timeout。排查梳理:systemd 是服务的全生命周期监护人、Type 字段是判断启动成功的约定、前台常驻程序错配 Type=forking 让 systemd 傻等超时、status 头部 Result/code 怎么读、jou…- 0
- 0
-
ulimit 改了还是 Too many open files:一次 Linux 文件描述符限制排查复盘
ulimit -n 改成 65535 重启服务,依然 Too many open files。排查梳理:文件描述符是有限资源、ulimit 的 soft/hard 与作用域、systemd 服务不读 limits.conf 只认 LimitNOFILE、用 lsof 与 /proc 数 fd 找泄漏、内核全局 fs.file-max,以及一套 fd 排查纪律。- 0
- 0
-
服务重启后没自己起来:一次 Linux systemd 排查复盘
断电演练后服务没自动起来,另一台机器服务反复重启。排查梳理:start 与 enable 是两回事、读懂 systemctl status 每一行、写对一个 .service unit 文件、Restart 策略与重启风暴、After/Wants/Requires 的依赖区别,以及 systemd 管理纪律。- 0
- 0
systemd
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
¥优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!






