Linux命令 kill -9 的原理

发表于 2021-03-28 更新于 2025-06-25 分类于 Linux

背景

相信很多程序员对于 Linux 系统都不陌生，即使自己的日常开发机器不是 Linux，那么线上服务器也大部分都是的，所以，掌握常用的 Linux 命令也是程序员必备的技能。

但是，怕就怕很多人对于部分命令只是一知半解，使用不当就能导致线上故障。

前段时间，我们的线上应用报警，频繁 FGC，需要紧急处理问题，于是有同事去线上重启机器（正常程序应该是先采集堆 dump，然后再重启，方便排查是否存在内存泄露等问题）。

但是在重启过程中，同事发现正常的重启命令应用无反应，然后尝试使用 kill 命令 “杀” 掉 Java 进程，但是仍然无效。于是他私自决定使用 “kill -9“ 结束了进程的生命。

虽然应用进程被干掉了，但是随之而来带来了很多问题，首先是上游系统突然发生大量报警，对应开发找过来说调用我们的 RPC 服务无响应，频繁超时。

后来，我们又发现系统中存在部分脏数据，有些在同一个事务中需要完整更新的数据，只更新了一半…

为什么正常的 kill 无法 “杀掉” 进程，而 kill -9 就可以？为什么 kill -9 会引发这一连串连锁反应？正常的 kill 执行时，JVM 会如何处理的呢？

要搞清楚这些问题，我们要先从 kill 命令说起。

kill 命令

我们都知道，想要在 Linux 中终止一个进程有两种方式，如果是前台进程可以使用 Ctrl+C 键进行终止；如果是后台进程，那么需要使用 kill 命令来终止。（其实 Ctrl+C 也是 kill 命令）

kill 命令的格式是：

kill [参数] [进程号]
如：
kill 90124
kill -9  90124

其中 [参数] 是可选的，进程号可以通过 jps/ps/pidof/pstree/top 等工具获取。

kill 的命令参数有以下几种：

-l 信号，若果不加信号的编号参数，则使用“-l”参数会列出全部的信号名称

-a 当处理当前进程时，不限制命令名和进程号的对应关系

-p 指定kill 命令只打印相关进程的进程号，而不发送任何信号

-s 指定发送信号

-u 指定用户

通常情况下，我们使用的 - l(信号) 的时候比较多，如我们前文提到的 kill -9 中的 9 就是信号。

信号如果没有指定的话，默认会发出终止信号 (15)。常用的信号如下：

HUP 1 终端断线

INT 2 中断（同 Ctrl + C）

QUIT 3 退出（同 Ctrl + \）

TERM 15 终止

KILL 9 强制终止

CONT 18 继续（与STOP相反， fg/bg命令）

STOP 19 暂停（同 Ctrl + Z）

比较常用的就是强制终止信号：9 和终止信号：15，另外，中断信号：2 其实就是我们前文提到的 Ctrl + C 结束前台进程。

那么，kill -9 和 kill -15 到底有什么区别呢？该如何选择呢？

kill -9 和 kill -15 的区别

kill 命令默认的信号就是 15，首先来说一下这个默认的 kill -15 信号。

当使用 kill -15 时，系统会发送一个 SIGTERM 的信号给对应的程序。当程序接收到该信号后，具体要如何处理是自己可以决定的。

这时候，应用程序可以选择：

1、立即停止程序
2、释放响应资源后停止程序
3、忽略该信号，继续执行程序

因为 kill -15 信号只是通知对应的进程要进行 “安全、干净的退出”，程序接到信号之后，退出前一般会进行一些 “准备工作”，如资源释放、临时文件清理等等，如果准备工作做完了，再进行程序的终止。

但是，如果在 “准备工作” 进行过程中，遇到阻塞或者其他问题导致无法成功，那么应用程序可以选择忽略该终止信号。

这也就是为什么我们有的时候使用 kill 命令是没办法 “杀死” 应用的原因，因为默认的 kill 信号是 SIGTERM（15），而 SIGTERM（15）的信号是可以被阻塞和忽略的。

和 kill -15 相比，kill -9 就相对强硬一点，系统会发出 SIGKILL 信号，他要求接收到该信号的程序应该立即结束运行，不能被阻塞或者忽略。

所以，相比于 kill -15 命令，kill -9 在执行时，应用程序是没有时间进行 “准备工作” 的，所以这通常会带来一些副作用，数据丢失或者终端无法恢复到正常状态等。

Java 是如何处理 SIGTERM（15）

我们都知道，在 Linux 中，Java 应用是作为一个独立进程运行的，Java 程序的终止运行是基于 JVM 的关闭实现的，JVM 关闭方式分为 3 种：

正常关闭：当最后一个非守护线程结束或者调用了 System.exit 或者通过其他特定平台的方法关闭（接收到 SIGINT（2）、SIGTERM（15）信号等）
强制关闭：通过调用 Runtime.halt 方法或者是在操作系统中强制 kill（接收到 SIGKILL（9）信号)
异常关闭：运行中遇到 RuntimeException 异常等

JVM 进程在接收到 kill -15 信号通知的时候，是可以做一些清理动作的，比如删除临时文件等。

当然，开发者也是可以自定义做一些额外的事情的，比如让 tomcat 容器停止，让 dubbo 服务下线等。

而这种自定义 JVM 清理动作的方式，是通过 JDK 中提供的 shutdown hook 实现的。JDK 提供了 Java.Runtime.addShutdownHook(Thread hook) 方法，可以注册一个 JVM 关闭的钩子。

package com.cyblogs.thread;

/**
 * Created with leetcode-cn
 *
 * @description:
 * @author: chenyuan
 * @date: 2021/3/28
 * @time: 20:34
 */
public class ShutdownHookCase {
    public static void main(String[] args) {

        boolean flag = true;

        Runtime.getRuntime().addShutdownHook(new Thread(() -> {
            System.out.println("hook execute...");
        }));

        while (flag) {
            // app is runing
        }
        System.out.println("main thread execute end...");
    }
}

执行命令：

控制台输出内容：

1 2	hook execute... Process finished with exit code 143 (interrupted by signal 15: SIGTERM)

可以看到，当我们使用 kill（默认 kill -15）关闭进程的时候，程序会先执行我注册的 shutdownHook，然后再退出，并且会给出一个提示：interrupted by signal 15: SIGTERM

如果我们执行命令 kill -9：

控制台输出内容：

1	Process finished with exit code 137 (interrupted by signal 9: SIGKILL)

可以看到，当我们使用 kill -9 强制关闭进程的时候，程序并没有执行 shutdownHook，而是直接退出了，并且会给出一个提示：interrupted by signal 9: SIGKILL

总结

kill 命令用于终止 Linux 进程，默认情况下，如果不指定信号，kill 等价于 kill -15。

kill -15 执行时，系统向对应的程序发送 SIGTERM（15）信号，该信号是可以被执行、阻塞和忽略的，所以应用程序接收到信号后，可以做一些准备工作，再进行程序终止。

有的时候，kill -15 无法终止程序，因为他可能被忽略，这时候可以使用 kill -9，系统会发出 SIGKILL（9）信号，该信号不允许忽略和阻塞，所以应用程序会立即终止。

这也会带来很多副作用，如数据丢失等，所以，在非必要时，不要使用 kill -9 命令，尤其是那些 web 应用、提供 RPC 服务、执行定时任务、包含长事务等应用中，因为 kill -9 没给 spring 容器、tomcat 服务器、dubbo 服务、流程引擎、状态机等足够的时间进行收尾。

参考地址

https://blog.csdn.net/windforce828/article/details/106119445