背景
相信很多程序员对于 Linux
系统都不陌生,即使自己的日常开发机器不是 Linux
,那么线上服务器也大部分都是的,所以,掌握常用的 Linux
命令也是程序员必备的技能。
但是,怕就怕很多人对于部分命令只是一知半解,使用不当就能导致线上故障。
前段时间,我们的线上应用报警,频繁 FGC
,需要紧急处理问题,于是有同事去线上重启机器(正常程序应该是先采集堆 dump
,然后再重启,方便排查是否存在内存泄露等问题)。
但是在重启过程中,同事发现正常的重启命令应用无反应,然后尝试使用 kill
命令 “杀” 掉 Java
进程,但是仍然无效。于是他私自决定使用 “kill -9
“ 结束了进程的生命。
虽然应用进程被干掉了,但是随之而来带来了很多问题,首先是上游系统突然发生大量报警,对应开发找过来说调用我们的 RPC
服务无响应,频繁超时。
后来,我们又发现系统中存在部分脏数据,有些在同一个事务中需要完整更新的数据,只更新了一半…
为什么正常的 kill
无法 “杀掉” 进程,而 kill -9
就可以?为什么 kill -9
会引发这一连串连锁反应?正常的 kill
执行时,JVM 会如何处理的呢?
要搞清楚这些问题,我们要先从 kill
命令说起。
kill 命令
我们都知道,想要在 Linux
中终止一个进程有两种方式,如果是前台进程可以使用 Ctrl+C
键进行终止;如果是后台进程,那么需要使用 kill
命令来终止。(其实 Ctrl+C
也是 kill
命令)
kill
命令的格式是:
1 | kill [参数] [进程号] |
其中 [参数] 是可选的,进程号可以通过 jps/ps/pidof/pstree/top
等工具获取。
kill
的命令参数有以下几种:
1 | -l 信号,若果不加信号的编号参数,则使用“-l”参数会列出全部的信号名称 |
通常情况下,我们使用的 - l
(信号) 的时候比较多,如我们前文提到的 kill -9
中的 9
就是信号。
信号如果没有指定的话,默认会发出终止信号 (15
)。常用的信号如下:
1 | HUP 1 终端断线 |
比较常用的就是强制终止信号:9
和终止信号:15
,另外,中断信号:2
其实就是我们前文提到的 Ctrl + C
结束前台进程。
那么,kill -9
和 kill -15
到底有什么区别呢?该如何选择呢?
kill -9 和 kill -15 的区别
kill
命令默认的信号就是 15
,首先来说一下这个默认的 kill -15
信号。
当使用 kill -15
时,系统会发送一个 SIGTERM
的信号给对应的程序。当程序接收到该信号后,具体要如何处理是自己可以决定的。
这时候,应用程序可以选择:
- 1、立即停止程序
- 2、释放响应资源后停止程序
- 3、忽略该信号,继续执行程序
因为 kill -15
信号只是通知对应的进程要进行 “安全、干净的退出”,程序接到信号之后,退出前一般会进行一些 “准备工作”,如资源释放、临时文件清理等等,如果准备工作做完了,再进行程序的终止。
但是,如果在 “准备工作” 进行过程中,遇到阻塞或者其他问题导致无法成功,那么应用程序可以选择忽略该终止信号。
这也就是为什么我们有的时候使用 kill
命令是没办法 “杀死” 应用的原因,因为默认的 kill
信号是 SIGTERM(15)
,而 SIGTERM(15)
的信号是可以被阻塞和忽略的。
和 kill -15
相比,kill -9
就相对强硬一点,系统会发出 SIGKILL 信号,他要求接收到该信号的程序应该立即结束运行,不能被阻塞或者忽略。
所以,相比于 kill -15
命令,kill -9
在执行时,应用程序是没有时间进行 “准备工作” 的,所以这通常会带来一些副作用,数据丢失或者终端无法恢复到正常状态等。
Java 是如何处理 SIGTERM(15)
我们都知道,在 Linux
中,Java
应用是作为一个独立进程运行的,Java
程序的终止运行是基于 JVM
的关闭实现的,JVM 关闭方式分为 3 种:
- 正常关闭:当最后一个非守护线程结束或者调用了
System.exit
或者通过其他特定平台的方法关闭(接收到SIGINT(2)
、SIGTERM
(15)信号等) - 强制关闭:通过调用
Runtime.halt
方法或者是在操作系统中强制kill
(接收到SIGKILL(9)
信号) - 异常关闭:运行中遇到
RuntimeException
异常等
JVM
进程在接收到 kill -15
信号通知的时候,是可以做一些清理动作的,比如删除临时文件等。
当然,开发者也是可以自定义做一些额外的事情的,比如让 tomcat
容器停止,让 dubbo
服务下线等。
而这种自定义 JVM
清理动作的方式,是通过 JDK
中提供的 shutdown hook
实现的。JDK
提供了 Java.Runtime.addShutdownHook(Thread hook)
方法,可以注册一个 JVM 关闭的钩子。
1 | package com.cyblogs.thread; |
执行命令:
控制台输出内容:
1 | hook execute... |
可以看到,当我们使用 kill
(默认 kill -15
)关闭进程的时候,程序会先执行我注册的 shutdownHook
,然后再退出,并且会给出一个提示:interrupted by signal 15: SIGTERM
如果我们执行命令 kill -9
:
控制台输出内容:
1 | Process finished with exit code 137 (interrupted by signal 9: SIGKILL) |
可以看到,当我们使用 kill -9
强制关闭进程的时候,程序并没有执行 shutdownHook
,而是直接退出了,并且会给出一个提示:interrupted by signal 9: SIGKILL
总结
kill
命令用于终止 Linux
进程,默认情况下,如果不指定信号,kill
等价于 kill -15
。
kill -15
执行时,系统向对应的程序发送 SIGTERM(15)
信号,该信号是可以被执行、阻塞和忽略的,所以应用程序接收到信号后,可以做一些准备工作,再进行程序终止。
有的时候,kill -15
无法终止程序,因为他可能被忽略,这时候可以使用 kill -9
,系统会发出 SIGKILL(9)
信号,该信号不允许忽略和阻塞,所以应用程序会立即终止。
这也会带来很多副作用,如数据丢失等,所以,在非必要时,不要使用 kill -9
命令,尤其是那些 web
应用、提供 RPC
服务、执行定时任务、包含长事务等应用中,因为 kill -9
没给 spring
容器、tomcat
服务器、dubbo
服务、流程引擎、状态机等足够的时间进行收尾。
参考地址
如果大家喜欢我的文章,可以关注个人订阅号。欢迎随时留言、交流。如果想加入微信群的话一起讨论的话,请加管理员微信号:chengcheng222e
,他会拉你们进群。