Skip to content

Latest commit

 

History

History
70 lines (65 loc) · 3.29 KB

Linux中找出Java程序占用大量CPU的元凶.md

File metadata and controls

70 lines (65 loc) · 3.29 KB

原理

通过top找到占用CPU高的进程pid,通过ps找到该进程中占用CPU高的线程tid,最后通过jstack找到该线程的堆栈信息,最后根据堆栈信息排查问题。

top找到高占用CPU的java进程pid

命令:top

 PID USER      PR  NI    VIRT    RES    SHR S %CPU %MEM     TIME+ COMMAND                                                                                                                                      
28832 root      20   0 1417908 208592   6884 S  110.0 20.7   4:14.21 java                                                                                                                                         
 2597 root      20   0   10728   1240      0 S  0.3  0.1  84:02.05 containerd-shim                                                                                                                              
21233 100       20   0   16544   2548    636 S  0.3  0.3 103:36.06 nginx                                                                                                                                        
21387 root      20   0  149004   9772   8252 S  0.3  1.0   0:00.14 sshd    

可以看到pid为28832的java程序占用大量cpu

找占用高的线程tid

命令:ps -mp ${pid} -o THREAD,tid,time 第一行是表头,第二行是统计,从第三行开始看

[root@izwz9d0sy7ulokpdr023wlz ~]# ps -mp 28832 -o THREAD,tid,time
USER     %CPU PRI SCNT WCHAN  USER SYSTEM   TID     TIME
root      110.6   -    - -         -      -     - 00:04:17
root      0.0  19    - futex_    -      - 28832 00:00:00
root      0.0  19    - poll_s    -      - 28893 00:00:10
root      18.0  19    - futex_    -      - 28894 00:00:00
root      0.1  19    - futex_    -      - 28895 00:00:25
root      0.0  19    - futex_    -      - 28896 00:00:00
root      0.0  19    - futex_    -      - 28897 00:00:00
root      0.0  19    - futex_    -      - 28898 00:00:00
root      90.0  19    - futex_    -      - 28899 00:00:00 # 此进程cpu占用高达90%
root      0.0  19    - futex_    -      - 28900 00:00:00
root      0.0  19    - futex_    -      - 28901 00:00:00
root      0.0  19    - futex_    -      - 28902 00:00:00

可以看到,tid为28899的线程占用CPU很高,拿它开刀,先将tid转换成八进制 命令:printf "%x\n" ${tid}

printf "%x\n" 28899
70e3

用jstack查看该线程调用堆栈信息

命令:jstack ${pid} | grep ${tid} -A 30

jstack 28832 | grep 70e3 -A 30

最后

上面的命令有点不方便,还要转换八进制什么的,这里提供一条命令,直接查询某进程占用CPU量前10的线程tid的八进制格式(把其中的${PID}换成进程id),然后复制八进制tid直接用jstack查看堆栈信息

ps -mp ${PID} -o THREAD,tid | gawk 'NR!=1 && NR!=2 { printf "%s %x\n",$2,$8 }' | sort -rn | head -10

输出如下,第一列是CPU占用百分比,第二列是线程八进制字符串,也就是tid

1.4 712a
0.1 70df
0.0 714a
0.0 7149
0.0 7148
0.0 7147
0.0 7146
0.0 7145
0.0 7144
0.0 7143
  • jstack ${PID} | grep ${tid} -A 30直接打印该线程

第二种方法

  • top找到占用高的进程,找到pid
  • top -Hp ${pid}直接查看线程,观看占用CPU资源多的线程pid即tid
  • jstack ${pid} | grep ${tid} -A 30直接打印该线程