java线程卡住排查_基于 Java 线程栈 排查问题

除日志外,还有没有别的方式跟踪线上服务问题呢?或者,跟踪并排除日志里无法发现的问题?

方法当然是有的,就是通过现场快照定位并发现问题。我们所说的现场,主要指这两方面:

Java 线程栈。线程栈是Java线程工作的快照,可以获得当前线程在做什么;

Java 内存堆。堆是JVM的内存快照,可以获取内存分配相关信息。

今天,我们从 Java 线程角度,研究下基于线程栈如果排除问题。

1. Java 线程状态变换

在正式介绍线程栈之前,有必要先了解下 Java 线程的相关状态。

AAffA0nNPuCLAAAAAElFTkSuQmCC

Java 线程就是在这几个状态间完成自己的整个生命周期。

状态

是够消耗 CPU

描述RUNNABLE

不确定

运行中 或者 就绪

WAITING

不消耗

1. object monitor 2. unpark

TIME_WAITING

不消耗

1. object monitor 2. unpark 3. sleep

BLOCKED

不消耗

object monitor

2. Java 线程栈

线程栈是问题的第一现场,从线程栈中可以获得很多日志以外的瞬时信息。

2.1 获取栈

jstack pid

kill -3 pid

强烈建议使用 jstack 命令!一者,方便重定向;二者,最大限度的避免 kill 这种高危命令的使用。

3.2 栈信息

AAffA0nNPuCLAAAAAElFTkSuQmCC

核心信息:

线程名。务必给线程起一个优雅的名字;

Java 线程 id。全局唯一,16进制显示;

Native 线程 id。OS 线程id,16进制,与系统资源对应起来;

状态。线程所处状态,最关心 RUNNABLE 状态,实实在在消耗 CPU;

锁信息。获取锁、等待锁;

调用栈信息。方法调用链,类、方法、代码行号,问题排查关键;

3.3 线程栈视角

从线程中获取信息,有两个视角。

单次线程栈

总线程数量

是否发生死锁

线程所处状态

线程调用栈

多次线程栈

是否一直执行同一段代码

是否一直等待同一个锁

一般会导出多份线程栈,共 10 份,每个 2s 打一份。

3. 问题排查

线程栈不同于日志,是程序运行时的快照,可以定位很多诡异问题。

3.1 死锁

死锁是程序最为严重的问题,导致进程 hold 在那,无法处理正常请求。

AAffA0nNPuCLAAAAAElFTkSuQmCC

死锁发生存在几个条件:

存在互斥条件;

保持并请求资源;

不能剥夺资源;

出现环路等待

3.1.1 Object 死锁

主要指使用 synchronized 关键字,通过对象锁保护资源,导致的死锁。

测试代码如下:

private final Object objectA = new Object();

private final Object objectB = new Object();

private String objectMethod1(){

synchronized (this.objectA){

sleepForMs(10);

synchronized (this.objectB){

return getCurrentTime();

}

}

}

private String objectMethod2(){

synchronized (this.objectB){

sleepForMs(10);

synchronized (this.objectA){

return getCurrentTime();

}

}

}

private ExecutorService deadlockExecutor = Executors.newFixedThreadPool(20, new BasicThreadFactory

.Builder()

.namingPattern("DeadLock-Thread-%d")

.build()

);

@RequestMapping("object")

public DeferredResult object(){

DeferredResult result = new DeferredResult<>(10 * 1000L, "TimeOut");

CompletableFuture r1 = CompletableFuture.supplyAsync(this::objectMethod1, this.deadlockExecutor);

CompletableFuture r2 = CompletableFuture.supplyAsync(this::objectMethod2, this.deadlockExecutor);

CompletableFuture.allOf(r1, r2).thenRun( ()-> result.setResult("SUCCESS"));

return result;

}

请求 /deadlock/object 返回超时,打印 Java 栈信息,发生死锁:

AAffA0nNPuCLAAAAAElFTkSuQmCC

从栈信息中,我们可以获得以下信息:

发生死锁现象

发生死锁的相关线程

线程获取哪个锁,又再等待什么锁

3.1.2 Lock 死锁

主要指使用 Lock 对象进行资源保护,从而导致的死锁。

测试代码如下:

private final Lock lockA = new ReentrantLock();

private final Lock lockB = new ReentrantLock();

private String lockMethod1(){

try {

this.lockA.lock();

sleepForMs(10);

try {

this.lockB.lock();

return getCurrentTime();

}finally {

this.lockB.unlock();;

}

}finally {

this.lockA.unlock();

}

}

private String lockMethod2(){

try {

this.lockB.lock();

sleepForMs(10);

try {

this.lockA.lock();

return getCurrentTime();

}finally {

this.lockA.unlock();;

}

}finally {

this.lockB.unlock();

}

}

@RequestMapping("lock")

public DeferredResult lock(){

DeferredResult result = new DeferredResult<>(10 * 1000L, "TimeOut");

CompletableFuture r1 = CompletableFuture.supplyAsync(this::lockMethod1, this.deadlockExecutor);

CompletableFuture r2 = CompletableFuture.supplyAsync(this::lockMethod2, this.deadlockExecutor);

CompletableFuture.allOf(r1, r2).thenRun( ()-> result.setResult("SUCCESS"));

return result;

}

请求 /deadlock/lock 返回超时,打印 Java 栈信息,发生死锁:

AAffA0nNPuCLAAAAAElFTkSuQmCC

和上个栈信息非常相似,发生了死锁现象。但,丢失了很重要的一个信息“线程获得哪个锁,又在申请哪个锁”,这可能就是 JVM 内置锁和 AQS 家族的区别。

3.2 线程数过高

线程数过高,主要由于线程池的不合理使用,比如没有设置最大线程数。

测试代码:

@RestController

@RequestMapping("many-thread")

public class ManyThreadController {

private ExecutorService executorService = Executors.newCachedThreadPool(new BasicThreadFactory

.Builder()

.namingPattern("Many-Thread-%d")

.build()

);

@RequestMapping("/{tasks}")

public DeferredResult manyThreads(@PathVariable int tasks){

DeferredResult result = new DeferredResult<>(10 * 1000L, "TimeOut");

CompletableFuture[] futures = new CompletableFuture[tasks];

for (int i=0;i

futures[i] = CompletableFuture.supplyAsync(this::getValue, executorService);

}

CompletableFuture.allOf(futures).thenRun( ()-> result.setResult("SUCCESS"));

return result;

}

private String getValue() {

sleepForMs(50);

return getCurrentTime();

}

}

请求 /many-thread/2000 ,查看栈信息:

AAffA0nNPuCLAAAAAElFTkSuQmCC

存在 1729 个相似线程,如果在次加大 loop ,还可能会出现异常信息,有兴趣可以自行测试。

3.3 CPU 过高

一般是大集合处理或死循环导致。

测试代码如下:

@RestController

@RequestMapping("high-cpu")

public class HighCPUController {

private ExecutorService executorService = Executors.newFixedThreadPool(1, new BasicThreadFactory

.Builder()

.namingPattern("High-CPU-%d")

.build()

);

@RequestMapping("/{loop}")

public DeferredResult highCpu(@PathVariable long loop){

DeferredResult result = new DeferredResult<>(10 * 1000L, "TimeOut");

CompletableFuture.supplyAsync(()->{

for (int i=0;i

try {

Math.cos(i + 10);

}catch (Exception e){

}

}

return getCurrentTime();

}, executorService).thenAccept(r->result.setResult(r));

return result;

}

}

请求 /high-cpu/100000000000, CPU 会飙升。

3.3.1 多次线程栈对比

多次获取线程栈,特定线程长期停留在一个运行代码。

AAffA0nNPuCLAAAAAElFTkSuQmCC

3.3.2 线程跟踪

先得到高 CPU 线程,在通过 nid 与线程栈线程对应,从而定位问题线程。

top -Hp pid。获取高 CPU 的线程号;

将线程号转换为 16 进制;

在线程栈中通过 nid 查找对应的线程;

3.4 资源不足

各种 pool 最常见问题。

Pool 工作原理:

AAffA0nNPuCLAAAAAElFTkSuQmCC

测试代码如下:

@RestController

@RequestMapping("low-resource")

public class LowResourceController {

private ExecutorService executorService = Executors.newCachedThreadPool(new BasicThreadFactory

.Builder()

.namingPattern("Low-Resource-%d")

.build()

);

@Autowired

private StringRedisTemplate redisTemplate;

@RequestMapping("/{batch}")

public DeferredResult lowReource(@PathVariable int batch){

DeferredResult result = new DeferredResult<>(10 * 1000L, "TimeOut");

CompletableFuture[] futures = new CompletableFuture[batch];

for (int i=0;i

futures[i] = CompletableFuture.supplyAsync(this::getValue, executorService);

}

CompletableFuture.allOf(futures).thenRun( ()-> result.setResult("SUCCESS"));

return result;

}

private String getValue() {

try {

return redisTemplate.execute((RedisCallback)(redisConnection -> {

sleepForMs(5000);

return getCurrentTime() + redisConnection;

}));

}catch (Exception e){

e.printStackTrace();

}

return "ERROR";

}

}

请求 /low-resource/1000 超时后,查看堆栈信息:

AAffA0nNPuCLAAAAAElFTkSuQmCC

可见,存在 998 个线程在等待 Jedis 资源。

3.5 锁级联

线程可以形成自己的依赖链条,增加问题排查的难度。

3.5.1 Future 级联

代码如下:

@RequestMapping("future")

public DeferredResult future(){

DeferredResult result = new DeferredResult<>(10 * 1000L, "TimeOut");

Future future = this.executorService.submit(()->{

sleepForMs(5000);

return getCurrentTime();

});

CompletableFuture[] futures = new CompletableFuture[CONCURRENT_COUNT];

for (int i=0;i

futures[i] = CompletableFuture.supplyAsync(()->{

try {

return future.get();

}catch (Exception e){

}

return "ERROR";

}, executorService);

}

CompletableFuture.allOf(futures).thenRun(()->result.setResult("SUCCESS"));

return result;

}

访问 /wait-chain/future 后,查看线程栈信息:

AAffA0nNPuCLAAAAAElFTkSuQmCC

共有 100 个线程在 future.get 处进行等待。

3.5.2 Guave Cache 级联

Guava Cache 是最常用的 Local Cache,其内部做了并发处理,让多个线程请求同一个 Key,会发生什么事情呢?

测试代码如下:

private final LoadingCache cache;

public WaitChainController(){

cache = CacheBuilder.newBuilder()

.build(new CacheLoader() {

@Override

public String load(String s) throws Exception {

sleepForMs(5000);

return getCurrentTime();

}

});

}

@RequestMapping("guava-cache")

public DeferredResult guavaCache(){

DeferredResult result = new DeferredResult<>(10 * 1000L, "TimeOut");

CompletableFuture[] futures = new CompletableFuture[CONCURRENT_COUNT];

for (int i=0;i

futures[i] = CompletableFuture.supplyAsync(this::loadFromGuava, executorService);

}

CompletableFuture.allOf(futures).thenRun(()->result.setResult("SUCCESS"));

return result;

}

访问 /wait-chain/guava-cache 后,查看线程栈信息:

AAffA0nNPuCLAAAAAElFTkSuQmCC

可见有 98 个线程在 Sync.get 处等待,整个现象和 Future 非常相似。

3.5.3 Logger 级联

日志是最常用的组件,也是最容易忽略的组件,如果多个线程同时访问日志的写操作,会产生什么精致的?

测试代码如下:

@RequestMapping("logger")

public DeferredResult logger(){

DeferredResult result = new DeferredResult<>(10 * 1000L, "TimeOut");

CompletableFuture[] futures = new CompletableFuture[CONCURRENT_COUNT];

for (int i=0;i

futures[i] = CompletableFuture.supplyAsync(this::writeLogger, executorService);

}

CompletableFuture.allOf(futures).thenRun(()->result.setResult("SUCCESS"));

return result;

}

private String writeLogger(){

for (int i = 0;i<10000;i++){

LOGGER.info("{}", i);

}

return getCurrentTime();

}

访问 /wait-chain/logger 后,查看线程栈信息.

写堆栈:

AAffA0nNPuCLAAAAAElFTkSuQmCC

从日志中可见,Wait-Chain-Thread-52 线程正在执行文件写操作。

等待栈:

AAffA0nNPuCLAAAAAElFTkSuQmCC

而有 98 个线程处于等待锁的状态。

4. 小结

Java 线程栈是线程运行时快照,可以帮助我们定位很多问题。掌握这一技能会让我们在日常工作中得心应手。

最后附上 项目源码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/563184.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java实验二答案天津商业大学_天津商业大学信息安全实验一

天津商业大学信息安全实验一 1《信息安全技术》实 验 报 告 书实验名称&#xff1a; 实验一Internet应用风险专 业&#xff1a; 电子商务班 级&#xff1a; 1203班姓 名&#xff1a; 代常发学 号&#xff1a; 20124934指导老师&#xff1a; 丁雷信息工程学院2015 年 5 月2目 录…

java前端的日期插件_几个前端时间插件总结

几个前端时间插件总结总结一下几款时间插件&#xff0c;分别是- [ ] jeDate 手册http://www.jemui.com/jedate/- [ ] bootstrap-datetimepicker 下载地址- [ ] My97DatePicker 下载地址- [ ] jQuery UI 插件Datepicker下载地址并没有哪款完全超越另外一款&#xff0c;主要还是看…

t3s java_关于JAVA的this关键字

网上对this的描述很朦胧&#xff0c;有的说this表示的是当前对象自己&#xff0c;有的说this是当前对象的引用。可是自己写了如下的测试代码&#xff0c;产生了几个问题&#xff1a;1 public class T3AboutThis {23 public static void main(String[] args) {4 new…

Java插件自动保存浏览器书签_多浏览器书签同步插件EverSync

有时上网时会遇到浏览器不能正常显示的问题。(比如我的火狐浏览器无法正确显示微信公众号管理后台&#xff0c;在chrome上可以正常显示)&#xff0c;所以我的电脑里安装了chrome和firefox两个浏览器。但是时间长了&#xff0c;会出现两个浏览器上书签不同步的问题。原来自己的解…

java连接并操作redis_java 使用 jedis 连接 redis 并进行简单操作

packagetest;importjava.util.HashMap;importjava.util.Iterator;importjava.util.List;importjava.util.Map;importorg.junit.Test;importredis.RedisUtil;importredis.clients.jedis.Jedis;public classRedisTest {private RedisUtil redisUtil newRedisUtil();//字符串操作…

java将异常输出到日志_【ThinkingInJava】25、将异常输出记录到日志

/*** 书本:《Thinking In Java》* 功能:将异常输出记录到日志中。* 文件:LoggingExceptions.java* 时间:2015年4月8日21:11:51* 作者:cutter_point*/package Lesson12_error_handling_with_exceptions;import java.io.PrintWriter;import java.io.StringWriter;import java.uti…

2013年蓝桥杯软件大赛预赛java本科b组答案_2013年蓝桥杯软件大赛预赛C本科B组试题...

第四届“蓝桥杯”全国软件专业人才设计与创业大赛选拔赛结果题目标题: 高斯日记大数学家高斯有个好习惯&#xff1a;无论如何都要记日记。他的日记有个与众不同的地方&#xff0c;他从不注明年月日&#xff0c;而是用一个整数代替&#xff0c;比如&#xff1a;4210后来人们知道…

java script的trim_Javascript中实现trim()函数的两种方法

在JavaScript中我们需要用到trim的地方很多&#xff0c;但是JavaScript又没有独立的trim函数或者方法可以使用&#xff0c;所以我们需要自己写个trim函数来实现我们的目的。方案一&#xff1a;以原型方式调用&#xff0c;即obj.trim()形式&#xff0c;此方式简单且使用方面广泛…

hive mysql集群安装_HIVE完全分布式集群安装过程(元数据库: MySQL)

[rootnode01 mysql]# mysql -u hive -pEnter password:mysql> create database hive;Query OK, 1 row affected (0.00 sec)mysql> use hive;Database changedmysql> show tables;Empty set (0.00 sec)3)解压缩hive安装包tar -xzvf hive-0.9.0.tar.gz[hadoopnode01 ~]$…

php海外研发,国外主流PHP框架比较

【IT168技术分析评论】最近简单的使用了目前在国内用的比较多的几个主流国外PHP框架(不包括国内框架)&#xff0c;大致对这些框架有个直观上的感受&#xff0c;简单分享一下&#xff0c;对于哪些做框架选型的时候&#xff0c;权当一个参考。主要参考的框架包括&#xff1a;Code…

php 正则提取日期,PHP正则匹配日期和时间(时间戳转换)的实例代码

先来一个比较简单实用的代码日期YYYY-MM-DD$str "";$isMatched preg_match("/^d{4}(-|/|.)d{1,2}1d{1,2}$/", $str, $matches);var_dump($isMatched, $matches);php需要一定的时间格式才能转换成时间戳(表示从格林威治时间1970年01月01日00时00分00秒起至…

php7生命周期,PHP 的生命周期与模块的sapi 原理

PS &#xff1a; SAPI&#xff1a;php所提供与其他程序的接口。先说说sapi 这是应用层与核心层的桥梁&#xff0c;用翻译的方式来做个比较恰当的比喻吧。这是一个中国人 名字叫Code这是叫做php-cli的英语翻译&#xff0c;擅长体育翻译这是个叫做php-cgi的翻译&#xff0c;擅长画…

php分解质因数,用PHP如何实现将一个整数分解为质因数的积?

先对数字进行因式分解算法再过滤结果集中&#xff0c;不符合的结果集。class Helper{public function chechPrime($num){for ($i floor(sqrt($num)); $i > 1; --$i) {if ($num % $i 0) {return false;}}return true;}public function getFactorNumber(array &$result,…

php oracle 中文字段,怎么解决php oracle乱码问题

php oracle乱码是由于没有正确的配置字符集信息导致的&#xff0c;其解决办法就是通过PLSQL运行“select * from V$NLS_PARAMETERS;”获取oracle的字符集&#xff0c;并重新设置正确的字符集即可。PHP Oracle 中文乱码问题通常缺省配置连接Oracle在处理中文时都会遇到乱码问题&…

php中数组生成下拉选项,php数组生成html下拉列表的方法

这篇文章主要介绍了php数组生成html下拉列表的方法,涉及php根据数组动态创建html代码的相关技巧,具有一定参考借鉴价值,需要的朋友可以参考下本文实例讲述了php数组生成html下拉列表的方法。分享给大家供大家参考。具体如下&#xff1a;这段代码可根据定义好的php数组动态生成一…

用matlab数学综合实验,MATLAB与数学实验(第2版)

MATLAB与数学实验(第2版)作者&#xff1a;艾冬梅 李艳晴 张丽静 刘琳出版日期&#xff1a;2014年06月文件大小&#xff1a;46.48M支持设备&#xff1a;&#xffe5;18.00在线试读适用客户端&#xff1a;言商书局iPad/iPhone客户端&#xff1a;下载 Android客户端&#xff1a…

mysql主从复制超简单,mysql简单主从复制

在master配置文件中追加log-binmysql-binserver-id1log-bin-indexmaster-bin.index[mysqld]group_replication.so### 重启mysql服务sudo /etc/init.d/mysql restart### 在slave配置文件中追加server-id2relay-log-indexslave-relay-bin.indexrelay-logslave-relay-bin[mysqld]#…

php 输出中文的引号,如何将php英文引号转换为中文引号

如何将php英文引号转换为中文引号发布时间&#xff1a;2020-07-30 10:17:27来源&#xff1a;亿速云阅读&#xff1a;57作者&#xff1a;Leah这期内容当中小编将会给大家带来有关如何将php英文引号转换为中文引号&#xff0c;文章内容丰富且以专业的角度为大家分析和叙述&#x…

SpringBoot运维(二)-- SpringBoot配置文件的4个级别

目录 1. 4个级别的分类 2. 加载优先顺序 3. 4个级别的应用场景 1. 4个级别的分类 4个级别分别是: 类路径下配置文件(一直使用的是这个,也就是resources目录中的application.yml文件)。 类路径下config目录下配置文件。 程序包所在目录中配置文件

matlab破损皮革定位,matlab-code-of-TDOAFDOa 干扰源定位代码,应该在 的求解过程中有帮助。 276万源代码下载- www.pudn.com...

文件名称: matlab-code-of-TDOAFDOa下载 收藏√ [5 4 3 2 1 ]开发工具: matlab文件大小: 38 KB上传时间: 2014-05-31下载次数: 25提 供 者: qqq详细说明&#xff1a;干扰源定位代码,应该在干扰源定位的求解过程中有帮助。-code for tdoa and fdoa文件列表(点击判断是否您…