
1 OP 补充: 1.只要连接数上来就会出现,所以问题和长连接数量相关 2.心跳是 60 秒一次,回应 pong 即可,处理效率不存在瓶颈 |
2 jybox Nov 25, 2019 监控采集的粒度不够?有可能只是极短时间的 CPU 繁忙导致的 load 升高。 |
3 asilin Nov 25, 2019 我猜测是短时间内大量进程 /线程的创建导致的,推荐使用 ganglia 或者 prometheus 监控来看下; |
6 Sasasu Nov 25, 2019 gc 扫描 |
8 dazhangpan Nov 25, 2019 同意#3 楼,不要光看代码,还是得用工具看一下是否有 short-lived 进程,可以参考这篇文章: https://decodezp.github.io/2019/09/19/test20-troubleshoot-short-lived-process/ |
9 z5864703 OP @dazhangpan 看了下,不符合条件。服务器在负载飙升的时候是没有 cpu 占用开销 |
10 capljf Nov 26, 2019 如果确定是业务代码造成的 load 飙升并且是运行 jvm 的话,可以在 load 升起来的时候 dump 一下内存看看 |