阿里都在用的线上问题定位工具【收藏备用】

简介
Arthas 是Alibaba开源的Java诊断工具,动态跟踪Java代码;实时监控JVM状态,可以在不中断程序执行的情况下轻松完成JVM相关问题排查工作 。支持JDK 6+,支持Linux/Mac/Windows。

这个工具真的很好用,而且入门超简单,十分推荐。

使用场景

  1. 这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?
  2. 我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?
  3. 遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?
  4. 线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!
  5. 是否有一个全局视角来查看系统的运行状况?
  6. 有什么办法可以监控到JVM的实时运行状态?

接下来,围绕这6个问题,学习下Arthas的基本用法。

安装

执行下面命令下载

wget https://alibaba.github.io/arthas/arthas-boot.jar

用java -jar的方式启动

java -jar arthas-boot.jar[INFO] Found existing java process, please choose one and hit RETURN.
* [1]: 79952 cn.test.MobileApplication[2]: 93872 org.jetbrains.jps.cmdline.Launcher

然后输入数字,选择你想要监听的应用,回车即可

常用命令

当前版本v3.1.4

[arthas@79952]$ version
3.1.4

1、stack

输出当前方法被调用的调用路径

很多时候我们都知道一个方法被执行,但是有很多地方调用了它,你并不知道是谁调用了它,此时你需要的是 stack 命令。

图片

[arthas@79952]$ stack com.baomidou.mybatisplus.extension.service.IService getOne
Press Q or Ctrl+C to abort.
Affect(class-cnt:202 , method-cnt:209) cost in 10761 ms.
ts=2019-11-13 11:49:13;thread_name=http-nio-8801-exec-6;id=2d;is_daemon=true;priority=5;TCCL=org.springframework.boot.web.embedded.tomcat.TomcatEmbeddedWebappClassLoader@a6c54c3@com.baomidou.mybatisplus.extension.service.impl.ServiceImpl.getOne()at com.baomidou.mybatisplus.extension.service.IService.getOne(IService.java:230)...... ......at cn.test.mobile.controller.order.OrderController.getOrderInfo(OrderController.java:500)

可以看到OrderController.java的第500行调用了这个getOne接口。

注意这个命令需要调用后才会触发日志,相似的还有watch、trace等

2、jad

反编译指定已加载类的源码

有时候,版本发布后,代码竟然没有执行,代码是最新的吗,这时可以使用jad反编译相应的class。

jad cn.test.mobile.controller.order.OrderController

仅编译指定的方法

jad cn.test.mobile.controller.order.OrderController getOrderInfoClassLoader:
@RequestMapping(value={"getOrderInfo"}, method={RequestMethod.POST})
public Object getOrderInfo(HttpServletRequest request, @RequestBody Map map) {ResponseVo responseVo = new ResponseVo();... ... ...  ...

3、sc

“Search-Class” 的简写 ,查看JVM已加载的类信息

有的时候,你只记得类的部分关键词,你可以用sc获取完整名称

当你碰到这个错的时候“ClassNotFoundException”或者“ClassDefNotFoundException”,你可以用这个命令验证下

图片

模糊搜索

sc *OrderController*
cn.test.mobile.controller.order.OrderController

打印类的详细信息 sc -d

sc -d cn.test.mobile.controller.order.OrderControllerclass-info        cn.test.mobile.controller.order.OrderControllercode-source       /F:/IDEA-WORKSPACE-TEST-qyb/trunk/BE/mobile/target/classes/name              cn.test.mobile.controller.order.OrderControllerisInterface       falseisAnnotation      falseisEnum            falseisAnonymousClass  falseisArray           falseisLocalClass      falseisMemberClass     falseisPrimitive       falseisSynthetic       falsesimple-name       OrderControllermodifier          publicannotation        org.springframework.web.bind.annotation.RestController,org.springframework.web.bind.annotation.RequestMappinginterfacessuper-class       +-cn.test.mobile.controller.BaseController+-java.lang.Objectclass-loader      +-sun.misc.Launcher$AppClassLoader@18b4aac2+-sun.misc.Launcher$ExtClassLoader@480bdb19classLoaderHash   18b4aac2

与之相应的还有sm( “Search-Method” ),查看已加载类的方法信息

查看String里的方法

sm java.lang.String
java.lang.String <init>([BII)V
java.lang.String <init>([BLjava/nio/charset/Charset;)V
java.lang.String <init>([BLjava/lang/String;)V
java.lang.String <init>([BIILjava/nio/charset/Charset;)V
java.lang.String <init>([BIILjava/lang/String;)V
... ... ... ...

查看String中toString的详细信息

sm -d java.lang.String toString
declaring-class  java.lang.Stringmethod-name      toStringmodifier         publicannotationparametersreturn           java.lang.StringexceptionsclassLoaderHash  null

4、watch

可以监测一个方法的入参和返回值

有些问题线上会出现,本地重现不了,这时这个命令就有用了

图片

观察getOrderInfo的出参和返回值,出参就是方法结束后的入参

watch cn.test.mobile.controller.order.OrderController getOrderInfo "{params,returnObj}" -x 2Press Q or Ctrl+C to abort.
Affect(class-cnt:1 , method-cnt:1) cost in 456 ms.
ts=2019-11-13 15:30:18; [cost=18.48307ms] result=@ArrayList[@Object[][  # 这个就是出参,params@RequestFacade[org.apache.catalina.connector.RequestFacade@1d81dbd7],@LinkedHashMap[isEmpty=false;size=2], # 把遍历深度x改为3就可以查看map里的值了],@ResponseVo[ # 这个就是返回值 returnObjlog=@Logger[Logger[cn.test.db.common.vo.ResponseVo]],success=@Boolean[true],message=@String[Ok],count=@Integer[0],code=@Integer[1000],data=@HashMap[isEmpty=false;size=1],],
]

观察getOrderInfo的入参和返回值

watch cn.test.mobile.controller.order.OrderController getOrderInfo "{params,returnObj}" -x 3 -bPress Q or Ctrl+C to abort.
Affect(class-cnt:1 , method-cnt:1) cost in 93 ms.
ts=2019-11-13 15:37:38; [cost=0.012479ms] result=@ArrayList[@Object[][@RequestFacade[request=@Request[org.apache.catalina.connector.Request@d04e652],sm=@StringManager[org.apache.tomcat.util.res.StringManager@7ae7a97b],],@LinkedHashMap[@String[payNo]:@String[190911173713755288],@String[catalogId]:@String[6],],],null,# -b是方法调用之前观察,所以还没有返回值
]

如果需要捕捉异常的话,使用throwExp,如{params,returnObj,throwExp}

5、trace

输出方法内部调用路径,和路径上每个节点的耗时

可以通过这个命令,查看哪些方法耗性能,从而找出导致性能缺陷的代码,这个耗时还包含了arthas执行的时间哦。

图片

输出getOrderInfo的调用路径

trace -j cn.test.mobile.controller.order.OrderController getOrderInfoPress Q or Ctrl+C to abort.
Affect(class-cnt:1 , method-cnt:1) cost in 92 ms.
---ts=2019-11-13 15:46:59;thread_name=http-nio-8801-exec-4;id=2b;is_daemon=true;priority=5;TCCL=org.springframework.boot.web.embedded.tomcat.TomcatEmbeddedWebappClassLoader@a6c54c3---[15.509011ms] cn.test.mobile.controller.order.OrderController:getOrderInfo()+---[0.03584ms] cn.test.db.common.vo.ResponseVo:<init>() #472+---[0.00992ms] java.util.HashMap:<init>() #473+---[0.02176ms] cn.test.mobile.controller.order.OrderController:getUserInfo() #478+---[0.024ms] java.util.Map:get() #483+---[0.00896ms] java.lang.Object:toString() #483+---[0.00864ms] java.lang.Integer:parseInt() #483+---[0.019199ms] com.baomidou.mybatisplus.core.conditions.query.QueryWrapper:<init>() #500+---[0.135679ms] com.baomidou.mybatisplus.core.conditions.query.QueryWrapper:allEq() #500+---[12.476072ms] cn.test.db.service.IOrderMediaService:getOne() #500+---[0.0128ms] java.util.HashMap:put() #501+---[0.443517ms] cn.test.db.common.vo.ResponseVo:setSuccess() #503`---[0.03488ms] java.util.Map:put() #504

输出getOrderInfo的调用路径,且cost大于10ms,-j是指过滤掉jdk中的方法,可以看到输出少了很多

trace -j cn.test.mobile.controller.order.OrderController getOrderInfo '#cost > 10'Press Q or Ctrl+C to abort.
Affect(class-cnt:1 , method-cnt:1) cost in 96 ms.
---ts=2019-11-13 15:53:42;thread_name=http-nio-8801-exec-2;id=29;is_daemon=true;priority=5;TCCL=org.springframework.boot.web.embedded.tomcat.TomcatEmbeddedWebappClassLoader@a6c54c3---[13.803743ms] cn.test.mobile.controller.order.OrderController:getOrderInfo()+---[0.01312ms] cn.test.db.common.vo.ResponseVo:<init>() #472+---[0.01408ms] cn.test.mobile.controller.order.OrderController:getUserInfo() #478+---[0.0128ms] com.baomidou.mybatisplus.core.conditions.query.QueryWrapper:<init>() #500+---[0.303998ms] com.baomidou.mybatisplus.core.conditions.query.QueryWrapper:allEq() #500+---[12.675431ms] cn.test.db.service.IOrderMediaService:getOne() #500`---[0.409917ms] cn.test.db.common.vo.ResponseVo:setSuccess() #503

6、jobs

执行后台异步任务

线上有些问题是偶然发生的,这时就需要使用异步任务,把信息写入文件。

使用 & 指定命令去后台运行,使用 > 将结果重写到日志文件,以trace为例

trace -j cn.test.mobile.controller.order.OrderController getOrderInfo > test.out &

jobs——列出所有job

 jobs
[76]*  Running           trace -j cn.test.mobile.controller.order.OrderController getOrderInfo >> test.out &execution count : 0start time      : Wed Nov 13 16:13:23 CST 2019timeout date    : Thu Nov 14 16:13:23 CST 2019session         : f4fba846-e90b-4234-959e-e78ad0a5db8c (current)

job id是76, * 表示此job是当前session创建,状态是Running,execution count是执行次数,timeout date是超时时间

异步执行时间,默认为1天,如果要修改,使用options命令,

options job-timeout 2d

options可选参数 1d, 2h, 3m, 25s,分别代表天、小时、分、秒

kill——强制终止任务

kill 76
kill job 76 success

最多同时支持8个命令使用重定向将结果写日志

请勿同时开启过多的后台异步命令,以免对目标JVM性能造成影响

7、logger

查看logger信息,更新logger level

查看

loggername                ROOTclass               ch.qos.logback.classic.LoggerclassLoader         sun.misc.Launcher$AppClassLoader@18b4aac2classLoaderHash     18b4aac2 #改日志级别时要用到它level               INFOeffectiveLevel      INFO... ... ... ...

更新日志级别

logger --name ROOT --level debug
update logger level success.

如果执行这个命令时出错:update logger level fail.

指定classLoaderHash重试一下试试

logger -c 18b4aac2 --name ROOT --level debug
update logger level success.

8、dashboard

查看当前系统的实时数据面板 这个命令可以全局的查看jvm运行状态,比如内存和cpu占用情况

dashboard
ID        NAME                          GROUP               PRIORITY STATE     %CPU      TIME      INTERRUPT DAEMON
17        Abandoned connection cleanup  main                5        TIMED_WAI 0         0:0       false     true
1009      AsyncAppender-Worker-arthas-c system              5        WAITING   0         0:0       false     true
5         Attach Listener               system              5        RUNNABLE  0         0:0       false     true
23        ContainerBackgroundProcessor[ main                5        TIMED_WAI 0         0:0       false     true
55        DestroyJavaVM                 main                5        RUNNABLE  0         0:11      false     false
3         Finalizer                     system              8        WAITING   0         0:0       false     true
18        HikariPool-1 housekeeper      main                5        TIMED_WAI 0         0:0       false     true
39        NioBlockingSelector.BlockPoll main                5        RUNNABLE  0         0:0       false     true
2         Reference Handler             system              10       WAITING   0         0:0       false     true
4         Signal Dispatcher             system              9        RUNNABLE  0         0:0       false     true
69        System Clock                  main                5        TIMED_WAI 0         0:34      false     true
25        Thread-2                      main                5        TIMED_WAI 0         0:0       false     false
37        Timer-0                       main                5        TIMED_WAI 0         0:0       false     true
Memory                    used    total    max     usage    GC
heap                      216M    415M     3614M   5.99%    gc.ps_scavenge.count          96
ps_eden_space             36M     78M      1276M   2.90%    gc.ps_scavenge.time(ms)       3054
ps_survivor_space         17M     38M      38M     46.53%   gc.ps_marksweep.count         4
ps_old_gen                161M    298M     2711M   5.97%    gc.ps_marksweep.time(ms)      804
nonheap                   175M    180M     -1      97.09%
code_cache                35M     35M      240M    14.85%

ID: Java级别的线程ID,注意这个ID不能跟jstack中的nativeID一一对应 我们可以通过 thread id 查看线程的堆栈 信息

thread 2
"Reference Handler" Id=2 WAITING on java.lang.ref.Reference$Lock@66ad4272at java.lang.Object.wait(Native Method)-  waiting on java.lang.ref.Reference$Lock@66ad4272at java.lang.Object.wait(Object.java:502)at java.lang.ref.Reference.tryHandlePending(Reference.java:191)at java.lang.ref.Reference$ReferenceHandler.run(Reference.java:153)
  • NAME: 线程名
  • GROUP: 线程组名
  • PRIORITY: 线程优先级, 1~10之间的数字,越大表示优先级越高
  • STATE: 线程的状态
  • CPU%: 线程消耗的cpu占比,采样100ms,将所有线程在这100ms内的cpu使用量求和,再算出每个线程的cpu使用占比。
  • TIME: 线程运行总时间,数据格式为分:秒
  • INTERRUPTED: 线程当前的中断位状态
  • DAEMON: 是否是daemon线程

9、redefine

redefine jvm已加载的类 ,可以在不重启项目的情况下,热更新类。

这个功能真的很强大,但是命令不一定会成功

下面我们来模拟:假设我想修改OrderController里的某几行代码,然后热更新至jvm:

a. 反编译OrderController,默认情况下,反编译结果里会带有ClassLoader信息,通过--source-only选项,可以只打印源代码。方便和mc/redefine命令结合使用

jad --source-only cn.test.mobile.controller.order.OrderController > OrderController.java

生成的OrderController.java在哪呢,执行pwd就知道在哪个目录了

b. 查找加载OrderController的ClassLoader

sc -d cn.test.mobile.controller.order.OrderController | grep classLoaderHash
classLoaderHash   18b4aac2

c. 修改保存好OrderController.java之后,使用mc(Memory Compiler)命令来编译成字节码,并且通过-c参数指定ClassLoader

mc -c 18b4aac2 OrderController.java -d ./

d. 热更新刚才修改后的代码

redefine -c 18b4aac2 OrderController.class
redefine success, size: 1

然后代码就更新成功了。

其他

如果java -jar选择启动某个应用的时候,报下面的错

java -jar arthas-boot.jar
[INFO] arthas-boot version: 3.1.4
[INFO] Process 11544 already using port 3658
[INFO] Process 11544 already using port 8563
[INFO] Found existing java process, please choose one and hit RETURN.
* [1]: 11544[2]: 119504 cn.test.MobileApplication[3]: 136340 org.jetbrains.jps.cmdline.Launcher[4]: 3068
2 #选择第2个启动
[ERROR] Target process 119504 is not the process using port 3658, you will connect to an unexpected process.
[ERROR] 1. Try to restart arthas-boot, select process 11544, shutdown it first with running the 'shutdown' command.
[ERROR] 2. Or try to use different telnet port, for example: java -jar arthas-boot.jar --telnet-port 9998 --http-port -1

注意提示[ERROR] 1,只需要进入11544这个应用,然后执行shutdown关闭这个应用就可以启动了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/68105.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

流程图神器——代码转流程图软件、在线流程图绘制软件

在我们解题或者向别人展示我们的算法或者思路时候&#xff0c;流程图是一种非常好的方式&#xff0c;具有以下优点&#xff1a; &#xff08;1&#xff09;画法简单&#xff0c;容易上手 &#xff08;2&#xff09;逻辑性强&#xff0c;结构清晰 &#xff08;3&#xff09;便…

一分钟学会利用GPT编写爆款标题

&#x1f3c6; 文章目标&#xff1a;学习利用GPT编写爆款标题 &#x1f340; 入门篇&#xff1a;一分钟学会利用GPT编写爆款标题 ✅ 创作者&#xff1a;熊猫Jay ✨ 个人公众号: 熊猫Jay字节之旅 (文末有链接) &#x1f341; 展望&#xff1a;若本篇讲解内容帮助到您&#xff0c…

注册Gmail账号手机号码提示无法验证

注册Gmail账号&#xff0c;如果出现手机号码无法验证&#xff0c;可以在https://accounts.google.com/SignUpMobile页面中填入手机号码&#xff0c;提取短信中的注册链接&#xff0c;按要求注册谷歌账号&#xff0c;亲测可用 接收短信内容如下图 打开链接 填入个人信息选择要注…

解决申请 Googl e账号填写电话号码不能验证的问题

使用google账号的方便之处是不管在哪里&#xff0c;只用在chorm登录google账号你自己收藏的书签和扩展工具都会同步&#xff0c;对于开发人员来说是非常好用的&#xff0c;所以给大家介绍下我自己申请google 账号的过程&#xff0c;希望对你有帮助。 方法很简单&#xff1a;用…

解决报此无法访问此网站以及电话号码无法用于进行验证的问题

解决报此无法访问此网站以及电话号码无法用于进行验证的问题 前言此无法访问此网站此电话号码无法用于进行验证 前言 小编经历过漫长的时间找了无数的解决方案&#xff0c;终于可以访问了。一切的一切终不负有心人&#xff0c;都已解决&#xff01;&#xff01;&#xff01; 可…

谷歌邮箱此号码无法用于验证

注册谷歌邮箱在手机验证码这一步的时候&#xff0c;使用86(国内)地区手机号会提醒此号码无法用于验证

解决谷歌账号注册中国手机号无法验证,中国大陆“此电话号码无法用于进行验证”google和gmail问题!

在注册谷歌账号时&#xff0c;很多人可能会遇到无法验证账号的问题。 我自己是花钱在某宝找人帮我注册的&#xff0c;我也咨询了卖家相关的一些问题&#xff0c;如下图&#xff1a; 这种情况可能是由于多种原因引起的&#xff0c;例如输入的个人信息不准确、网络连接问题、谷…

Google账号填写电话号码,不能进行验证

我今天想申请一个google邮箱但是到发送手机验证码那一步老是不行,说是不能发送. 没办法,我就从网上找了好几个方法,有的说把浏览器语言设置成英文,还有的说把还有把浏览器语言那里只剩下英文才可以,好吧我都试了一下,但是都没什么作用, 直到我看了解决申请 Googl e账号填写电…

大数据技术沙龙来袭!2023走进网易:创新重塑数据生产力

随着大数据平台和技术在企业内部的推进与落地&#xff0c;长效价值逐渐成为关注点。 ❓如何更好地管理数据资产&#xff1f; ❓是否有可参考的建设方法 ❓AIGC和ChatGPT热点是否能高效结合企业数据需求&#xff1f; ❓企业IT部门又该如何更好地发挥其能力? 网易将为您解答…

一个免费AI智能浏览器插件:Echo

介绍 Chat GPT chrome extension 助手&#xff0c;类似 monica&#xff0c;基于 GPT-3.5 API&#xff0c;免费使用。 开源地址&#xff1a;GitHub - hzvwsrexw15/echo: Chat GPT chrome extension Copilot 目前有以下功能&#xff1a; 一键处理选中文本&#xff1a;支持在页…

GPT-4 剑指多模态,前有谷歌 PaLM-E,AI 格局要变?

本文首发自 HyperAI超神经微信公众号~ 美东时间 3 月 14 日&#xff0c;OpenAI 重磅推出大型多模态模型 GPT-4。GPT-4 是 ChatGPT 和 Bing AI 聊天机器人背后的技术基础。OpenAI 称&#xff0c;GPT-4 能接受图像和文本输入&#xff0c;输出文本内容&#xff0c;虽然在许多现实…

中文修改润色平台-中文写作润色软件有哪些

中文语言润色软件 中文语言润色软件是一种基于自然语言处理技术&#xff0c;旨在提高中文文本的语言风格、表达能力和可读性的工具。中文语言润色软件可以自动检测和纠正文本中出现的语法、拼写、标点符号以及其他笔误等语言问题&#xff0c;并给出相应的纠正建议和修改意见。…

苹果欲让 Mac 变成「游戏机」,发布移植工具,几秒就能玩上 Windows 游戏!

整理 | 屠敏 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09; 你会用 Mac 电脑来玩游戏吗&#xff1f; 一直以来&#xff0c;Mac “只适合办公&#xff0c;不适合玩游戏”的名声早已远扬&#xff0c;它的硬件、API、驱动等本身便不是为了游戏设计而考虑&#xff0c…

函数返回值类型优化,JSX增强,TypeScript 5.1 发布!

译者 | 禾木木 责编 | 夏萌 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09; 近日&#xff0c;微软宣布正式发布 TypeScript 5.1版本。 如果你还不熟悉 TypeScript&#xff0c;它是一种建立在 JavaScript 基础上的语言&#xff0c;通过添加静态类型语法来构建…

用 GPT-4 创建 VSCode 插件,我遇到的六个问题!

让 GPT-4 从头开发一个扩展&#xff0c;会有什么情况发生&#xff1f;它的代码真的可以安装、编译、运行吗&#xff1f;一位开发者 KEVIN LIN 进行了一次测试。 原文链接&#xff1a;https://bit.kevinslin.com/p/leveraging-gpt-4-to-automate-the 声明&#xff1a;本文为 CSD…

什么是长尾关键词?如何找到长尾关键词?以及使用长尾词的九大理由

长尾关键词 文章目录 长尾关键词前言一、长尾理论二、什么是长尾关键词?三、如何找到长尾关键词?四、在SEO中使用长尾关键字的9个理由1.长尾会带来大量流量。2.长尾关键词已经包含头部关键词。3.长尾巴带来更好的针对性流量。4.长尾提高转换率。5.长尾查询非常适合PPC。6.长尾…

AI生成的东西越来越真实,你该如何分辨

ChatGPT的出现&#xff0c;改变很多职场人士的工作习惯&#xff0c;同样在学校里的中学生、大学生写作业、论文的方式也在进行极大的改变&#xff0c;有些学校甚至禁止使用ChatGPT&#xff0c;因为长此以往会导致学生的思考和创造能力下降&#xff0c;以及对学科知识的理解能力…

如何通过网关降低大模型的调用费用,并提升合规性

作者&#xff1a;赵伟基(兆维) 以 ChatGPT 为代表的 AIGC 技术为企业生产带来了巨大的变化&#xff0c;并在企业应用开发领域占据一席之地。AI 大模型凭借其强大的学习能力&#xff0c;可以帮助人们完成各种复杂的任务&#xff0c;例如帮助开发人员编写与调试代码、研究人员快…

ChatGPT:你才是编译器!你全家都是编译器!

我是不是再也不需要编译器了&#xff1f;&#xff01; 这个故事的灵感来自一个类似的文章&#xff1a;在 ChatGPT 中构建虚拟机。我印象深刻并决定尝试类似的东西&#xff0c;但这次不是 Linux 命令行工具&#xff0c;而是让 ChatGPT 成为我们的 Python 编译器。 这是初始化 Ch…