不停機(jī)還能替換代碼?6年的 Java程序員表示不可思議
相信很多人都有這樣一種感受,自己寫的代碼在開發(fā)、測(cè)試環(huán)境跑的穩(wěn)得一筆,可一到線上就抽風(fēng),不是缺這個(gè)就是少那個(gè)反正就是一頓報(bào)錯(cuò),而線上調(diào)試代碼又很麻煩,讓人頭疼得很。不過(guò), 阿里巴巴出了一款名叫
Arthas
的工具,可以在線分析診斷Java代碼,讓人眼前一亮。
Arthas 是什么?
Arthas(阿爾薩斯)
是阿里開源的一個(gè)Java在線分析診斷工具。
Arthas 能解決啥問(wèn)題?
在日常開發(fā)上線過(guò)程中,我們多多少少都會(huì)遇到下邊這些問(wèn)題,苦于無(wú)法在線調(diào)試,「只能通過(guò)老鳥的經(jīng)驗(yàn)來(lái)硬分析bug,效率上不去還總開口問(wèn)別人答疑解惑,多少有些不好意思」。
-
這個(gè)類從哪個(gè) jar 包加載的?為什么會(huì)報(bào)各種類相關(guān)的 Exception?
-
我改的代碼為什么沒(méi)有執(zhí)行到?難道是我沒(méi) commit?分支搞錯(cuò)了?
-
遇到問(wèn)題無(wú)法在線上 debug,難道只能通過(guò)加日志再重新發(fā)布嗎?
-
線上遇到某個(gè)用戶的數(shù)據(jù)處理有問(wèn)題,但線上同樣無(wú)法 debug,線下無(wú)法重現(xiàn)!
-
是否有一個(gè)全局視角來(lái)查看系統(tǒng)的運(yùn)行狀況?
-
有什么辦法可以監(jiān)控到JVM的實(shí)時(shí)運(yùn)行狀態(tài)?
-
線上代碼有錯(cuò)誤,不想重新發(fā)布?那能不能改class文件替換一下?
Arthas兩種安裝、啟動(dòng)方式
1、jar包啟動(dòng)
wget https://alibaba.github.io/arthas/arthas-boot.jar
java -jar arthas-boot.jar --target-ip 0.0.0.0
首先想用arthas
調(diào)試項(xiàng)目,服務(wù)器必須要有運(yùn)行著的Java服務(wù),demo-0.0.1-SNAPSHOT.jar
就是我啟動(dòng)的測(cè)試項(xiàng)目,啟動(dòng)arthas
后它會(huì)自動(dòng)檢測(cè)本地所有的Java服務(wù)列出來(lái),我們只需按照序號(hào)輸入想要調(diào)試的項(xiàng)目即可,選1
進(jìn)入對(duì)應(yīng)進(jìn)程的arthas
交互平臺(tái)
[root@iz2zehzeir87zi8q99krk1z data]# java -jar arthas-boot.jar --target-ip 172.17.72.201
[INFO] arthas-boot version: 3.1.0
[INFO] Found existing java process, please choose one and hit RETURN.
* [1]: 28679 demo-0.0.1-SNAPSHOT.jar
2、在線安裝
curl -L https://alibaba.github.io/arthas/install.sh | sh
執(zhí)行上面的命令會(huì)在所在的文件中生成as.sh執(zhí)行文件啟動(dòng)arthas
./as.sh PID #進(jìn)程id 指定JAVA進(jìn)程id
./as.sh -h #h來(lái)獲取更多參數(shù)信息
3、遠(yuǎn)程連接:
「要想使用arthas服務(wù)的 web console必須對(duì)外暴露本機(jī)ip」
java -jar arthas-boot.jar --target-ip 172.17.72.201
java -jar arthas-boot.jar --telnet-port 9999 --http-port -1
./as.sh --target-ip 0.0.0.0
./as.sh --telnet-port 9999 --http-port -1
訪問(wèn)arthas
控制臺(tái)也有兩種方法
「(1)、web console 界面」
「重點(diǎn)說(shuō)明」:--target-ip
的ip
一定要是arthas
所在機(jī)器對(duì)外暴露的ip,「但如果用的是阿里云機(jī)器必須要使用私有ip啟動(dòng)arthas服務(wù),但訪問(wèn)必須是公網(wǎng)IP」
「(2)、telnet方式」
telnet 10.0.2.5 8563
訪問(wèn) http://59.110.218.9:8563/ ,進(jìn)入交互平臺(tái)
Arthas 命令使用
1、Dashboard 命令
查看當(dāng)前系統(tǒng)的實(shí)時(shí)數(shù)據(jù)面板,例如:服務(wù)器thread信息、內(nèi)存memory、GC回收等情況
2、Thread(線程監(jiān)控)
$ thread -n 3
"as-command-execute-daemon" Id=57 cpuUsage=72% RUNNABLE
at sun.management.ThreadImpl.dumpThreads0(Native Method)
at sun.management.ThreadImpl.getThreadInfo(ThreadImpl.java:448)
at com.taobao.arthas.core.command.monitor200.ThreadCommand.processTopBusyThreads(ThreadCommand.java:133)
at com.taobao.arthas.core.command.monitor200.ThreadCommand.process(ThreadCommand.java:79)
at com.taobao.arthas.core.shell.command.impl.AnnotatedCommandImpl.process(AnnotatedCommandImpl.java:82)
at com.taobao.arthas.core.shell.command.impl.AnnotatedCommandImpl.access$100(AnnotatedCommandImpl.java:18)
at com.taobao.arthas.core.shell.command.impl.AnnotatedCommandImpl$ProcessHandler.handle(AnnotatedCommandImpl.java:111)
at com.taobao.arthas.core.shell.command.impl.AnnotatedCommandImpl$ProcessHandler.handle(AnnotatedCommandImpl.java:108)
at com.taobao.arthas.core.shell.system.impl.ProcessImpl$CommandProcessTask.run(ProcessImpl.java:370)
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
at java.lang.Thread.run(Thread.java:748)
Number of locked synchronizers = 1
- java.util.concurrent.ThreadPoolExecutor$Worker@a2f70c7
「可以看到這個(gè)線程是被synchroned
關(guān)鍵字鎖導(dǎo)致的阻塞」 ,目前只支持找出synchronized
關(guān)鍵字阻塞住的線程, 如果是java.util.concurrent.Lock
, 目前還不支持。
Number of locked synchronizers = 1
- java.util.concurrent.ThreadPoolExecutor$Worker@a2f70c7
thread -n 3 #當(dāng)前最忙的前N個(gè)線程
thread -b, ##找出當(dāng)前阻塞其他線程的線程
thread -n 3 -i 1000 #間隔一定時(shí)間后展示
「重點(diǎn)學(xué)習(xí)」:thread -b
, ##「找出當(dāng)前阻塞其他線程的線程」
3、JVM (jvm實(shí)時(shí)運(yùn)行狀態(tài),內(nèi)存使用情況等)
$ jvm
RUNTIME
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
MACHINE-NAME 28679@iz2zehzeir87zi8q99krk1z
JVM-START-TIME 2019-03-28 17:32:16
MANAGEMENT-SPEC-VERSION 1.2
SPEC-NAME Java Virtual Machine Specification
SPEC-VENDOR Oracle Corporation
SPEC-VERSION 1.8
VM-NAME Java HotSpot(TM) 64-Bit Server VM
VM-VENDOR Oracle Corporation
VM-VERSION 25.191-b12
INPUT-ARGUMENTS []
CLASS-PATH demo-0.0.1-SNAPSHOT.jar
BOOT-CLASS-PATH /usr/local/jdk/jre/lib/resources.jar:/usr/local/jdk/jre/lib/rt.jar:/usr/local/jdk/jre/lib/sunrsasign.jar:/usr/local/jdk/jre/lib/jsse.jar:/usr/local/jdk/jre/lib/jce.jar
:/usr/local/jdk/jre/lib/charsets.jar:/usr/local/jdk/jre/lib/jfr.jar:/usr/local/jdk/jre/classes
LIBRARY-PATH /usr/java/packages/lib/amd64:/usr/lib64:/lib64:/lib:/usr/lib
4、trace (當(dāng)前方法內(nèi)部調(diào)用路徑,路徑上每個(gè)節(jié)點(diǎn)的耗時(shí))
$ trace #類名 #方法名
對(duì)于執(zhí)行耗時(shí)相對(duì)較長(zhǎng)的方法,調(diào)用鏈路耗時(shí)屬性會(huì)高亮顯示方便排查
參數(shù) -j
可以過(guò)濾jdk的函數(shù) trace -j com.example.demo.controller index2
參數(shù) #cost
可以按執(zhí)行耗時(shí)毫秒ms過(guò)濾 trace -j com.example.demo.controller index2 ’#cost >10‘
5、watch
當(dāng)前方法執(zhí)行數(shù)據(jù)觀測(cè),能觀察到的范圍為:返回值、拋出異常、入?yún)?/p>
$ trace #類名 #方法名 "{params,target,returnObj,throwExp }"
OGNL 表達(dá)式 {params,target,returnObj,throwExp }
throwExp
:異常params
:入?yún)ⅲ〝?shù)組),單個(gè)參數(shù)params【0】returnObj
:返回值
$ watch com.example.demo.controller index2 "{params,target,returnObj}" -x 5
Press Q or Ctrl+C to abort.
Affect(class-cnt:1 , method-cnt:1) cost in 81 ms.
ts=2019-03-29 14:24:14; [cost=1000.746582ms] result=@ArrayList[
@Object[][
@String[辛志富],
],
@controller[
],
@String[index2],
]
6、stack
當(dāng)前方法被調(diào)用的路徑,顯示當(dāng)前方法被那些方法調(diào)用
public static String uuidOne() {
return uuidTwo();
}
public static String uuidTwo() {
return UUID.randomUUID().toString().replaceAll("-", "");
}
$ stack com.example.demo.controller uuidTwo
Press Q or Ctrl+C to abort.
Affect(class-cnt:1 , method-cnt:1) cost in 58 ms.
ts=2019-03-29 14:38:19;thread_name=http-nio-8888-exec-5;id=13;is_daemon=true;priority=5;TCCL=org.springframework.boot.web.embedded.tomcat.TomcatEmbeddedWebappClassLoader@525b461a
@com.example.demo.controller.uuidOne()
at com.example.demo.controller.index2(controller.java:31)
at sun.reflect.GeneratedMethodAccessor36.invoke(null:-1)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
7、monitor 命令
監(jiān)控類、方法的調(diào)用進(jìn)行監(jiān)控,調(diào)用次數(shù)、成功次數(shù)、失敗次數(shù)、平均響應(yīng)時(shí)長(zhǎng)、失敗率等
$ monitor -c 4 com.example.demo.controller uuidTwo
Press Q or Ctrl+C to abort.
Affect(class-cnt:1 , method-cnt:1) cost in 56 ms.
timestamp class method total success fail avg-rt(ms) fail-rate
--------------------------------------------------------------------------------------------------------
2019-03-29 14:55:40 com.example.demo.controller uuidTwo 7 7 0 0.18 0.00%
8、classloader 命令
將JVM中所有的類加載器統(tǒng)計(jì)出來(lái),樹狀展示
$ classloader #每種classloader加載類的個(gè)樹
name numberOfInstances loadedCountTotal
org.springframework.boot.loader.LaunchedURLClassLoader 1 4463
com.taobao.arthas.agent.ArthasClassloader 2 3631
BootstrapClassLoader 1 2961
java.net.FactoryURLClassLoader 1 835
sun.misc.Launcher$AppClassLoader 1 46
sun.reflect.DelegatingClassLoader 41 41
sun.misc.Launcher$ExtClassLoader 1 25
Affect(row-cnt:7) cost in 7 ms.
$ classloader -t # 類加載器間的層級(jí)關(guān)系
+-BootstrapClassLoader
+-sun.misc.Launcher$ExtClassLoader@1959f618
+-com.taobao.arthas.agent.ArthasClassloader@5fc476c6
+-com.taobao.arthas.agent.ArthasClassloader@5017e14b
+-sun.misc.Launcher$AppClassLoader@5c647e05
+-java.net.FactoryURLClassLoader@4ad317f0
+-org.springframework.boot.loader.LaunchedURLClassLoader@20ad9418
Affect(row-cnt:7) cost in 5 ms
線上代碼熱更新(動(dòng)態(tài)修改上線項(xiàng)目代碼)
手動(dòng)在代碼中拋異常,「不停機(jī)不重新發(fā)包的情況下,修改線上代碼」啟動(dòng)服務(wù)也達(dá)到我們預(yù)期異常
「替換代碼的流程:」
1、jad命令
將需要更改的文件先進(jìn)行反編譯,保存下來(lái) ,編譯器修改
$ jad --source--only com.example.demo.DemoApplication > /data/DemoApplication.java
修改完以后需要將類重新加載到JVM
2、SC命令
查找當(dāng)前類是哪個(gè)classLoader加載的
$ sc -d *DemoApplication | grep classLoader
classLoaderHash 20ad9418 #類加載器 編號(hào)
3、MC命令
用指定的classloader重新將類在內(nèi)存中編譯
$ mc -c 20ad9418 /data/DemoApplication.java -d /data
Memory compiler output:
/data/com/example/demo/DemoApplication.class
4、redefine命令 將編譯后的類加載到JVM
上邊編譯后的.class文件地址
$ redefine /data/com/example/demo/DemoApplication.class
redefine success, size: 1
「文件替換后我們?cè)俅卧L問(wèn)一下程序,發(fā)現(xiàn)異常沒(méi)有了程序已經(jīng)是我們修改正確后的,class文件替換成功」
總結(jié)
這樣我們就用arthas
現(xiàn)實(shí)了不停機(jī)、不發(fā)包替換了生產(chǎn)環(huán)境的Java代碼,功能確實(shí)比較強(qiáng)大,本文只揭開了arthas
強(qiáng)大功能的冰山一角,后續(xù)將出更詳細(xì)的文章,方便大家一起學(xué)習(xí)。
越懶越勤快
arthas
的整體功能雖然很強(qiáng)大,但命令行的輸入方式讓我頭疼不已,歲數(shù)大了記憶力真的下降嚴(yán)重,而且作為一個(gè)賊 TM
懶的程序員,讓我去記住如此多的命令和參數(shù),簡(jiǎn)直是要了老命。又一次因?yàn)閼凶屛仪诳炱饋?lái),我決定做個(gè)arthas
命令可視化平臺(tái)。
「設(shè)計(jì)初衷」:設(shè)計(jì)這個(gè)平臺(tái)的初衷很簡(jiǎn)單,就是讓程序員們把更多的精力放在問(wèn)題的排查上,而不是記那么多枯燥無(wú)趣的命令。本身我也不是一個(gè)愿意死記硬背的人,覺(jué)得腦子里還是應(yīng)該多放一些有趣、有意義的東西??赡茉谟脩T了命令行的大佬眼里,這個(gè)功能比較雞肋,甚至有點(diǎn)多余,但畢竟像我這樣平凡的人更多一些,每天還陷入在重復(fù)的工作當(dāng)中,工作量能減一點(diǎn)就多輕松一點(diǎn)嘛。
本以為自己很牛X,誰(shuí)成想去哪兒網(wǎng)已經(jīng)整合arthas
開發(fā)了比較完善的可視化Java
診斷工具,此刻有點(diǎn)泄氣。「github地址」 :https://github.com/qunarcorp/bistoury
目前平臺(tái)還在持續(xù)的開發(fā)中,由于平臺(tái)是自己在維護(hù),開發(fā)進(jìn)度并不客觀,平時(shí)利用一些碎片時(shí)間開發(fā),畢竟不能耽誤工作丟了飯碗嘛。不管會(huì)不會(huì)有人用,我都會(huì)一直做下去,只為給自己留一份驕傲。項(xiàng)目「github地址」 : https://github.com/chengxy-nds/arthas-web.git
特別推薦一個(gè)分享架構(gòu)+算法的優(yōu)質(zhì)內(nèi)容,還沒(méi)關(guān)注的小伙伴,可以長(zhǎng)按關(guān)注一下:
長(zhǎng)按訂閱更多精彩▼
如有收獲,點(diǎn)個(gè)在看,誠(chéng)摯感謝
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問(wèn)題,請(qǐng)聯(lián)系我們,謝謝!