當(dāng)前位置:首頁 > 公眾號(hào)精選 > Linux閱碼場
[導(dǎo)讀]編者按:目前許多公司同時(shí)使用x86和AArch642種主流的服務(wù)器。這兩種環(huán)境的算力相當(dāng),內(nèi)存相同的情況下:相同版本的JVM和Java應(yīng)用,相同的JVM參數(shù),應(yīng)用性能在不同的平臺(tái)中表現(xiàn)相差30%,x86遠(yuǎn)好于AArch64平臺(tái)。本文分析了一個(gè)應(yīng)用在AArch64平臺(tái)上性能下降的例...

編者按:目前許多公司同時(shí)使用 x86 和 AArch64 2 種主流的服務(wù)器。這兩種環(huán)境的算力相當(dāng),內(nèi)存相同的情況下:相同版本的 JVM 和 Java 應(yīng)用,相同的 JVM 參數(shù),應(yīng)用性能在不同的平臺(tái)中表現(xiàn)相差 30%,x86 遠(yuǎn)好于 AArch64 平臺(tái)。本文分析了一個(gè)應(yīng)用在 AArch64 平臺(tái)上性能下降的例子,發(fā)現(xiàn) JVM 的 CodeCache 大小是引起這個(gè)性能問題的根源,進(jìn)而研究什么導(dǎo)致了不同平臺(tái)上 CodeCache 大小的不同。最后筆者給出了不同平臺(tái)中該如何設(shè)置參數(shù)規(guī)避該問題。希望本文能給讀者一些啟示:當(dāng)使用不同的硬件平臺(tái)時(shí)需要關(guān)注底層硬件對(duì)于上層應(yīng)用的影響。

業(yè)務(wù)在 x86 和 AArch64 上同時(shí)部署時(shí)(相同的 JDK 和 Java 應(yīng)用版本),發(fā)現(xiàn) AArch64 平臺(tái)性能下降嚴(yán)重問題。進(jìn)一步查看日志,發(fā)現(xiàn)在 AArch64 平臺(tái)中偶有如下情況:

這代表 JVM 中的 CodeCache 滿了,導(dǎo)致編譯停止,未編譯的方法只能解釋執(zhí)行,進(jìn)而嚴(yán)重影響應(yīng)用性能。那什么是 CodeCache?

CodeCache 是什么

簡單來說,CodeCache 用于存放編譯后的方法,主要分為三部分:

  1. Non-nmethods:包括運(yùn)行時(shí) Stub,Adapter 等;
  2. Profiled nmethod:包括會(huì)采集信息的方法,即分層編譯中第 2、3 層的方法;
  3. Non-Profiled nmethods:包括不采集信息的方法,即分層編譯中第 1、4 層的方法,也包括 JNI 的方法。
注:分層編譯指的是 JVM 同時(shí)存在 C1 和 C2 兩種編譯器,C1 做一些簡單的編譯優(yōu)化,耗時(shí)較短,C2 做更多復(fù)雜的編譯優(yōu)化,性能較好,編譯耗時(shí)較多。分層編譯的觸發(fā)在 JVM 內(nèi)會(huì)根據(jù)相應(yīng)的條件進(jìn)行觸發(fā),關(guān)于更多分層編譯相關(guān)知識(shí)可以參考相關(guān)資料 [1]。

在 JDK 9 之后 [2],這些會(huì)分配到不同的區(qū)域(使用不同區(qū)域的優(yōu)點(diǎn):查找、回收等),JDK 8 中會(huì)分配到同一塊區(qū)域。

JVM 平時(shí)會(huì)清理一些不可達(dá)的方法,例如由于退優(yōu)化等產(chǎn)生的死方法,另外 UseCodeCacheFlushing 選項(xiàng)(默認(rèn)開啟),還會(huì)清理較老以及執(zhí)行較少的方法。一旦 CodeCache 滿了之后,會(huì)停止編譯,直到 CodeCache 有空間,若關(guān)閉了 UseCodeCacheFlushing 選項(xiàng),則會(huì)直接永久停止編譯。

不同的 JVM 版本以及不同的參數(shù),默認(rèn)的 CodeCache 大小不同。JDK 11 中默認(rèn)參數(shù)下 CodeCache 大小為 240M,若想獲取(確認(rèn))默認(rèn)情況下的 CodeCache 大小,建議使用 - XX: PrintFlagsFinal 選項(xiàng)獲取 ReservedCodeCache 的大小。

CodeCache 大小主要通過以下選項(xiàng)調(diào)節(jié):

OptionDescription
InitialCodeCacheSize初始的 CodeCache 大?。▎挝蛔止?jié))
ReservedCodeCacheSize預(yù)留的 CodeCache 大小,即最大CodeCache 大?。▎挝蛔止?jié))
CodeCacheExpansionSizeCodeCache 每次擴(kuò)展大?。▎挝蛔止?jié))
使用–XX: PrintCodeCache 選項(xiàng)可以打印應(yīng)用使用的 CodeCache 情況,如下:

其中 max_used 表示應(yīng)用中使用到的 CodeCache 大小,據(jù)此可以設(shè)置合適的 ReservedCodeCacheSize 值。

AArch64 vs x86_64

我們都知道 AArch64 和 x86 分別為 RISC 和 CISC 架構(gòu),因此代碼密度方面存在一定差異,在這篇文章 [3] 中比較了不同指令集下手寫匯編的大小,可以看到 AArch64 的代碼密度是 RISC 架構(gòu)中較優(yōu)的,但相比 x86_64 仍稍差些(其中 RISC 最差,m68k 最好)。

另外筆者選用業(yè)界通用的 java 測試套 dacapo[4] 比較 AArch64 和 x86_64 下 CodeCache 占用的大小。

可以看到,在 AArch64 架構(gòu)下,CodeCache 均比 x86_64 要大,但根據(jù)不同場景,大小差距不同,在 5%-20% 之間。因此在我們發(fā)現(xiàn)相同應(yīng)用在 x86 和 AArch64 上時(shí),CodeCache 大小需要進(jìn)行相應(yīng)的調(diào)節(jié)。

除此之外,還需要注意 InlineSmallCode 選項(xiàng),JVM 只會(huì) inline 代碼體積比該值小的方法。JVM 通過 inline 可以觸發(fā)更多的優(yōu)化,因此 inline 對(duì)于性能提升也很重要。在 JDK 11 中,InlineSmallCode 在 x86 下的默認(rèn)值為 2000 字節(jié),在 AArch64 下的默認(rèn)值為 2500 字節(jié)。而 JDK 8 中,InlineSmallCodex86 和 AArch64 下默認(rèn)值均為 2000 字節(jié)。因此建議遷移時(shí)也相應(yīng)修改 InlineSmallCode 的值。業(yè)務(wù)通過對(duì) CodeCache 相關(guān)參數(shù)的調(diào)整,達(dá)到助力 JIT 的最佳編譯效果。

后記

如果遇到相關(guān)技術(shù)問題(包括不限于畢昇 JDK),可以進(jìn)入畢昇 JDK 社區(qū)查找相關(guān)資源(點(diǎn)擊原文進(jìn)入官網(wǎng)),包括二進(jìn)制下載、代碼倉庫、使用教學(xué)、安裝、學(xué)習(xí)資料等。畢昇 JDK 社區(qū)每雙周周二舉行技術(shù)例會(huì),同時(shí)有一個(gè)技術(shù)交流群討論 GCC、LLVM、JDK 和 V8 等相關(guān)編譯技術(shù),感興趣的同學(xué)可以添加如下微信小助手,回復(fù) Compiler 入群。

rc="https://img.21ic.com/weixin/tr/2021-09/23/476wvino842.png">

參考

[1]http://cr.openjdk.java.net/~thartmann/talks/2017-hotspot_under_the_hood.pdf

[2]https://bugs.openjdk.java.net/browse/jdk-8015774

[3]http://web.eece.maine.edu/~vweaver/papers/iccd09/ll_document.pdf

[4]http://dacapobench.org/


本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉