當前位置:首頁 > 公眾號精選 > 架構(gòu)師社區(qū)
[導(dǎo)讀]為了更好地實現(xiàn)對項目的管理,我們將組內(nèi)一個項目遷移到MDP框架(基于Spring Boot),隨后我們就發(fā)現(xiàn)系統(tǒng)會頻繁報出Swap區(qū)域使用量過高的異常。

作者 | 紀兵

來源 | http://suo.im/5MABXL

背景

為了更好地實現(xiàn)對項目的管理,我們將組內(nèi)一個項目遷移到MDP框架(基于Spring Boot),隨后我們就發(fā)現(xiàn)系統(tǒng)會頻繁報出Swap區(qū)域使用量過高的異常。筆者被叫去幫忙查看原因,發(fā)現(xiàn)配置了4G堆內(nèi)內(nèi)存,但是實際使用的物理內(nèi)存竟然高達7G,確實不正常。JVM參數(shù)配置是“-XX:MetaspaceSize=256M -XX:MaxMetaspaceSize=256M -XX:+AlwaysPreTouch -XX:ReservedCodeCacheSize=128m -XX:InitialCodeCacheSize=128m, -Xss512k -Xmx4g -Xms4g,-XX:+UseG1GC -XX:G1HeapRegionSize=4M”,實際使用的物理內(nèi)存如下圖所示:

震精!Spring Boot內(nèi)存泄露,排查竟這么難!

top命令顯示的內(nèi)存情況

排查過程

1. 使用Java層面的工具定位內(nèi)存區(qū)域(堆內(nèi)內(nèi)存、Code區(qū)域或者使用unsafe.allocateMemory和DirectByteBuffer申請的堆外內(nèi)存)

筆者在項目中添加-XX:NativeMemoryTracking=detailJVM參數(shù)重啟項目,使用命令jcmd pid VM.native_memory detail查看到的內(nèi)存分布如下:

震精!Spring Boot內(nèi)存泄露,排查竟這么難!

jcmd顯示的內(nèi)存情況

發(fā)現(xiàn)命令顯示的committed的內(nèi)存小于物理內(nèi)存,因為jcmd命令顯示的內(nèi)存包含堆內(nèi)內(nèi)存、Code區(qū)域、通過unsafe.allocateMemory和DirectByteBuffer申請的內(nèi)存,但是不包含其他Native Code(C代碼)申請的堆外內(nèi)存。所以猜測是使用Native Code申請內(nèi)存所導(dǎo)致的問題。

為了防止誤判,筆者使用了pmap查看內(nèi)存分布,發(fā)現(xiàn)大量的64M的地址;而這些地址空間不在jcmd命令所給出的地址空間里面,基本上就斷定就是這些64M的內(nèi)存所導(dǎo)致。

震精!Spring Boot內(nèi)存泄露,排查竟這么難!

pmap顯示的內(nèi)存情況

2. 使用系統(tǒng)層面的工具定位堆外內(nèi)存

因為筆者已經(jīng)基本上確定是Native Code所引起,而Java層面的工具不便于排查此類問題,只能使用系統(tǒng)層面的工具去定位問題。

首先,使用了gperftools去定位問題

gperftools的使用方法可以參考gperftools,使用malloc申請的的內(nèi)存最高到3G之后就釋放了,之后始終維持在700M-800M。筆者第一反應(yīng)是:難道Native Code中沒有使用malloc申請,直接使用mmap/brk申請的?(gperftools原理就使用動態(tài)鏈接的方式替換了操作系統(tǒng)默認的內(nèi)存分配器(glibc)。)

然后,使用strace去追蹤系統(tǒng)調(diào)用

因為使用gperftools沒有追蹤到這些內(nèi)存,于是直接使用命令“strace -f -e”brk,mmap,munmap” -p pid”追蹤向OS申請內(nèi)存請求,但是并沒有發(fā)現(xiàn)有可疑內(nèi)存申請。strace監(jiān)控如下圖所示:

震精!Spring Boot內(nèi)存泄露,排查竟這么難!

strace監(jiān)控

接著,使用GDB去dump可疑內(nèi)存

因為使用strace沒有追蹤到可疑內(nèi)存申請;于是想著看看內(nèi)存中的情況。就是直接使用命令gdp -pid pid進入GDB之后,然后使用命令dump memory mem.bin startAddress endAddressdump內(nèi)存,其中startAddress和endAddress可以從/proc/pid/smaps中查找。然后使用strings mem.bin查看dump的內(nèi)容,如下:

震精!Spring Boot內(nèi)存泄露,排查竟這么難!

gperftools監(jiān)控


從內(nèi)容上來看,像是解壓后的JAR包信息。讀取JAR包信息應(yīng)該是在項目啟動的時候,那么在項目啟動之后使用strace作用就不是很大了。所以應(yīng)該在項目啟動的時候使用strace,而不是啟動完成之后。

再次,項目啟動時使用strace去追蹤系統(tǒng)調(diào)用

項目啟動使用strace追蹤系統(tǒng)調(diào)用,發(fā)現(xiàn)確實申請了很多64M的內(nèi)存空間。

使用該mmap申請的地址空間在pmap對應(yīng)如下:

震精!Spring Boot內(nèi)存泄露,排查竟這么難!

strace申請內(nèi)容對應(yīng)的pmap地址空間


最后,使用jstack去查看對應(yīng)的線程

因為strace命令中已經(jīng)顯示申請內(nèi)存的線程ID。直接使用命令jstack pid去查看線程棧,找到對應(yīng)的線程棧(注意10進制和16進制轉(zhuǎn)換)如下:

震精!Spring Boot內(nèi)存泄露,排查竟這么難!

strace申請空間的線程棧


這里基本上就可以看出問題來了:MCC(美團統(tǒng)一配置中心)使用了Reflections進行掃包,底層使用了Spring Boot去加載JAR。因為解壓JAR使用Inflater類,需要用到堆外內(nèi)存,然后使用Btrace去追蹤這個類,棧如下:

震精!Spring Boot內(nèi)存泄露,排查竟這么難!

btrace追蹤棧


然后查看使用MCC的地方,發(fā)現(xiàn)沒有配置掃包路徑,默認是掃描所有的包。于是修改代碼,配置掃包路徑,發(fā)布上線后內(nèi)存問題解決。

3. 為什么堆外內(nèi)存沒有釋放掉呢?

雖然問題已經(jīng)解決了,但是有幾個疑問:

  • 為什么使用舊的框架沒有問題?

  • 為什么堆外內(nèi)存沒有釋放?

  • 為什么內(nèi)存大小都是64M,JAR大小不可能這么大,而且都是一樣大?

  • 為什么gperftools最終顯示使用的的內(nèi)存大小是700M左右,解壓包真的沒有使用malloc申請內(nèi)存嗎?

帶著疑問,筆者直接看了一下Spring Boot Loader那一塊的源碼。發(fā)現(xiàn)Spring Boot對Java JDK的InflaterInputStream進行了包裝并且使用了Inflater,而Inflater本身用于解壓JAR包的需要用到堆外內(nèi)存。而包裝之后的類ZipInflaterInputStream沒有釋放Inflater持有的堆外內(nèi)存。于是筆者以為找到了原因,立馬向Spring Boot社區(qū)反饋了這個bug。但是反饋之后,筆者就發(fā)現(xiàn)Inflater這個對象本身實現(xiàn)了finalize方法,在這個方法中有調(diào)用釋放堆外內(nèi)存的邏輯。也就是說Spring Boot依賴于GC釋放堆外內(nèi)存。

筆者使用jmap查看堆內(nèi)對象時,發(fā)現(xiàn)已經(jīng)基本上沒有Inflater這個對象了。于是就懷疑GC的時候,沒有調(diào)用finalize。帶著這樣的懷疑,筆者把Inflater進行包裝在Spring Boot Loader里面替換成自己包裝的Inflater,在finalize進行打點監(jiān)控,結(jié)果finalize方法確實被調(diào)用了。于是筆者又去看了Inflater對應(yīng)的C代碼,發(fā)現(xiàn)初始化的使用了malloc申請內(nèi)存,end的時候也調(diào)用了free去釋放內(nèi)存。

此刻,筆者只能懷疑free的時候沒有真正釋放內(nèi)存,便把Spring Boot包裝的InflaterInputStream替換成Java JDK自帶的,發(fā)現(xiàn)替換之后,內(nèi)存問題也得以解決了。

這時,再返過來看gperftools的內(nèi)存分布情況,發(fā)現(xiàn)使用Spring Boot時,內(nèi)存使用一直在增加,突然某個點內(nèi)存使用下降了好多(使用量直接由3G降為700M左右)。這個點應(yīng)該就是GC引起的,內(nèi)存應(yīng)該釋放了,但是在操作系統(tǒng)層面并沒有看到內(nèi)存變化,那是不是沒有釋放到操作系統(tǒng),被內(nèi)存分配器持有了呢?

繼續(xù)探究,發(fā)現(xiàn)系統(tǒng)默認的內(nèi)存分配器(glibc 2.12版本)和使用gperftools內(nèi)存地址分布差別很明顯,2.5G地址使用smaps發(fā)現(xiàn)它是屬于Native Stack。內(nèi)存地址分布如下:

震精!Spring Boot內(nèi)存泄露,排查竟這么難!

gperftools顯示的內(nèi)存地址分布


到此,基本上可以確定是內(nèi)存分配器在搗鬼;搜索了一下glibc 64M,發(fā)現(xiàn)glibc從2.11開始對每個線程引入內(nèi)存池(64位機器大小就是64M內(nèi)存),原文如下:

震精!Spring Boot內(nèi)存泄露,排查竟這么難!

glib內(nèi)存池說明


按照文中所說去修改MALLOC_ARENA_MAX環(huán)境變量,發(fā)現(xiàn)沒什么效果。查看tcmalloc(gperftools使用的內(nèi)存分配器)也使用了內(nèi)存池方式。

為了驗證是內(nèi)存池搞的鬼,筆者就簡單寫個不帶內(nèi)存池的內(nèi)存分配器。使用命令gcc zjbmalloc.c -fPIC -shared -o zjbmalloc.so生成動態(tài)庫,然后使用export LD_PRELOAD=zjbmalloc.so替換掉glibc的內(nèi)存分配器。其中代碼Demo如下:

#include
#include
#include
#include
//作者使用的64位機器,sizeof(size_t)也就是sizeof(long)
void* malloc ( size_t size )
{
 long* ptr = mmap( 0, size + sizeof(long), PROT_READ | PROT_WRITE, MAP_PRIVATE | MAP_ANONYMOUS, 0, 0 );
 if (ptr == MAP_FAILED) {
 return NULL;
 }
 *ptr = size; // First 8 bytes contain length.
 return (void*)(&ptr[1]); // Memory that is after length variable
}

void *calloc(size_t n, size_t size) {
 void* ptr = malloc(n * size);
 if (ptr == NULL) {
return NULL;
 }
 memset(ptr, 0, n * size);
 return ptr;
}
void *realloc(void *ptr, size_t size)
{
 if (size == 0) {
free(ptr);
return NULL;
 }
 if (ptr == NULL) {
return malloc(size);
 }
 long *plen = (long*)ptr;
 plen--; // Reach top of memory
 long len = *plen;
 if (size <= len) { return ptr; } void* rptr = malloc(size); if (rptr == NULL) { free(ptr); return NULL; } rptr = memcpy(rptr, ptr, len); free(ptr); return rptr; } void free (void* ptr ) { if (ptr == NULL) { return; } long *plen = (long*)ptr; plen--; // Reach top of memory long len = *plen; // Read length munmap((void*)plen, len + sizeof(long)); } 

通過在自定義分配器當中埋點可以發(fā)現(xiàn)其實程序啟動之后應(yīng)用實際申請的堆外內(nèi)存始終在700M-800M之間,gperftools監(jiān)控顯示內(nèi)存使用量也是在700M-800M左右。但是從操作系統(tǒng)角度來看進程占用的內(nèi)存差別很大(這里只是監(jiān)控堆外內(nèi)存)。

筆者做了一下測試,使用不同分配器進行不同程度的掃包,占用的內(nèi)存如下:

震精!Spring Boot內(nèi)存泄露,排查竟這么難!

內(nèi)存測試對比


為什么自定義的malloc申請800M,最終占用的物理內(nèi)存在1.7G呢?

因為自定義內(nèi)存分配器采用的是mmap分配內(nèi)存,mmap分配內(nèi)存按需向上取整到整數(shù)個頁,所以存在著巨大的空間浪費。通過監(jiān)控發(fā)現(xiàn)最終申請的頁面數(shù)目在536k個左右,那實際上向系統(tǒng)申請的內(nèi)存等于512k * 4k(pagesize) = 2G。為什么這個數(shù)據(jù)大于1.7G呢?

因為操作系統(tǒng)采取的是延遲分配的方式,通過mmap向系統(tǒng)申請內(nèi)存的時候,系統(tǒng)僅僅返回內(nèi)存地址并沒有分配真實的物理內(nèi)存。只有在真正使用的時候,系統(tǒng)產(chǎn)生一個缺頁中斷,然后再分配實際的物理Page。

總結(jié)

震精!Spring Boot內(nèi)存泄露,排查竟這么難!

流程圖

整個內(nèi)存分配的流程如上圖所示。MCC掃包的默認配置是掃描所有的JAR包。在掃描包的時候,Spring Boot不會主動去釋放堆外內(nèi)存,導(dǎo)致在掃描階段,堆外內(nèi)存占用量一直持續(xù)飆升。當發(fā)生GC的時候,Spring Boot依賴于finalize機制去釋放了堆外內(nèi)存;但是glibc為了性能考慮,并沒有真正把內(nèi)存歸返到操作系統(tǒng),而是留下來放入內(nèi)存池了,導(dǎo)致應(yīng)用層以為發(fā)生了“內(nèi)存泄漏”。所以修改MCC的配置路徑為特定的JAR包,問題解決。筆者在發(fā)表這篇文章時,發(fā)現(xiàn)Spring Boot的最新版本(2.0.5.RELEASE)已經(jīng)做了修改,在ZipInflaterInputStream主動釋放了堆外內(nèi)存不再依賴GC;所以Spring Boot升級到最新版本,這個問題也可以得到解決。


免責聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉