當(dāng)前位置:首頁 > 公眾號精選 > 程序喵大人
[導(dǎo)讀]Understandingglibcmalloc日志:[2019-10-10]經(jīng)評論@kwdecsdn提醒,新增對「UnsortedBin中的chunks何時移至small/largechunk中」的補(bǔ)充解釋。[2019-02-06]勘誤與代碼著色優(yōu)化;[2018-05-22]內(nèi)...

Understanding glibc malloc

日志

  1. [2019-10-10] 經(jīng)評論 @kwdecsdn 提醒,新增對「Unsorted Bin 中的 chunks 何時移至 small/large chunk 中」的補(bǔ)充解釋。

  2. [2019-02-06] 勘誤與代碼著色優(yōu)化;

  3. [2018-05-22] 內(nèi)容優(yōu)化與排版優(yōu)化;

  4. [2017-03-17] 優(yōu)化排版.

譯者言:

  1. [2018-05-22] 在寫完這篇博客之后,我抽空將 glibc malloc 的源碼閱讀了一遍,并參與編撰了一篇有關(guān)分配器的綜述文獻(xiàn)1,最后我動手實(shí)現(xiàn)了自己的分配器。當(dāng)然,這都是 17 年暑期之前的工作了。一年后的今天,我打開這篇藏在記憶角落里的文章,看著它驚人的點(diǎn)擊量,我覺得我有必要認(rèn)真地校準(zhǔn)一下本文,從而盡量為大家提供一篇內(nèi)容正確、閱讀舒適的博文,這樣才對得起大家的厚望。在修訂過程中,為了避免令人尷尬的翻譯腔,我會盡量意譯與技術(shù)無關(guān)的文本,希望大家喜歡!

  2. [2016-07-21] 本篇文章主要完成了「Understanding glibc malloc」的翻譯工作。限于本人翻譯水平與專業(yè)技術(shù)水平(純粹為了了解內(nèi)存分配而翻),本文章必定會有很多不足之處,請大家見諒,也歡迎大家的指正!


文章目錄

  • Understanding glibc malloc

    • 5.1. Fast Bin

    • 5.2. Unsorted Bin

    • 5.3. Small Bin

    • 5.4. Large Bin

    • 5.5. Top Chunk

    • 5.6. Last Remainder Chunk

    • 4.1. Allocated chunk

    • 4.2. Free chunk

    • 3.1. Arena 的數(shù)量

    • 3.2. Multiple Arena

    • 3.3. Multiple Heaps

    • 2.1. 案例代碼

    • 2.2. 案例輸出

    • 2.2.1. 在主線程 malloc 之前

    • 2.2.2. 在主線程 malloc 之后

    • 2.2.3. 在主線程 free 之后

    • 2.2.4. 在 thread1 malloc 之前

    • 2.2.5. 在 thread1 malloc 之后

    • 2.2.6. 在 thread1 free 之后

    • 前言

    • 1. 申請堆的系統(tǒng)調(diào)用

    • 2. 多線程支持

    • 3. Arena

    • 4. Chunk

    • 5. Bins


前言

堆內(nèi)存(Heap Memory)是一個很有意思的領(lǐng)域。你可能和我一樣,也困惑于下述問題很久了:

  • 如何從內(nèi)核申請堆內(nèi)存?

  • 誰管理它?內(nèi)核、庫函數(shù),還是應(yīng)用本身?

  • 內(nèi)存管理效率怎么這么高?!

  • 堆內(nèi)存的管理效率可以進(jìn)一步提高嗎?

最近,我終于有時間去深入了解這些問題。下面就讓我來談?wù)勎业恼{(diào)研成果。

開源社區(qū)公開了很多現(xiàn)成的內(nèi)存分配器(Memory Allocators,以下簡稱為分配器):

  • dlmalloc – 第一個被廣泛使用的通用動態(tài)內(nèi)存分配器;

  • ptmalloc2 – glibc 內(nèi)置分配器的原型;

  • jemalloc – FreeBSD & Firefox 所用分配器;

  • tcmalloc – Google 貢獻(xiàn)的分配器;

  • libumem – Solaris 所用分配器;

每一種分配器都宣稱自己快(fast)、可拓展(scalable)、效率高(memory efficient)!但是并非所有的分配器都適用于我們的應(yīng)用。內(nèi)存吞吐量大(memory hungry)的應(yīng)用程序,其性能很大程度上取決于分配器的性能。

在這篇文章中,我只談「glibc malloc」分配器。為了方便大家理解「glibc malloc」,我會聯(lián)系最新的源代碼。

歷史:ptmalloc2 基于 dlmalloc 開發(fā),其引入了多線程支持,于 2006 年發(fā)布。發(fā)布之后,ptmalloc2 整合進(jìn)了 glibc 源碼,此后其所有修改都直接提交到了 glibc malloc 里。因此,ptmalloc2 的源碼和 glibc malloc 的源碼有很多不一致的地方。(譯者注:1996 年出現(xiàn)的 dlmalloc 只有一個主分配區(qū),該分配區(qū)為所有線程所爭用,1997 年發(fā)布的 ptmalloc 在 dlmalloc 的基礎(chǔ)上引入了非主分配區(qū)的概念。)

1. 申請堆的系統(tǒng)調(diào)用

我在之前的文章中提到過,malloc?內(nèi)部通過?brk?或?mmap?系統(tǒng)調(diào)用向內(nèi)核申請堆區(qū)。

譯者注:在內(nèi)存管理領(lǐng)域,我們一般用「堆」指代用于分配動態(tài)內(nèi)存的虛擬地址空間,而用「?!怪复糜诜峙潇o態(tài)內(nèi)存的虛擬地址空間。具體到虛擬內(nèi)存布局(Memory Layout),堆維護(hù)在通過?brk?系統(tǒng)調(diào)用申請的「Heap」及通過?mmap?系統(tǒng)調(diào)用申請的「Memory Mapping Segment」中;而棧維護(hù)在通過匯編棧指令動態(tài)調(diào)整的「Stack」中。在 Glibc 里,「Heap」用于分配較小的內(nèi)存及主線程使用的內(nèi)存。

下圖為 Linux 內(nèi)核 v2.6.7 之后,32 位模式下的虛擬內(nèi)存布局方式。

2. 多線程支持

Linux 的早期版本采用 dlmalloc 作為它的默認(rèn)分配器,但是因?yàn)?ptmalloc2 提供了多線程支持,所以 后來 Linux 就轉(zhuǎn)而采用 ptmalloc2 了。多線程支持可以提升分配器的性能,進(jìn)而間接提升應(yīng)用的性能。

在 dlmalloc 中,當(dāng)兩個線程同時?malloc?時,只有一個線程能夠訪問臨界區(qū)(critical section)——這是因?yàn)樗芯€程共享用以緩存已釋放內(nèi)存的「空閑列表數(shù)據(jù)結(jié)構(gòu)」(freelist data structure),所以使用 dlmalloc 的多線程應(yīng)用會在?malloc?上耗費(fèi)過多時間,從而導(dǎo)致整個應(yīng)用性能的下降。

在 ptmalloc2 中,當(dāng)兩個線程同時調(diào)用?malloc?時,內(nèi)存均會得以立即分配——每個線程都維護(hù)著單獨(dú)的堆,各個堆被獨(dú)立的空閑列表數(shù)據(jù)結(jié)構(gòu)管理,因此各個線程可以并發(fā)地從空閑列表數(shù)據(jù)結(jié)構(gòu)中申請內(nèi)存。這種為每個線程維護(hù)獨(dú)立堆與空閑列表數(shù)據(jù)結(jié)構(gòu)的行為就「per thread arena」。

2.1. 案例代碼

/* Per thread arena example. */#include #include #include #include #include
void* threadFunc(void* arg) { printf("Before malloc in thread 1\n"); getchar(); char* addr = (char*) malloc(1000); printf("After malloc and before free in thread 1\n"); getchar(); free(addr); printf("After free in thread 1\n"); getchar();}
int main() { pthread_t t1; void* s; int ret; char* addr;
printf("Welcome to per thread arena example::%d\n",getpid()); printf("Before malloc in main thread\n"); getchar(); addr = (char*) malloc(1000); printf("After malloc and before free in main thread\n"); getchar(); free(addr); printf("After free in main thread\n"); getchar(); ret = pthread_create(
本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉