當前位置:首頁 > 嵌入式 > 嵌入式硬件
[導讀]在2004年寫的一篇文章x86匯編語言學習手記(1)中,曾經(jīng)涉及到gcc編譯的代碼默認16字節(jié)棧對齊的問題。之所以這樣做,主要是性能優(yōu)化方面的考慮。  大多數(shù)現(xiàn)代cpu都one-die了

在2004年寫的一篇文章x86匯編語言學習手記(1)中,曾經(jīng)涉及到gcc編譯的代碼默認16字節(jié)棧對齊的問題。之所以這樣做,主要是性能優(yōu)化方面的考慮。  大多數(shù)現(xiàn)代cpu都one-die了l1和l2cache。對于l1 cache,大多是write though的;l2 cache則是write back的,不會立即寫回memory,這就會導致cache和memory的內(nèi)容的不一致;另外,對于mp(multi processors)的環(huán)境,由于cache是cpu私有的,不同cpu的cache的內(nèi)容也存在不一致的問題,因此很多mp的的計算架構,不論是ccnuma還是smp都實現(xiàn)了cache coherence的機制,即不同cpu的cache一致性機制?! ache coherence的一種實現(xiàn)是通過cache-snooping協(xié)議,每個cpu通過對bus的snoop實現(xiàn)對其它cpu讀寫cache的監(jiān)控:  首先,cache line是cache和memory之間數(shù)據(jù)傳輸?shù)淖钚卧?。 ?. 當cpu1要寫cache時,其它cpu就會檢查自己cache中對應的cache line,如果是dirty的,就write back到memory,并且會將cpu1的相關cache line刷新;如果不是dirty的,就invalidate該cache line.  2. 當cpu1要讀cache時,其它cpu就會將自己cache中對應的cache line中標記為dirty的部分write back到memory,并且會將cpu1的相關cache line刷新。  所以,提高cpu的cache hit rate,減少cache和memory之間的數(shù)據(jù)傳輸,將會提高系統(tǒng)的性能?! ∫虼?,在程序和二進制對象的內(nèi)存分配中保持cache line aligned就十分重要,如果不保證cache line對齊,出現(xiàn)多個cpu中并行運行的進程或者線程同時讀寫同一個cache line的情況的概率就會很大。這時cpu的cache和memory之間會反復出現(xiàn)write back和refresh情況,這種情形就叫做cache thrashing。  為了有效的避免cache thrashing,通常有以下兩種途徑:  1. 對于heap的分配,很多系統(tǒng)在malloc調(diào)用中實現(xiàn)了強制的alignment.
  2. 對于stack的分配,很多編譯器提供了stack aligned的選項?! ‘斎唬绻诰幾g器指定了stack aligned,程序的尺寸將會變大,會占用更多的內(nèi)存。因此,這中間的取舍需要仔細考慮,下面是我在google上搜索到的一段討論:one of our customers complained about the additional code generated to
maintain the stack aligned to 16-byte boundaries, and suggested us to
default to the minimum alignment when optimizing for code size. this
has the caveat that, when you link code optimized for size with code
optimized for speed, if a function optimized for size calls a
performance-critical function with the stack misaligned, the
performance-critical function may perform poorly.

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉