原來 CPU 為程序性能優(yōu)化做了這么多

時間：2020-05-06 11:39:07

關(guān)鍵字： CPU 性能優(yōu)化內(nèi)存 CACHE

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀]來自：武培軒本文主要來學(xué)習(xí)內(nèi)存屏障和 CPU 緩存知識，以便于我們?nèi)チ私?CPU 對程序性能優(yōu)化做了哪些努力。首先來看下 CPU 緩存： CPU 緩存 CPU 緩存是為了提高程序運行的性能，CPU 在很多處理上內(nèi)部架構(gòu)做了很多調(diào)整，比如 CPU 高速緩存，大家都知道因為硬

原來 CPU 為程序性能優(yōu)化做了這么多

來自：武培軒

本文主要來學(xué)習(xí)內(nèi)存屏障和 CPU 緩存知識，以便于我們?nèi)チ私?CPU 對程序性能優(yōu)化做了哪些努力。

首先來看下 CPU 緩存：

CPU 緩存

CPU 緩存是為了提高程序運行的性能，CPU 在很多處理上內(nèi)部架構(gòu)做了很多調(diào)整，比如 CPU 高速緩存，大家都知道因為硬盤很慢，可以通過緩存把數(shù)據(jù)加載到內(nèi)存里面，提高訪問速度，而 CPU 處理也有這個機制，盡可能把處理器訪問主內(nèi)存時間開銷放在 CPU 高速緩存上面，CPU 訪問速度相比內(nèi)存訪問速度又要快好多倍，這就是目前大多數(shù)處理器都會去利用的機制，利用處理器的緩存以提高性能。

多級緩存

CPU 的緩存分為三級緩存，所以說多核 CPU 會有多個緩存，我們首先來看下一級緩存（L1 Cache）：

L1 Cache 是 CPU 第一層高速緩存，分為數(shù)據(jù)緩存和指令緩存，一般服務(wù)器 CPU 的 L1 緩存的容量通常在 32-4096 KB。

由于 L1 級高速緩存容量的限制，為了再次提高 CPU 的運算速度，在 CPU 外部放置-高速存儲器，即二級緩存（L2 Cache）。

因為 L1 和 L2 的容量還是有限，因此提出了三級緩存，L3 現(xiàn)在的都是內(nèi)置的，它的實際作用即是，L3 緩存的應(yīng)用可以進一步降低內(nèi)存延遲，同時提升大數(shù)據(jù)量計算時處理器的性能，具有較大 L3 緩存的處理器提供更有效的文件系統(tǒng)緩存行為及較短消息和處理器隊列長度，一般是多核共享一個 L3 緩存。

CPU 在讀取數(shù)據(jù)時，先在 L1 Cache 中尋找，再從 L2 Cache 尋找，再從 L3 Cache 尋找，然后是內(nèi)存，再后是外存儲器硬盤尋找。

如下圖所示，CPU 緩存架構(gòu)中，緩存層級越接近 CPU core，容量越小，速度越快。CPU Cache 由若干緩存行組成，緩存行是 CPU Cache 中的最小單位，一個緩存行的大小通常是 64 字節(jié)，是 2 的倍數(shù)，不同的機器上為 32 到 64 字節(jié)不等，并且它有效地引用主內(nèi)存中的一塊地址。

多 CPU 讀取同樣的數(shù)據(jù)進行緩存，進行不同運算之后，最終寫入主內(nèi)存以哪個 CPU 為準？這就需要緩存同步協(xié)議了：

緩存同步協(xié)議

在這種高速緩存回寫的場景下，有很多 CPU 廠商提出了一些公共的協(xié)議-MESI 協(xié)議，它規(guī)定每條緩存有個狀態(tài)位，同時定義了下面四個狀態(tài)：

修改態(tài)(Modified)：此 cache 行已被修改過(臟行),內(nèi)容已不同于主存，為此 cache 專有；
專有態(tài)(Exclusive)：此 cache 行內(nèi)容同于主存，但不出現(xiàn)于其它 cache 中；
共享態(tài)(Shared)：此 cache 行內(nèi)容同于主存，但也出現(xiàn)于其它 cache 中；
無效態(tài)(Invalid)：此 cache 行內(nèi)容無效(空行)。

多處理器，單個 CPU 對緩存中數(shù)據(jù)進行了改動，需要通知給其它 CPU，也就是意味著，CPU 處理要控制自己的讀寫操作，還要監(jiān)聽其他 CPU 發(fā)出的通知，從而保證最終一致。

運行時的指令重排

CPU 對性能的優(yōu)化除了緩存之外還有運行時指令重排，大家可以通過下面的圖了解下：

比如圖中有代碼 x = 10;y = z;，這個代碼的正常執(zhí)行順序應(yīng)該是先將 10 寫入 x，讀取 z 的值，然后將 z 值寫入 y，實際上真實執(zhí)行步驟，CPU 執(zhí)行的時候可能是先讀取 z 的值，將 z 值寫入 y，最后再將 10 寫入 x，為什么要做這些修改呢？

因為當 CPU 寫緩存時發(fā)現(xiàn)緩存區(qū)正被其他 CPU 占用（例如：三級緩存），為了提高 CPU 處理性能，可能將后面的讀緩存命令優(yōu)先執(zhí)行。

指令重排并非隨便重排，是需要遵守 as-if-serial 語義的，as-if-serial 語義的意思是指不管怎么重排序（編譯器和處理器為了提高并行度），單線程程序的執(zhí)行結(jié)果不能被改變。編譯器，runtime 和處理器都必須遵守 as-if-serial 語義，也就是說編譯器和處理器不會對存在數(shù)據(jù)依賴關(guān)系的操作做重排序。

那么這樣就會有如下兩個問題：

CPU 高速緩存下有一個問題：

緩存中的數(shù)據(jù)與主內(nèi)存的數(shù)據(jù)并不是實時同步的，各 CPU（或 CPU 核心）間緩存的數(shù)據(jù)也不是實時同步。在同一個時間點，各 CPU 所看到同一內(nèi)存地址的數(shù)據(jù)的值可能是不一致的。

CPU 執(zhí)行指令重排序優(yōu)化下有一個問題：

雖然遵守了 as-if-serial語義，僅在單 CPU 自己執(zhí)行的情況下能保證結(jié)果正確。多核多線程中，指令邏輯無法分辨因果關(guān)聯(lián)，可能出現(xiàn)亂序執(zhí)行，導(dǎo)致程序運行結(jié)果錯誤。

如何解決上述的兩個問題呢，這就需要談到內(nèi)存屏障：

內(nèi)存屏障

處理器提供了兩個內(nèi)存屏障（Memory Barrier） 指令用于解決上述兩個問題：

寫內(nèi)存屏障（Store Memory Barrier）：在指令后插入 Store Barrier，能讓寫入緩存中的最新數(shù)據(jù)更新寫入主內(nèi)存，讓其他線程可見。強制寫入主內(nèi)存，這種顯示調(diào)用，CPU 就不會因為性能考慮而去對指令重排。

讀內(nèi)存屏障（Load Memory Barrier）：在指令前插入 Load Barrier，可以讓高速緩存中的數(shù)據(jù)失效，強制從新的主內(nèi)存加載數(shù)據(jù)。強制讀取主內(nèi)存內(nèi)容，讓 CPU 緩存與主內(nèi)存保持一致，避免了緩存導(dǎo)致的一致性問題。

Java 中也有類似的機制，比如 Synchronized 和 volatile 都采用了內(nèi)存屏障的原理。

總結(jié)

本文主要介紹了在提高程序運行性能上，CPU 作出了哪些優(yōu)化：緩存和運行時指令重排，最后還介紹了內(nèi)存屏障相關(guān)知識。

http://dwz.win/7ps

特別推薦一個分享架構(gòu)+算法的優(yōu)質(zhì)內(nèi)容，還沒關(guān)注的小伙伴，可以長按關(guān)注一下：
長按訂閱更多精彩▼
如有收獲，點個在看，誠摯感謝

免責(zé)聲明：本文內(nèi)容由21ic獲得授權(quán)后發(fā)布，版權(quán)歸原作者所有，本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點，不代表本平臺立場，如有問題，請聯(lián)系我們，謝謝！

原來 CPU 為程序性能優(yōu)化做了這么多

CPU 緩存

多級緩存

緩存同步協(xié)議

運行時的指令重排

內(nèi)存屏障

總結(jié)

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

Trianz與AWS達成戰(zhàn)略合作協(xié)議，徹底改變云采用和管理方式

人工智能驅(qū)動工具SODA V將顛覆汽車市場，使汽車開發(fā)時間和成本降低90%

從容應(yīng)對未知風(fēng)險----解密亞馬遜云科技的韌性之道

中國游戲市場開始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

獨立自主！華為董事：致力打造不依賴西方的技術(shù)

華為張平安：數(shù)字世界話語權(quán)最終由生態(tài)繁榮決定！

中國通信服務(wù)公布2024年中期業(yè)績

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動產(chǎn)業(yè)鏈高速發(fā)展

軟通動力與長三角投資達成戰(zhàn)略合作共謀數(shù)字生態(tài)新發(fā)展

海南區(qū)6家凱悅系酒店與嵐圖達成戰(zhàn)略合作，共同推動新能源出行體驗

安嵐攜手妮可?巴菲特開啟療愈之旅在秋日紅葉的浪漫中療愈身心

不懼美國封鎖！華為：我們給大家提供系統(tǒng)、存儲等

尼爾森IQ深耕中國四十載，共繪未來新篇章

第二十二屆跨盈年度B2B營銷高管峰會2025聚焦"營銷競?cè)。蚱剖袌鰞?nèi)卷實現(xiàn)認知進化"

恒久動力馳騁天地美孚1號攜手周冠宇邀您縱擎馳騁，勁享駕趣體驗

美通社母公司Cision發(fā)布CisionOne平臺，進軍亞太地區(qū)媒體監(jiān)測市場

移遠通信推出大模型解決方案，重塑千行百業(yè)智能邊界

高途公布2024年第二季度未經(jīng)審計業(yè)績

華為發(fā)布AI百校計劃：培養(yǎng)AI人才每年獲最高100萬支持