內(nèi)存隨機(jī)也比順序訪問慢，帶你深入理解內(nèi)存IO過程

時間：2021-01-21 00:57:50

關(guān)鍵字：內(nèi)存 IO 計算機(jī)

手機(jī)看文章

掃描二維碼
隨時隨地手機(jī)看文章

[導(dǎo)讀]內(nèi)存訪問一次延時到底是多少？你是否會進(jìn)行大概的估算？內(nèi)存存在隨機(jī)IO比順序IO慢的問題嗎？我們都知道磁盤的隨機(jī)IO要比順序IO慢的多（操作系統(tǒng)底層還專門實(shí)現(xiàn)了電梯調(diào)度算法來緩解這個問題），那么內(nèi)存的隨機(jī)IO會比順序IO慢嗎？

平時大家都知道內(nèi)存訪問很快，今天來讓我們來思考兩個問題：

問題1：內(nèi)存訪問一次延時到底是多少？你是否會進(jìn)行大概的估算？

例如筆者的內(nèi)存條的Speed顯示是1066MHz，那是否可以推算出內(nèi)存IO延時是1s/1066MHz=0.93ns? 這種算法大錯特錯。

問題2：內(nèi)存存在隨機(jī)IO比順序IO慢的問題嗎？我們都知道磁盤的隨機(jī)IO要比順序IO慢的多（操作系統(tǒng)底層還專門實(shí)現(xiàn)了電梯調(diào)度算法來緩解這個問題），那么內(nèi)存的隨機(jī)IO會比順序IO慢嗎？

要想徹底弄明白以上兩個問題，我想我們得從內(nèi)存IO的物理過程中來尋找答案。 1先給你講個圖書管理員的故事

在開始介紹枯燥的內(nèi)存工作原理之前。我想先給你講一個故事，并帶你去認(rèn)識一個人，圖書館的管理員。

在我們的這個故事中，你是故事的主角。你有一所房子，房子里有一個仆人，他每天幫你處理各種各樣的圖書數(shù)據(jù)。但是北京房價太貴，所以你的這個房子很小，只能放的下64本書。你家的馬路對面，就是北京圖書館(你家房子雖然小但是地段還不錯)，你所需要的所有的圖書在那里都可以找到。圖書館有個管理員，他負(fù)責(zé)幫你把你想要的書找出來。

圖1 圖書管理員的故事

好接下來，故事開始進(jìn)行！

場景1：

你發(fā)現(xiàn)你需要編號為0的書的計算結(jié)果，你的仆人穿過馬路告訴了圖書管理員，告訴他請幫我把第0-63本書取出來。圖書管理員幫你在電腦前查得該書在二樓。于是他，花了點(diǎn)時間坐電梯到了二樓。等到了二樓，他又花了點(diǎn)時間幫你找了出來。然后你的仆人抱著64本書放到了客廳，拿起第0本書幫你處理了起來。

場景2：

你發(fā)現(xiàn)你需要編號為1的書的計算結(jié)果，告訴你的仆人。你的仆人直接從客廳拿出來就可以處理了，這次你等的時間最短。

場景3：

你發(fā)現(xiàn)需要編號為65的書，你又告訴你的仆人。你的仆人穿過馬路又去找了圖書管理員。圖書管理員還在二樓呢，聽說這次需要65-127，這次他不用再花時間找樓層了。只是花時間找書就可以了。你的仆人把65-127的書放到了客廳（以前的0-63就都扔了），并幫你開始處理起65號書來。

場景4：

你發(fā)現(xiàn)你需要編號為10000的書，你告訴了你的仆人。你的仆人穿過馬路去圖書館，找到了管理員。這次管理員查得你需要的書是在10樓，他得花點(diǎn)時間坐電梯過去。去了之后，他又得花點(diǎn)時間幫你找出來。

這四個場景里，我覺得你一定發(fā)現(xiàn)了不同情形下耗時的差異。

場景1和場景4花費(fèi)的時間最多。因為圖書管理員需要花時間坐電梯找樓層，需要花時間在樓內(nèi)找書。
場景3次之，因為圖書管理員直接就在樓層內(nèi)，只需要花時間在樓內(nèi)找書既可
場景2最快，因為只需要仆人幫你從客廳拿過來就好，連馬路都不需要過。

之所以編造這么一個例子，是因為內(nèi)存的工作方式和它太像了。接下來我們進(jìn)入內(nèi)存的實(shí)際分析。

2內(nèi)存物理結(jié)構(gòu)

在《帶你理解內(nèi)存對齊最底層原理》中我們了解了內(nèi)存顆粒的物理構(gòu)造以及IO過程，今天我們再來復(fù)習(xí)一下。

內(nèi)存是由chip構(gòu)成。每個chip內(nèi)部，是由8個bank組成的。其構(gòu)造如下圖：

圖2 內(nèi)存顆粒chip內(nèi)部結(jié)構(gòu)

而每一個bank是一個二維平面上的矩陣，前面文章中我們說到過。矩陣中每一個元素中都是保存了1個字節(jié)，也就是8個bit。

圖3 bank內(nèi)部物理結(jié)構(gòu)

每當(dāng)CPU向內(nèi)存請求數(shù)據(jù)的時候，內(nèi)存芯片總是8個bank并行一起工作。每個bank在定位到行地址后，把對應(yīng)的行copy到row buffer。再根據(jù)列地址把對應(yīng)的元素中的數(shù)據(jù)取出來，8個bank把數(shù)據(jù)拼接一下，一個64位寬的數(shù)據(jù)就可以返回給CPU了。

圖4 一次內(nèi)存IO的過程示意

根據(jù)上面幾張圖我們可以大致了解內(nèi)存的IO過程，在這個過程中每一步操作之間都有一些延遲，讓我們來繼續(xù)了解這些延遲。

3內(nèi)存IO延遲

在《從DDR發(fā)展到DDR4，內(nèi)存核心頻率指標(biāo)其實(shí)基本上就沒太大的進(jìn)步》里我們提到內(nèi)存的延遲很大程度是受核心頻率制約的，你也應(yīng)該記得我們提到了內(nèi)存延遲一般是通過CL-tRCD-tRP-tRAS四個參數(shù)來標(biāo)識的。我們今天來詳細(xì)理解一下這四個參數(shù)的含義：

CL(Column Address Latency）：發(fā)送一個列地址到內(nèi)存與數(shù)據(jù)開始響應(yīng)之間的周期數(shù)
tRCD（Row Address to Column Address Delay）：打開一行內(nèi)存并訪問其中的列所需的最小時鐘周期數(shù)
tRP(Row Precharge Time)：發(fā)出預(yù)充電命令與打開下一行之間所需的最小時鐘周期數(shù)。

tRAS(Row Active Time)：行活動命令與發(fā)出預(yù)充電命令之間所需的最小時鐘周期數(shù)。也就是對下一次預(yù)充電時間進(jìn)行限制。

要注意除了CL是固定周期數(shù)以外，其它的三個都是最小周期。另外上面的參數(shù)都是以時鐘周期為單位的。因為現(xiàn)代的內(nèi)存都是一個時鐘周期上下沿分別各傳輸一次數(shù)據(jù)，所以用Speed/2就可以得出，例如筆者的機(jī)器的Speed是1066MHz，則時鐘周期為533MHz。你自己的機(jī)器可以通過dmidecode命令查看：

# dmidecode | grep -P -A16 "Memory Device" Memory Device  ......  Speed: 1067 MHz  ......



和“圖書管理員”類似，內(nèi)存芯片也有類似的工作場景：
		
 場景1：  你的進(jìn)程需要內(nèi)存地址0x0000為的一個字節(jié)的數(shù)據(jù)，CPU這時候向內(nèi)存控制器發(fā)出請求，內(nèi)存控制器進(jìn)行行地址的預(yù)充電，需要等待tRP個時鐘周期。再發(fā)出打開一行內(nèi)存的命令，又需要等待tRCD個時鐘周期。接著發(fā)送列地址，再等待CL個周期。最終將0x0000-0x0007的數(shù)據(jù)全部返回給了CPU。CPU把這些數(shù)據(jù)放入到了自己的cache里，并幫你開始對0x0000的數(shù)據(jù)進(jìn)行運(yùn)算。  場景2：  你的進(jìn)程需要內(nèi)存地址0x0003的一個字節(jié)數(shù)據(jù)，CPU發(fā)現(xiàn)發(fā)現(xiàn)它在自己的cache里存在，直接使用就好了。這個場景里其實(shí)根本就沒有內(nèi)存IO發(fā)生。  場景3：  你的進(jìn)程需要內(nèi)存地址0x0008的一個字節(jié)數(shù)據(jù)，CPU的cache并沒有命中，于是向內(nèi)存控制器請求。內(nèi)存控制器發(fā)現(xiàn)行地址和上一次工作的行地址一致，這次只需要發(fā)送列地址后等待CL個周期，就可以拿到0x0008-0x0015的數(shù)據(jù)并返回給CPU了。  場景4：  你的進(jìn)程需要內(nèi)存地址0xf000的一個字節(jié)數(shù)據(jù)，同樣CPU的cache并不命中，向內(nèi)存控制器請求。內(nèi)存控制器一看（內(nèi)心有些許的郁悶），這次行w地址又變了，得，和場景1一樣。繼續(xù)等待tRP+tRCD+CL個周期后，才能夠取到數(shù)據(jù)并返回。  實(shí)際的計算機(jī)的內(nèi)存IO過程中還需要進(jìn)行邏輯地址和物理地址的轉(zhuǎn)換，這里忽略不表。 
			


				
4結(jié)論其中場景1和場景4是隨機(jī)IO的情況，場景2無內(nèi)存IO發(fā)生，場景3是順序IO，。通過上面的過程描述我們可以得到結(jié)論。內(nèi)存也存在和磁盤一樣，隨機(jī)IO比順序IO要慢的問題。如果行地址同上一次訪問的不一致，則需要重新拷貝row buffer，延遲周期需要tRP+tRCD+CL。而如果是順序IO的話（行地址不變），只需要CL個周期既可完成。
			
我們接著估算下內(nèi)存的延時,筆者的機(jī)器上的內(nèi)存參數(shù)Speed為1066MHz（通過dmidecode查得），該值除以2就是時鐘周期的頻率=1066/2=533Mhz。其延遲周期為7-7-7-24。
				
				
					
						隨機(jī)IO：這種狀況下需要tRP+tRCD+CL個時鐘周期，7+7+7=21個周期。但是還有個tRAS的限制，兩次行地址預(yù)充電不得小于24。所以我們得按24來計算，24*(1s/533Mhz) = 45ns 
					
					
						順序IO：這種狀況下只需要CL個時鐘周期 7*(1s/533Mhz)=13ns 
					
				


			
5擴(kuò)展，CPU的cache line虛擬內(nèi)存概念因為對于內(nèi)存來說，隨機(jī)IO一次開銷比順序IO高好幾倍。所以操作系統(tǒng)在工作的時候，會盡量讓內(nèi)存通過順序IO的方式來進(jìn)行。做法關(guān)鍵就是Cache Line。當(dāng)CPU發(fā)現(xiàn)緩存不命中的時候，實(shí)際上從來不會向內(nèi)存去請求1個字節(jié)，8個字節(jié)這種。而是一次性就要64字節(jié)，然后放到自己的Cache中存起來。
				
用上面的例子來看，
			
			
				
					如果隨機(jī)請求8字節(jié)：耗時是45ns 
				
				
					
						如果隨機(jī)請求64字節(jié)：耗時是45+7*13 = 136ns
					
				
			
開銷也沒貴多少，因為只有第一個字節(jié)是隨機(jī)IO，后面的7個字節(jié)都是順序IO。數(shù)據(jù)是8倍，但是IO耗時只有3倍，而且取出來的數(shù)據(jù)后面大概率要用，所以計算機(jī)內(nèi)部就這么搞了，通過這種方式幫你避免一些隨機(jī)IO！
				
 另外，內(nèi)存也支持burst(突發(fā)傳輸)模式，在這種模式下可以只傳入一次行列地址，就命令內(nèi)存返回該內(nèi)存開頭的連續(xù)字節(jié)數(shù)據(jù)，比如64字節(jié)。這種模式下，只有第一次的8字節(jié)需要真正的行列訪問延遲，后面的7個字節(jié)可以直接按內(nèi)存的數(shù)據(jù)頻率給吐出來。


				
					
						免責(zé)聲明：本文內(nèi)容由21ic獲得授權(quán)后發(fā)布，版權(quán)歸原作者所有，本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點(diǎn)，不代表本平臺立場，如有問題，請聯(lián)系我們，謝謝！


                
            欲知詳情，請下載word文檔 下載文檔

內(nèi)存隨機(jī)也比順序訪問慢，帶你深入理解內(nèi)存IO過程

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

Trianz與AWS達(dá)成戰(zhàn)略合作協(xié)議，徹底改變云采用和管理方式

人工智能驅(qū)動工具SODA V將顛覆汽車市場，使汽車開發(fā)時間和成本降低90%

從容應(yīng)對未知風(fēng)險----解密亞馬遜云科技的韌性之道

中國游戲市場開始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

獨(dú)立自主！華為董事：致力打造不依賴西方的技術(shù)

華為張平安：數(shù)字世界話語權(quán)最終由生態(tài)繁榮決定！

中國通信服務(wù)公布2024年中期業(yè)績

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動產(chǎn)業(yè)鏈高速發(fā)展

軟通動力與長三角投資達(dá)成戰(zhàn)略合作共謀數(shù)字生態(tài)新發(fā)展

海南區(qū)6家凱悅系酒店與嵐圖達(dá)成戰(zhàn)略合作，共同推動新能源出行體驗

安嵐攜手妮可?巴菲特開啟療愈之旅在秋日紅葉的浪漫中療愈身心

不懼美國封鎖！華為：我們給大家提供系統(tǒng)、存儲等

尼爾森IQ深耕中國四十載，共繪未來新篇章

第二十二屆跨盈年度B2B營銷高管峰會2025聚焦"營銷競?cè)。蚱剖袌鰞?nèi)卷實(shí)現(xiàn)認(rèn)知進(jìn)化"

恒久動力馳騁天地美孚1號攜手周冠宇邀您縱擎馳騁，勁享駕趣體驗

美通社母公司Cision發(fā)布CisionOne平臺，進(jìn)軍亞太地區(qū)媒體監(jiān)測市場

移遠(yuǎn)通信推出大模型解決方案，重塑千行百業(yè)智能邊界

高途公布2024年第二季度未經(jīng)審計業(yè)績

華為發(fā)布AI百校計劃：培養(yǎng)AI人才每年獲最高100萬支持