當(dāng)前位置:首頁 > 公眾號精選 > 玩轉(zhuǎn)嵌入式
[導(dǎo)讀]內(nèi)存訪問一次延時到底是多少?你是否會進(jìn)行大概的估算?內(nèi)存存在隨機(jī)IO比順序IO慢的問題嗎?我們都知道磁盤的隨機(jī)IO要比順序IO慢的多(操作系統(tǒng)底層還專門實(shí)現(xiàn)了電梯調(diào)度算法來緩解這個問題),那么內(nèi)存的隨機(jī)IO會比順序IO慢嗎?

平時大家都知道內(nèi)存訪問很快,今天來讓我們來思考兩個問題:

問題1: 內(nèi)存訪問一次延時到底是多少?你是否會進(jìn)行大概的估算?

例如筆者的內(nèi)存條的Speed顯示是1066MHz,那是否可以推算出內(nèi)存IO延時是1s/1066MHz=0.93ns? 這種算法大錯特錯。
問題2: 內(nèi)存存在隨機(jī)IO比順序IO慢的問題嗎?我們都知道磁盤的隨機(jī)IO要比順序IO慢的多(操作系統(tǒng)底層還專門實(shí)現(xiàn)了電梯調(diào)度算法來緩解這個問題),那么內(nèi)存的隨機(jī)IO會比順序IO慢嗎?
要想徹底弄明白以上兩個問題,我想我們得從內(nèi)存IO的物理過程中來尋找答案。 1先給你講個圖書管理員的故事
在開始介紹枯燥的內(nèi)存工作原理之前。我想先給你講一個故事,并帶你去認(rèn)識一個人,圖書館的管理員。

在我們的這個故事中,你是故事的主角。你有一所房子,房子里有一個仆人,他每天幫你處理各種各樣的圖書數(shù)據(jù)。但是北京房價太貴,所以你的這個房子很小,只能放的下64本書。你家的馬路對面,就是北京圖書館(你家房子雖然小但是地段還不錯),你所需要的所有的圖書在那里都可以找到。圖書館有個管理員,他負(fù)責(zé)幫你把你想要的書找出來。

圖1 圖書管理員的故事
好接下來,故事開始進(jìn)行!
場景1:
你發(fā)現(xiàn)你需要編號為0的書的計算結(jié)果,你的仆人穿過馬路告訴了圖書管理員,告訴他請幫我把第0-63本書取出來。圖書管理員幫你在電腦前查得該書在二樓。于是他,花了點(diǎn)時間坐電梯到了二樓。等到了二樓,他又花了點(diǎn)時間幫你找了出來。然后你的仆人抱著64本書放到了客廳,拿起第0本書幫你處理了起來。

場景2:

你發(fā)現(xiàn)你需要編號為1的書的計算結(jié)果,告訴你的仆人。你的仆人直接從客廳拿出來就可以處理了,這次你等的時間最短。

場景3:

你發(fā)現(xiàn)需要編號為65的書,你又告訴你的仆人。你的仆人穿過馬路又去找了圖書管理員。圖書管理員還在二樓呢,聽說這次需要65-127,這次他不用再花時間找樓層了。只是花時間找書就可以了。你的仆人把65-127的書放到了客廳(以前的0-63就都扔了),并幫你開始處理起65號書來。
場景4:
你發(fā)現(xiàn)你需要編號為10000的書,你告訴了你的仆人。你的仆人穿過馬路去圖書館,找到了管理員。這次管理員查得你需要的書是在10樓,他得花點(diǎn)時間坐電梯過去。去了之后,他又得花點(diǎn)時間幫你找出來。

這四個場景里,我覺得你一定發(fā)現(xiàn)了不同情形下耗時的差異。

  • 場景1和場景4花費(fèi)的時間最多。因為圖書管理員需要花時間坐電梯找樓層,需要花時間在樓內(nèi)找書。

  • 場景3次之,因為圖書管理員直接就在樓層內(nèi),只需要花時間在樓內(nèi)找書既可

  • 場景2最快,因為只需要仆人幫你從客廳拿過來就好,連馬路都不需要過。

之所以編造這么一個例子,是因為內(nèi)存的工作方式和它太像了。接下來我們進(jìn)入內(nèi)存的實(shí)際分析。

2內(nèi)存物理結(jié)構(gòu)

《帶你理解內(nèi)存對齊最底層原理》中我們了解了內(nèi)存顆粒的物理構(gòu)造以及IO過程,今天我們再來復(fù)習(xí)一下。

內(nèi)存是由chip構(gòu)成。每個chip內(nèi)部,是由8個bank組成的。其構(gòu)造如下圖:

圖2 內(nèi)存顆粒chip內(nèi)部結(jié)構(gòu)
而每一個bank是一個二維平面上的矩陣,前面文章中我們說到過。矩陣中每一個元素中都是保存了1個字節(jié),也就是8個bit。

圖3 bank內(nèi)部物理結(jié)構(gòu)

每當(dāng)CPU向內(nèi)存請求數(shù)據(jù)的時候,內(nèi)存芯片總是8個bank并行一起工作。每個bank在定位到行地址后,把對應(yīng)的行copy到row buffer。再根據(jù)列地址把對應(yīng)的元素中的數(shù)據(jù)取出來,8個bank把數(shù)據(jù)拼接一下,一個64位寬的數(shù)據(jù)就可以返回給CPU了。
圖4 一次內(nèi)存IO的過程示意

根據(jù)上面幾張圖我們可以大致了解內(nèi)存的IO過程,在這個過程中每一步操作之間都有一些延遲,讓我們來繼續(xù)了解這些延遲。

3內(nèi)存IO延遲

《從DDR發(fā)展到DDR4,內(nèi)存核心頻率指標(biāo)其實(shí)基本上就沒太大的進(jìn)步》里我們提到內(nèi)存的延遲很大程度是受核心頻率制約的,你也應(yīng)該記得我們提到了內(nèi)存延遲一般是通過CL-tRCD-tRP-tRAS四個參數(shù)來標(biāo)識的。我們今天來詳細(xì)理解一下這四個參數(shù)的含義:

  • CL(Column Address Latency):發(fā)送一個列地址到內(nèi)存與數(shù)據(jù)開始響應(yīng)之間的周期數(shù)

  • tRCD(Row Address to Column Address Delay):打開一行內(nèi)存并訪問其中的列所需的最小時鐘周期數(shù)

  • tRP(Row Precharge Time):發(fā)出預(yù)充電命令與打開下一行之間所需的最小時鐘周期數(shù)。

  • tRAS(Row Active Time):行活動命令與發(fā)出預(yù)充電命令之間所需的最小時鐘周期數(shù)。也就是對下一次預(yù)充電時間進(jìn)行限制。

要注意除了CL是固定周期數(shù)以外,其它的三個都是最小周期。另外上面的參數(shù)都是以時鐘周期為單位的。因為現(xiàn)代的內(nèi)存都是一個時鐘周期上下沿分別各傳輸一次數(shù)據(jù),所以用Speed/2就可以得出,例如筆者的機(jī)器的Speed是1066MHz,則時鐘周期為533MHz。你自己的機(jī)器可以通過dmidecode命令查看:

# dmidecode | grep -P -A16 "Memory Device" Memory Device  ......  Speed: 1067 MHz  ...... 

和“圖書管理員”類似,內(nèi)存芯片也有類似的工作場景:

場景1:
你的進(jìn)程需要內(nèi)存地址0x0000為的一個字節(jié)的數(shù)據(jù),CPU這時候向內(nèi)存控制器發(fā)出請求,內(nèi)存控制器進(jìn)行行地址的預(yù)充電,需要等待tRP個時鐘周期。再發(fā)出打開一行內(nèi)存的命令,又需要等待tRCD個時鐘周期。接著發(fā)送列地址,再等待CL個周期。最終將0x0000-0x0007的數(shù)據(jù)全部返回給了CPU。CPU把這些數(shù)據(jù)放入到了自己的cache里,并幫你開始對0x0000的數(shù)據(jù)進(jìn)行運(yùn)算。
場景2:
你的進(jìn)程需要內(nèi)存地址0x0003的一個字節(jié)數(shù)據(jù),CPU發(fā)現(xiàn)發(fā)現(xiàn)它在自己的cache里存在,直接使用就好了。這個場景里其實(shí)根本就沒有內(nèi)存IO發(fā)生。
場景3:
你的進(jìn)程需要內(nèi)存地址0x0008的一個字節(jié)數(shù)據(jù),CPU的cache并沒有命中,于是向內(nèi)存控制器請求。內(nèi)存控制器發(fā)現(xiàn)行地址和上一次工作的行地址一致,這次只需要發(fā)送列地址后等待CL個周期,就可以拿到0x0008-0x0015的數(shù)據(jù)并返回給CPU了。
場景4:
你的進(jìn)程需要內(nèi)存地址0xf000的一個字節(jié)數(shù)據(jù),同樣CPU的cache并不命中,向內(nèi)存控制器請求。內(nèi)存控制器一看(內(nèi)心有些許的郁悶),這次行w地址又變了,得,和場景1一樣。繼續(xù)等待tRP+tRCD+CL個周期后,才能夠取到數(shù)據(jù)并返回。
實(shí)際的計算機(jī)的內(nèi)存IO過程中還需要進(jìn)行邏輯地址和物理地址的轉(zhuǎn)換,這里忽略不表。


4結(jié)論

其中場景1和場景4是隨機(jī)IO的情況,場景2無內(nèi)存IO發(fā)生,場景3是順序IO,。通過上面的過程描述我們可以得到結(jié)論。內(nèi)存也存在和磁盤一樣,隨機(jī)IO比順序IO要慢的問題。如果行地址同上一次訪問的不一致,則需要重新拷貝row buffer,延遲周期需要tRP+tRCD+CL。而如果是順序IO的話(行地址不變),只需要CL個周期既可完成。

我們接著估算下內(nèi)存的延時,筆者的機(jī)器上的內(nèi)存參數(shù)Speed為1066MHz(通過dmidecode查得),該值除以2就是時鐘周期的頻率=1066/2=533Mhz。其延遲周期為7-7-7-24。

  • 隨機(jī)IO:這種狀況下需要tRP+tRCD+CL個時鐘周期,7+7+7=21個周期。但是還有個tRAS的限制,兩次行地址預(yù)充電不得小于24。所以我們得按24來計算,24*(1s/533Mhz) = 45ns
  • 順序IO:這種狀況下只需要CL個時鐘周期 7*(1s/533Mhz)=13ns


5擴(kuò)展,CPU的cache line虛擬內(nèi)存概念

因為對于內(nèi)存來說,隨機(jī)IO一次開銷比順序IO高好幾倍。所以操作系統(tǒng)在工作的時候,會盡量讓內(nèi)存通過順序IO的方式來進(jìn)行。做法關(guān)鍵就是Cache Line。當(dāng)CPU發(fā)現(xiàn)緩存不命中的時候,實(shí)際上從來不會向內(nèi)存去請求1個字節(jié),8個字節(jié)這種。而是一次性就要64字節(jié),然后放到自己的Cache中存起來。

用上面的例子來看,

  • 如果隨機(jī)請求8字節(jié):耗時是45ns
  • 如果隨機(jī)請求64字節(jié):耗時是45+7*13 = 136ns

開銷也沒貴多少,因為只有第一個字節(jié)是隨機(jī)IO,后面的7個字節(jié)都是順序IO。數(shù)據(jù)是8倍,但是IO耗時只有3倍,而且取出來的數(shù)據(jù)后面大概率要用,所以計算機(jī)內(nèi)部就這么搞了,通過這種方式幫你避免一些隨機(jī)IO!

另外,內(nèi)存也支持burst(突發(fā)傳輸)模式,在這種模式下可以只傳入一次行列地址,就命令內(nèi)存返回該內(nèi)存開頭的連續(xù)字節(jié)數(shù)據(jù),比如64字節(jié)。這種模式下,只有第一次的8字節(jié)需要真正的行列訪問延遲,后面的7個字節(jié)可以直接按內(nèi)存的數(shù)據(jù)頻率給吐出來。


免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點(diǎn),不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉