當(dāng)前位置:首頁(yè) > 公眾號(hào)精選 > 玩轉(zhuǎn)嵌入式
[導(dǎo)讀]內(nèi)存訪(fǎng)問(wèn)一次延時(shí)到底是多少?你是否會(huì)進(jìn)行大概的估算??jī)?nèi)存存在隨機(jī)IO比順序IO慢的問(wèn)題嗎?我們都知道磁盤(pán)的隨機(jī)IO要比順序IO慢的多(操作系統(tǒng)底層還專(zhuān)門(mén)實(shí)現(xiàn)了電梯調(diào)度算法來(lái)緩解這個(gè)問(wèn)題),那么內(nèi)存的隨機(jī)IO會(huì)比順序IO慢嗎?

平時(shí)大家都知道內(nèi)存訪(fǎng)問(wèn)很快,今天來(lái)讓我們來(lái)思考兩個(gè)問(wèn)題:

問(wèn)題1: 內(nèi)存訪(fǎng)問(wèn)一次延時(shí)到底是多少?你是否會(huì)進(jìn)行大概的估算?

例如筆者的內(nèi)存條的Speed顯示是1066MHz,那是否可以推算出內(nèi)存IO延時(shí)是1s/1066MHz=0.93ns? 這種算法大錯(cuò)特錯(cuò)。
問(wèn)題2: 內(nèi)存存在隨機(jī)IO比順序IO慢的問(wèn)題嗎?我們都知道磁盤(pán)的隨機(jī)IO要比順序IO慢的多(操作系統(tǒng)底層還專(zhuān)門(mén)實(shí)現(xiàn)了電梯調(diào)度算法來(lái)緩解這個(gè)問(wèn)題),那么內(nèi)存的隨機(jī)IO會(huì)比順序IO慢嗎?
要想徹底弄明白以上兩個(gè)問(wèn)題,我想我們得從內(nèi)存IO的物理過(guò)程中來(lái)尋找答案。 1先給你講個(gè)圖書(shū)管理員的故事
在開(kāi)始介紹枯燥的內(nèi)存工作原理之前。我想先給你講一個(gè)故事,并帶你去認(rèn)識(shí)一個(gè)人,圖書(shū)館的管理員。

在我們的這個(gè)故事中,你是故事的主角。你有一所房子,房子里有一個(gè)仆人,他每天幫你處理各種各樣的圖書(shū)數(shù)據(jù)。但是北京房?jī)r(jià)太貴,所以你的這個(gè)房子很小,只能放的下64本書(shū)。你家的馬路對(duì)面,就是北京圖書(shū)館(你家房子雖然小但是地段還不錯(cuò)),你所需要的所有的圖書(shū)在那里都可以找到。圖書(shū)館有個(gè)管理員,他負(fù)責(zé)幫你把你想要的書(shū)找出來(lái)。

圖1 圖書(shū)管理員的故事
好接下來(lái),故事開(kāi)始進(jìn)行!
場(chǎng)景1:
你發(fā)現(xiàn)你需要編號(hào)為0的書(shū)的計(jì)算結(jié)果,你的仆人穿過(guò)馬路告訴了圖書(shū)管理員,告訴他請(qǐng)幫我把第0-63本書(shū)取出來(lái)。圖書(shū)管理員幫你在電腦前查得該書(shū)在二樓。于是他,花了點(diǎn)時(shí)間坐電梯到了二樓。等到了二樓,他又花了點(diǎn)時(shí)間幫你找了出來(lái)。然后你的仆人抱著64本書(shū)放到了客廳,拿起第0本書(shū)幫你處理了起來(lái)。

場(chǎng)景2:

你發(fā)現(xiàn)你需要編號(hào)為1的書(shū)的計(jì)算結(jié)果,告訴你的仆人。你的仆人直接從客廳拿出來(lái)就可以處理了,這次你等的時(shí)間最短。

場(chǎng)景3:

你發(fā)現(xiàn)需要編號(hào)為65的書(shū),你又告訴你的仆人。你的仆人穿過(guò)馬路又去找了圖書(shū)管理員。圖書(shū)管理員還在二樓呢,聽(tīng)說(shuō)這次需要65-127,這次他不用再花時(shí)間找樓層了。只是花時(shí)間找書(shū)就可以了。你的仆人把65-127的書(shū)放到了客廳(以前的0-63就都扔了),并幫你開(kāi)始處理起65號(hào)書(shū)來(lái)。
場(chǎng)景4:
你發(fā)現(xiàn)你需要編號(hào)為10000的書(shū),你告訴了你的仆人。你的仆人穿過(guò)馬路去圖書(shū)館,找到了管理員。這次管理員查得你需要的書(shū)是在10樓,他得花點(diǎn)時(shí)間坐電梯過(guò)去。去了之后,他又得花點(diǎn)時(shí)間幫你找出來(lái)。

這四個(gè)場(chǎng)景里,我覺(jué)得你一定發(fā)現(xiàn)了不同情形下耗時(shí)的差異。

  • 場(chǎng)景1和場(chǎng)景4花費(fèi)的時(shí)間最多。因?yàn)閳D書(shū)管理員需要花時(shí)間坐電梯找樓層,需要花時(shí)間在樓內(nèi)找書(shū)。

  • 場(chǎng)景3次之,因?yàn)閳D書(shū)管理員直接就在樓層內(nèi),只需要花時(shí)間在樓內(nèi)找書(shū)既可

  • 場(chǎng)景2最快,因?yàn)橹恍枰腿藥湍銖目蛷d拿過(guò)來(lái)就好,連馬路都不需要過(guò)。

之所以編造這么一個(gè)例子,是因?yàn)閮?nèi)存的工作方式和它太像了。接下來(lái)我們進(jìn)入內(nèi)存的實(shí)際分析。

2內(nèi)存物理結(jié)構(gòu)

《帶你理解內(nèi)存對(duì)齊最底層原理》中我們了解了內(nèi)存顆粒的物理構(gòu)造以及IO過(guò)程,今天我們?cè)賮?lái)復(fù)習(xí)一下。

內(nèi)存是由chip構(gòu)成。每個(gè)chip內(nèi)部,是由8個(gè)bank組成的。其構(gòu)造如下圖:

圖2 內(nèi)存顆粒chip內(nèi)部結(jié)構(gòu)
而每一個(gè)bank是一個(gè)二維平面上的矩陣,前面文章中我們說(shuō)到過(guò)。矩陣中每一個(gè)元素中都是保存了1個(gè)字節(jié),也就是8個(gè)bit。

圖3 bank內(nèi)部物理結(jié)構(gòu)

每當(dāng)CPU向內(nèi)存請(qǐng)求數(shù)據(jù)的時(shí)候,內(nèi)存芯片總是8個(gè)bank并行一起工作。每個(gè)bank在定位到行地址后,把對(duì)應(yīng)的行copy到row buffer。再根據(jù)列地址把對(duì)應(yīng)的元素中的數(shù)據(jù)取出來(lái),8個(gè)bank把數(shù)據(jù)拼接一下,一個(gè)64位寬的數(shù)據(jù)就可以返回給CPU了。
圖4 一次內(nèi)存IO的過(guò)程示意

根據(jù)上面幾張圖我們可以大致了解內(nèi)存的IO過(guò)程,在這個(gè)過(guò)程中每一步操作之間都有一些延遲,讓我們來(lái)繼續(xù)了解這些延遲。

3內(nèi)存IO延遲

《從DDR發(fā)展到DDR4,內(nèi)存核心頻率指標(biāo)其實(shí)基本上就沒(méi)太大的進(jìn)步》里我們提到內(nèi)存的延遲很大程度是受核心頻率制約的,你也應(yīng)該記得我們提到了內(nèi)存延遲一般是通過(guò)CL-tRCD-tRP-tRAS四個(gè)參數(shù)來(lái)標(biāo)識(shí)的。我們今天來(lái)詳細(xì)理解一下這四個(gè)參數(shù)的含義:

  • CL(Column Address Latency):發(fā)送一個(gè)列地址到內(nèi)存與數(shù)據(jù)開(kāi)始響應(yīng)之間的周期數(shù)

  • tRCD(Row Address to Column Address Delay):打開(kāi)一行內(nèi)存并訪(fǎng)問(wèn)其中的列所需的最小時(shí)鐘周期數(shù)

  • tRP(Row Precharge Time):發(fā)出預(yù)充電命令與打開(kāi)下一行之間所需的最小時(shí)鐘周期數(shù)。

  • tRAS(Row Active Time):行活動(dòng)命令與發(fā)出預(yù)充電命令之間所需的最小時(shí)鐘周期數(shù)。也就是對(duì)下一次預(yù)充電時(shí)間進(jìn)行限制。

要注意除了CL是固定周期數(shù)以外,其它的三個(gè)都是最小周期。另外上面的參數(shù)都是以時(shí)鐘周期為單位的。因?yàn)楝F(xiàn)代的內(nèi)存都是一個(gè)時(shí)鐘周期上下沿分別各傳輸一次數(shù)據(jù),所以用Speed/2就可以得出,例如筆者的機(jī)器的Speed是1066MHz,則時(shí)鐘周期為533MHz。你自己的機(jī)器可以通過(guò)dmidecode命令查看:

# dmidecode | grep -P -A16 "Memory Device" Memory Device  ......  Speed: 1067 MHz  ...... 

和“圖書(shū)管理員”類(lèi)似,內(nèi)存芯片也有類(lèi)似的工作場(chǎng)景:

場(chǎng)景1:
你的進(jìn)程需要內(nèi)存地址0x0000為的一個(gè)字節(jié)的數(shù)據(jù),CPU這時(shí)候向內(nèi)存控制器發(fā)出請(qǐng)求,內(nèi)存控制器進(jìn)行行地址的預(yù)充電,需要等待tRP個(gè)時(shí)鐘周期。再發(fā)出打開(kāi)一行內(nèi)存的命令,又需要等待tRCD個(gè)時(shí)鐘周期。接著發(fā)送列地址,再等待CL個(gè)周期。最終將0x0000-0x0007的數(shù)據(jù)全部返回給了CPU。CPU把這些數(shù)據(jù)放入到了自己的cache里,并幫你開(kāi)始對(duì)0x0000的數(shù)據(jù)進(jìn)行運(yùn)算。
場(chǎng)景2:
你的進(jìn)程需要內(nèi)存地址0x0003的一個(gè)字節(jié)數(shù)據(jù),CPU發(fā)現(xiàn)發(fā)現(xiàn)它在自己的cache里存在,直接使用就好了。這個(gè)場(chǎng)景里其實(shí)根本就沒(méi)有內(nèi)存IO發(fā)生。
場(chǎng)景3:
你的進(jìn)程需要內(nèi)存地址0x0008的一個(gè)字節(jié)數(shù)據(jù),CPU的cache并沒(méi)有命中,于是向內(nèi)存控制器請(qǐng)求。內(nèi)存控制器發(fā)現(xiàn)行地址和上一次工作的行地址一致,這次只需要發(fā)送列地址后等待CL個(gè)周期,就可以拿到0x0008-0x0015的數(shù)據(jù)并返回給CPU了。
場(chǎng)景4:
你的進(jìn)程需要內(nèi)存地址0xf000的一個(gè)字節(jié)數(shù)據(jù),同樣CPU的cache并不命中,向內(nèi)存控制器請(qǐng)求。內(nèi)存控制器一看(內(nèi)心有些許的郁悶),這次行w地址又變了,得,和場(chǎng)景1一樣。繼續(xù)等待tRP+tRCD+CL個(gè)周期后,才能夠取到數(shù)據(jù)并返回。
實(shí)際的計(jì)算機(jī)的內(nèi)存IO過(guò)程中還需要進(jìn)行邏輯地址和物理地址的轉(zhuǎn)換,這里忽略不表。


4結(jié)論

其中場(chǎng)景1和場(chǎng)景4是隨機(jī)IO的情況,場(chǎng)景2無(wú)內(nèi)存IO發(fā)生,場(chǎng)景3是順序IO,。通過(guò)上面的過(guò)程描述我們可以得到結(jié)論。內(nèi)存也存在和磁盤(pán)一樣,隨機(jī)IO比順序IO要慢的問(wèn)題。如果行地址同上一次訪(fǎng)問(wèn)的不一致,則需要重新拷貝row buffer,延遲周期需要tRP+tRCD+CL。而如果是順序IO的話(huà)(行地址不變),只需要CL個(gè)周期既可完成。

我們接著估算下內(nèi)存的延時(shí),筆者的機(jī)器上的內(nèi)存參數(shù)Speed為1066MHz(通過(guò)dmidecode查得),該值除以2就是時(shí)鐘周期的頻率=1066/2=533Mhz。其延遲周期為7-7-7-24。

  • 隨機(jī)IO:這種狀況下需要tRP+tRCD+CL個(gè)時(shí)鐘周期,7+7+7=21個(gè)周期。但是還有個(gè)tRAS的限制,兩次行地址預(yù)充電不得小于24。所以我們得按24來(lái)計(jì)算,24*(1s/533Mhz) = 45ns
  • 順序IO:這種狀況下只需要CL個(gè)時(shí)鐘周期 7*(1s/533Mhz)=13ns


5擴(kuò)展,CPU的cache line虛擬內(nèi)存概念

因?yàn)閷?duì)于內(nèi)存來(lái)說(shuō),隨機(jī)IO一次開(kāi)銷(xiāo)比順序IO高好幾倍。所以操作系統(tǒng)在工作的時(shí)候,會(huì)盡量讓內(nèi)存通過(guò)順序IO的方式來(lái)進(jìn)行。做法關(guān)鍵就是Cache Line。當(dāng)CPU發(fā)現(xiàn)緩存不命中的時(shí)候,實(shí)際上從來(lái)不會(huì)向內(nèi)存去請(qǐng)求1個(gè)字節(jié),8個(gè)字節(jié)這種。而是一次性就要64字節(jié),然后放到自己的Cache中存起來(lái)。

用上面的例子來(lái)看,

  • 如果隨機(jī)請(qǐng)求8字節(jié):耗時(shí)是45ns
  • 如果隨機(jī)請(qǐng)求64字節(jié):耗時(shí)是45+7*13 = 136ns

開(kāi)銷(xiāo)也沒(méi)貴多少,因?yàn)橹挥械谝粋€(gè)字節(jié)是隨機(jī)IO,后面的7個(gè)字節(jié)都是順序IO。數(shù)據(jù)是8倍,但是IO耗時(shí)只有3倍,而且取出來(lái)的數(shù)據(jù)后面大概率要用,所以計(jì)算機(jī)內(nèi)部就這么搞了,通過(guò)這種方式幫你避免一些隨機(jī)IO!

另外,內(nèi)存也支持burst(突發(fā)傳輸)模式,在這種模式下可以只傳入一次行列地址,就命令內(nèi)存返回該內(nèi)存開(kāi)頭的連續(xù)字節(jié)數(shù)據(jù),比如64字節(jié)。這種模式下,只有第一次的8字節(jié)需要真正的行列訪(fǎng)問(wèn)延遲,后面的7個(gè)字節(jié)可以直接按內(nèi)存的數(shù)據(jù)頻率給吐出來(lái)。


免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問(wèn)題,請(qǐng)聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車(chē)的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車(chē)技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車(chē)工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車(chē)。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車(chē) 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶(hù)希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱(chēng),數(shù)字世界的話(huà)語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱(chēng)"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉