當(dāng)前位置:首頁 > 嵌入式 > 嵌入式硬件

如何在提高精簡指令集處理器集成度和性能的同時,滿足該類處理器指令盡量少的要求是芯片設(shè)計(jì)工程師的一個重要挑戰(zhàn)。本文從MIPS處理器的發(fā)展過程闡述了采用緩存、64位處理器架構(gòu)以及超標(biāo)量技術(shù)應(yīng)對這種挑戰(zhàn)的方法,以及技術(shù)發(fā)展趨勢。

摩爾定律給IC設(shè)計(jì)工程師提出了極大的挑戰(zhàn),而對于精簡指令集(RISC)處理器芯片的設(shè)計(jì)工程師來說尤其如此。他們在盡量集成更多的晶體管的同時,還必須滿足該類處理器要求指令盡量少的特點(diǎn)。在最初定義MIPS處理器R2000及R3000的下一代產(chǎn)品時,我們力求在集成盡可能多的晶體管的同時,保持RISC的基本原則。以下的一些問題和趨勢為實(shí)現(xiàn)這種目標(biāo)指明了有效的方法,并在R4000處理器的設(shè)計(jì)中得到有效的應(yīng)用。

采用緩存器降低CPI

第一個問題是大型緩存對降低每條指令平均執(zhí)行周期(CPI)很重要,由緩存丟失引起的處理器停滯(stall)嚴(yán)重降低了 CPI性能。由于允許的最小緩存為指令和數(shù)據(jù)各8KB,因此在R2000和R3000處理器中必須采用外部緩存。然而CPI并非唯一決定因素,因?yàn)榭偟挠?jì)算吞吐量由IPC(1/CPI)和頻率的乘積決定,而在R2000和R3000中,處理器頻率同樣受到外部緩存的存取速度限制。針對內(nèi)部和外部緩存,描繪出最大頻率和最大緩存尺寸所對應(yīng)的頻率和IPC的乘積圖,便可以迅速進(jìn)行處理器性能評估。由于超過約32KB后CPI性能不再提高,而隨著頻率增加性能提升卻幾乎保持線性增長,因此集成緩存十分有利。對于采用1.0微米的R4000處理器而言,我們最高采用了8KB的指令和數(shù)據(jù)緩存。

在集成緩存條件下,通過對緩存的訪問可以實(shí)現(xiàn)流水線操作(pipelining),進(jìn)一步提高頻率。如果需要,還可以在地址解碼和陣列存取間增加流水線寄存器。對于R4000處理器來說,兩個周期的緩存訪問需要8級流水線,而在R2000和R3000處理器中則為5級流水線的單周期緩存存取。RISC架構(gòu)開創(chuàng)了一種稱為超流水線操作的精細(xì)流水線粒度的技術(shù),這種技術(shù)在x86架構(gòu)中得到最好的利用。增加流水線級數(shù)也會使用更多的晶體管,同時流水線長度也呈線性增長??刂七壿嫾皵?shù)據(jù)路徑邏輯也遵循這種線性增長原理。

64位尋址浮點(diǎn)運(yùn)算將成為發(fā)展趨勢

由于業(yè)界廣泛采用IEEE754浮點(diǎn)運(yùn)算標(biāo)準(zhǔn),以及在CAD、打印和影像市場中的大范圍應(yīng)用,浮點(diǎn)運(yùn)算的發(fā)展獲得更大的推動。一個可以支持除法及平方根運(yùn)算的完全流水線結(jié)構(gòu)浮點(diǎn)乘法累加器的復(fù)雜度近似于整數(shù)單元的復(fù)雜度,浮點(diǎn)運(yùn)算單元的主要數(shù)據(jù)類型是雙精度或64位浮點(diǎn)數(shù),它需要一個64位寬的數(shù)據(jù)通道進(jìn)行快速執(zhí)行。為了滿足64位浮點(diǎn)單元所需的數(shù)據(jù)要求,數(shù)據(jù)緩存也必須是64位。因此,必須有一個64位浮點(diǎn)單元和一個64位的數(shù)據(jù)緩存。
處理器的尋址位數(shù)增長很快,業(yè)界已使用過4、8和16位尋址,并迅速發(fā)展到32位,目前64位的MMU架構(gòu)和指令集擴(kuò)展已經(jīng)應(yīng)用在R4000處理器上,并將成為以后所有64位MIPS的實(shí)現(xiàn)基礎(chǔ)。而采用64位尋址并不意味著要使用64位整數(shù)單元。

目前64位尋址越來越普及,近年來英特爾和AMD公司相繼推出 64位處理器便是即是這種趨勢的明證。此外,64位數(shù)據(jù)操作也對逐漸崛起的高性能網(wǎng)絡(luò)市場帶來沖擊。綜合考慮,對64位尋址、滿足64位浮點(diǎn)單元的64位數(shù)據(jù)緩存、易于擴(kuò)展成向后兼容的64位架構(gòu)的32位RISC架構(gòu)的需要,以及對這種架構(gòu)會持續(xù)數(shù)十年的看法正在成為一種大的趨勢。在這種趨勢下,64位R4000處理器推向了市場。

在這種背景下,QED公司開發(fā)了采用MIPS架構(gòu)的處理器--R4600。這種處理器專門面對嵌入式市場,并得到多家網(wǎng)絡(luò)設(shè)備公司的大量應(yīng)用。R4600繼承了RISC的傳統(tǒng),擴(kuò)展了緩存容量以增強(qiáng)CPI性能,并采用指令集相關(guān)性(set associativity)來提高緩存效率。R4600采用了微軟為嵌入式系統(tǒng)應(yīng)用開發(fā)的Windows CE操作系統(tǒng),可應(yīng)用于機(jī)頂盒等產(chǎn)品中。

繼R4600和R4300處理器后,QED開發(fā)出了R5000處理器。R5000處理器在R4600上增加了工作站級浮點(diǎn)運(yùn)算,并將緩存大小增加到原來的兩倍。無論是網(wǎng)絡(luò)或打印市場,這款處理器都是第二代產(chǎn)品的設(shè)計(jì)基礎(chǔ)。

在處理器電路的設(shè)計(jì)中,采用先進(jìn)的工藝可以集成更多的晶體管。正如前面的分析,當(dāng)緩存增大到一定程度性能便難以明顯提高,顯然停滯時間的長短影響這一臨界點(diǎn)的位置。由于在處理器工作時,停滯時間長短會保持為一個常量,因此,如果DRAM的速度增長能與處理器速度增長保持一致則并不成問題。但是由于各種原因,DRAM的速率與處理器的速率并不一致,僅僅是其位數(shù)與處理速度增長保持一致。

由于DRAM的速率不能與處理器速度匹配,工程師采用構(gòu)建處理器的二級外部緩存來降低處理器與DRAM的速率差異。采用0.25微米工藝,可以經(jīng)濟(jì)地構(gòu)建一個帶有16KB指令和數(shù)據(jù)一級緩存以及256KB二級緩存的處理器。這些也是QED的RM7000的規(guī)范,RM7000是商用市場首個集成了二級緩存的微處理器。

超級標(biāo)量技術(shù)

除了集成了二級 緩存外,RM7000還采用了超標(biāo)量(Superscalar)技術(shù),可集成更多的晶體管。在1990-1995年間,超標(biāo)量技術(shù)已經(jīng)過廣泛測試,其各級并行指令處理的性價比都相當(dāng)好。對于注重功耗和成本的的應(yīng)用中,在增加相同的硬件和復(fù)雜性的條件下,采用一種簡單的雙向超標(biāo)量流水線可以獲得25-30%的性能提升。

最新的64位RM9000x2處理器基于MIPS架構(gòu),該處理器集成了兩個64位處理器,每個都集成了二級緩存。RM9000x2主要面向網(wǎng)絡(luò)基礎(chǔ)設(shè)施市場,帶有集成的DDR存儲器控制器以及高速HyperTransport I/O接口。處理器、存儲器及I/O全都通過一個封裝的交叉點(diǎn)陣(crossbar)連接,以實(shí)現(xiàn)高性能、與緩存完全一致的硅系統(tǒng)。

除了通過并行處理提供增強(qiáng)的系統(tǒng)性能外,RM9000x2還通過結(jié)合超標(biāo)量及超流水線技術(shù)增強(qiáng)了單個處理器的性能。采用超流水線技術(shù)和0.13微米工藝,RM9000x2每個內(nèi)核運(yùn)行速度可達(dá)1GHz。由于過去十年內(nèi)不斷降低超流水線的電壓,該處理器可以在功率敏感的嵌入式市場中得到應(yīng)用。CMOS集成電路的功率計(jì)算公式為P = kCV2f,其中V是電源電壓,f是工作頻率,因此即使流水線結(jié)構(gòu)提升了頻率,由于電壓降低,功耗仍然可以大大降低。x2型64位處理器內(nèi)核將被廣泛用于要求高性能處理的解決方案。例如,RM7000系列獨(dú)立處理器的擴(kuò)展系列,以及網(wǎng)絡(luò)、打印機(jī)及消費(fèi)類專用標(biāo)準(zhǔn)產(chǎn)品(ASSP)和CSSP

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉