當(dāng)前位置:首頁 > 嵌入式 > 嵌入式教程
[導(dǎo)讀]一種帶Cache的嵌入式CPU的設(shè)計(jì)與實(shí)現(xiàn)

 摘  要: 基于FPGA平臺(tái)實(shí)現(xiàn)了嵌入式RISC CPU的設(shè)計(jì)。根據(jù)項(xiàng)目要求,實(shí)現(xiàn)指令集為MIPS CPU指令集的一個(gè)子集,分析指令處理過程,構(gòu)建了嵌入式CPU的5級(jí)數(shù)據(jù)通路。分析了流水線產(chǎn)生的相關(guān)性問題,采用數(shù)據(jù)前推技術(shù)和軟件編譯結(jié)合的解決方案。給出了控制單元、運(yùn)算單元、指令Cache的實(shí)現(xiàn)與設(shè)計(jì)。在FPGA平臺(tái)上實(shí)現(xiàn)并驗(yàn)證了CPU的設(shè)計(jì)。

  隨著集成電路設(shè)計(jì)和工藝技術(shù)的發(fā)展,嵌入式系統(tǒng)已經(jīng)在PDA、機(jī)頂盒、手機(jī)等信息終端中被廣泛應(yīng)用。嵌入式系統(tǒng)具有電路尺寸小、成本低廉、可靠性高、功耗低等優(yōu)點(diǎn),是未來集成電路發(fā)展的方向。而作為嵌入式系統(tǒng)核心的微處理器,其性能直接影響整個(gè)系統(tǒng)的性能。為了提高CPU的效率和指令執(zhí)行的并行性,現(xiàn)代微處理器廣泛采用流水線設(shè)計(jì),所以,CPU流水線的設(shè)計(jì)成為決定其性能的關(guān)鍵。

  MIPS(Microprocessor without Interlocked Pipeline Stages)是一種典型的RISC(Reduced Instruction Set Computer)微處理器,在嵌入式系統(tǒng)領(lǐng)域中得到廣泛的應(yīng)用。MIPS32TM指令集開放,指令格式規(guī)整,易于流水線設(shè)計(jì),大量使用寄存器操作。與CISC(Complex Instruction Set Computer)微處理器相比,RISC具有設(shè)計(jì)更簡(jiǎn)單、設(shè)計(jì)周期更短等優(yōu)點(diǎn),并可以應(yīng)用更多先進(jìn)的技術(shù),開發(fā)更快的下一代處理器。

  1 基于MIPS指令集的CPU流水線結(jié)構(gòu)

  1.1 指令集的選取

  設(shè)計(jì)實(shí)現(xiàn)了指令兼容MIPS系列RISC處理器的指令集。由于MIPS32TM指令集是開放的指令集,指令格式非常簡(jiǎn)單,按照指令格式可分為寄存器類型(R-type)指令、立即數(shù)類型(I-type)指令和跳轉(zhuǎn)類型(J-type)指令。這三類指令均為32 bit,而且指令操作碼在固定的位置上。這種特點(diǎn)易于指令代碼的拆分,易于流水線CPU的設(shè)計(jì)。

  指令類型參考MIPS處理器的指令集設(shè)計(jì)原則。所有指令的運(yùn)算都在寄存器中進(jìn)行,當(dāng)需要與內(nèi)存交換數(shù)據(jù)時(shí),通過內(nèi)存訪問指令進(jìn)行內(nèi)存和寄存器的數(shù)據(jù)交換。設(shè)計(jì)實(shí)現(xiàn)程序中經(jīng)常使用的34條指令,實(shí)現(xiàn)指令集按照功能分成5種類型:算術(shù)運(yùn)算類指令、邏輯運(yùn)算類指令、數(shù)據(jù)傳送指令、條件轉(zhuǎn)移和無條件跳轉(zhuǎn)類指令、特殊指令等。

  1.2 流水線的設(shè)計(jì)

  在基本的MIPS處理器中有5個(gè)流水級(jí),其中各流水級(jí)定義與主要功能為:IF為計(jì)算下一條指令的地址PC,并從指令存儲(chǔ)器讀取指令;ID為對(duì)指令進(jìn)行譯碼,從寄存器堆中取出源操作數(shù);EX為當(dāng)指令是運(yùn)算類指令時(shí)執(zhí)行運(yùn)算,當(dāng)指令是轉(zhuǎn)移類指令時(shí)進(jìn)行有效地址計(jì)算;MEM為從數(shù)據(jù)存儲(chǔ)器讀寫數(shù)據(jù);WB為將數(shù)據(jù)寫回到寄存器堆。按照這一流水線結(jié)構(gòu),本文設(shè)計(jì)實(shí)現(xiàn)一種較為通用的MIPS CPU,通過VHDL語言實(shí)現(xiàn),各模塊之的關(guān)系如圖1所示。


  2 嵌入式CPU流水線中的相關(guān)性

  由于指令以流水線形式并行處理,必產(chǎn)生指令相關(guān)性問題,一般存在三種相關(guān):結(jié)構(gòu)相關(guān)、數(shù)據(jù)相關(guān)和控制相關(guān),引起流水線競(jìng)爭(zhēng)。

  結(jié)構(gòu)相關(guān)問題是指由于硬件資源不足而導(dǎo)致流水線不暢通,例如只有一個(gè)存儲(chǔ)器模塊時(shí),就不能對(duì)存儲(chǔ)器同時(shí)取指令和數(shù)據(jù)。數(shù)據(jù)相關(guān)問題是指一條指令的后續(xù)指令要使用該條指令的結(jié)果。而控制相關(guān)問題是指轉(zhuǎn)移指令從取指到轉(zhuǎn)向目標(biāo)地址要花幾個(gè)時(shí)鐘周期,但流水線CPU在每個(gè)周期都取指令。[!--empirenews.page--]

  解決結(jié)構(gòu)相關(guān)問題的方法是盡量增加硬件電路資源,本設(shè)計(jì)采用哈佛架構(gòu),使用指令存儲(chǔ)器和數(shù)據(jù)存儲(chǔ)器避免結(jié)構(gòu)競(jìng)爭(zhēng)。對(duì)于寄存器組存在的結(jié)構(gòu)競(jìng)爭(zhēng),采用由D-FF構(gòu)建寄存器予以避免,當(dāng)寫入地址和讀出地址相同時(shí),直接用寫入數(shù)據(jù)驅(qū)動(dòng)讀出總線。數(shù)據(jù)相關(guān)問題可以用數(shù)據(jù)前推技術(shù)得到緩解。數(shù)據(jù)前推技術(shù)對(duì)于ALU計(jì)算指令非常有效,但對(duì)于存儲(chǔ)器讀數(shù)據(jù)指令,如果下面的指令想立即使用其結(jié)果,則必須暫停流水線一個(gè)周期。至于控制相關(guān),可以使用指令重組優(yōu)化及延遲轉(zhuǎn)移技術(shù)等軟件編譯方法解決。

  3 關(guān)鍵模塊的實(shí)現(xiàn)

  3.1 ALU的實(shí)現(xiàn)

  ALU是數(shù)據(jù)通路中的重要部件,負(fù)責(zé)完成各種運(yùn)算功能。根據(jù)CPU要實(shí)現(xiàn)的指令集,確定出ALU的操作控制信號(hào)數(shù)據(jù)寬度為5 bit,運(yùn)算的數(shù)據(jù)位數(shù)為32 bit。操作控制信號(hào)(ALU_OP)和ALU的源數(shù)據(jù)選擇信號(hào)根據(jù)不同指令的譯碼由控制邏輯產(chǎn)生。

  3.2 控制單元的設(shè)計(jì)

  控制單元要根據(jù)輸入的指令碼產(chǎn)生一系列的控制信號(hào),用于控制數(shù)據(jù)通路上的多路選擇器和各功能部件,保證每一條指令都能夠正確執(zhí)行。

  控制單元的輸入信號(hào)必須設(shè)計(jì)為32 bit的指令碼,而輸出信號(hào)則要根據(jù)需要進(jìn)行設(shè)計(jì)。

  在IF階段,控制單元需要根據(jù)指令的譯碼情況,決定PC的更新值,如果是順序執(zhí)行的指令,則PC自動(dòng)加4,對(duì)于分支和跳轉(zhuǎn)指令,需要發(fā)出跳轉(zhuǎn)指令信號(hào)和分支指令信號(hào),從而決定PC的更新值。

  在ID階段,控制單元對(duì)指令進(jìn)行譯碼,根據(jù)指令的操作碼和功能部分,發(fā)出相應(yīng)的控制信號(hào);根據(jù)指令中的操作數(shù)字段,控制單元給出寄存器號(hào),從寄存器堆中讀出操作數(shù)送入ID與EXE之間的流水線寄存器。如果發(fā)生數(shù)據(jù)相關(guān),數(shù)據(jù)前置邏輯產(chǎn)生前置控制信號(hào)。

  在EXE階段,控制單元給出ALU數(shù)據(jù)來源的選擇信號(hào),以及ALU的運(yùn)算選擇信號(hào),

  在MEM階段,控制單元需要給出數(shù)據(jù)存儲(chǔ)器的讀寫信號(hào),片選信號(hào)等。存儲(chǔ)器需要向控制單元返回響應(yīng)信號(hào)。

  在WB階段,控制單元主要控制數(shù)據(jù)的流向,給出多路選擇器的選擇信號(hào),選擇將存儲(chǔ)器讀出的數(shù)據(jù)或ALU的運(yùn)算結(jié)果寫回寄存器組。

  3.3 數(shù)據(jù)前推技術(shù)的設(shè)計(jì)

  對(duì)于數(shù)據(jù)競(jìng)爭(zhēng)的檢測(cè),通過比較連續(xù)3條指令的寄存器標(biāo)號(hào),把本條指令的rs和rt及前面2條指令的操作數(shù)結(jié)果寄存器分別進(jìn)行比較,比較器的輸出信號(hào)傳遞到EXE階段用于選擇ALU操作數(shù)的來源。

  而對(duì)于LOAD指令發(fā)生的數(shù)據(jù)相關(guān),必須等到MEM階段完成之后才能得到有效的數(shù)據(jù),因此發(fā)生數(shù)據(jù)相關(guān)的下一條指令,只能通過延遲一個(gè)周期才能利用數(shù)據(jù)前置技術(shù),如果配合MIPS編譯器,通過使用延遲槽技術(shù)可以解決LOAD類型的數(shù)據(jù)相關(guān)。

  3.4 指令cache的實(shí)現(xiàn)

  系統(tǒng)實(shí)現(xiàn)了一個(gè)容量為2 KB指令Cache,每個(gè)Cache行為16 B數(shù)據(jù),這樣可以利用存儲(chǔ)器的16 B的突發(fā)式傳送。采用2路組相聯(lián)方式,支持通寫(Write Through)模式。由同步SRAM實(shí)現(xiàn)。

  數(shù)據(jù)Cache由控制模塊、命中與缺失比較模塊、訪問內(nèi)存模塊、替換模塊、輸出模塊組成。其中控制模塊是整個(gè)Cache的主控部件,它控制存儲(chǔ)器和cache協(xié)調(diào)工作:當(dāng)執(zhí)行單元有取指請(qǐng)求時(shí),以指令的物理地址作為索引看是否命中,如果不命中則控制邏輯啟動(dòng)訪存邏輯到內(nèi)存中去取指,當(dāng)指令取回時(shí)控制邏輯啟動(dòng)替換邏輯對(duì)指令Cache進(jìn)行替換并將指令輸出;如果命中,則將指令輸出。

  使用VHDL來設(shè)計(jì)和實(shí)現(xiàn)上述各關(guān)鍵模塊。綜合后的接口信號(hào)圖如圖2所示。

[!--empirenews.page--]
  對(duì)關(guān)鍵模塊和其他模塊進(jìn)行融合,最后得到的CPU流水線結(jié)構(gòu)圖如3所示。


  4 系統(tǒng)的仿真與驗(yàn)證

  使用VHDL實(shí)現(xiàn)對(duì)各功能模塊的設(shè)計(jì),并完成功能仿真后,將設(shè)計(jì)的控制單元和數(shù)據(jù)通路的各模塊進(jìn)行合并,形成一個(gè)完整的嵌入式RISC CPU核,進(jìn)行系統(tǒng)級(jí)仿真。基于系統(tǒng)實(shí)現(xiàn)的指令集編寫了一個(gè)簡(jiǎn)單的測(cè)試程序。

  add    $5.$0,$0

  addi   $7,$0,1

  sw    $7,10($5)

  lw    $8,10($5)

  將指令碼寫入指令存儲(chǔ)器的仿真文件,測(cè)試程序運(yùn)行得到的仿真波形圖如圖4所示。


  每個(gè)時(shí)鐘周期為10 ns,第一個(gè)時(shí)鐘周期T1從10 ns處開始,根據(jù)仿真波形可以看出,在T5周期,指令sw $7,10($5)處于EXE階段,第二條指令addi $7,$0,1處于MEM階段,需要進(jìn)行數(shù)據(jù)前推,F(xiàn)orward_2的值為”10”,通過對(duì)測(cè)試結(jié)果分析可以看出,數(shù)據(jù)前推成功。通過分析仿真波形圖中各個(gè)輸出信號(hào)的波形,根據(jù)程序的運(yùn)行過程,可以判斷信號(hào)波形正確,達(dá)到設(shè)計(jì)要求。

  本文給出了流水線CPU的關(guān)鍵模塊的VHDL實(shí)現(xiàn),經(jīng)過邏輯綜合和仿真,仿真結(jié)果表明在時(shí)序上設(shè)計(jì)的嵌入式CPU很好地滿足了流水線的要求。生成位流數(shù)據(jù)文件對(duì)FPGA進(jìn)行器件編程,F(xiàn)PGA芯片可以在50 MHz的時(shí)鐘頻率下穩(wěn)定的運(yùn)行。

 

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉