當(dāng)前位置:首頁 > 嵌入式 > 嵌入式教程
[導(dǎo)讀]高性能32位移位寄存器單元的設(shè)計(jì)

1 引言

  本文給出了一種可用于32位以上CPU執(zhí)行單元的移位寄存器電路,并針對CISC指令集INTEL X86進(jìn)行了優(yōu)化(由于RISC指令集中移位類指令實(shí)現(xiàn)比較簡單,故沒有在文中討論);采用指令預(yù)處理的技術(shù)和通過冗余位,能很方便的實(shí)現(xiàn)帶進(jìn)位標(biāo)志 CF移位和設(shè)置CF位,并使得每條移位指令的平均執(zhí)行速度為兩個指令周期。它有效地提高了CPU對移位類指令的執(zhí)行性能,并且作為一個基本的內(nèi)核單元能很方便地移植到不同指令集(RISC或 CISC)的CPU設(shè)計(jì)之中。
 

  2 32位CPU中執(zhí)行單元總體結(jié)構(gòu)

  我們所設(shè)計(jì)的32位CPU的執(zhí)行部分采用雙總線結(jié)構(gòu),數(shù)據(jù)總線(Abus,Bbus)的寬度是32位。由于移位類指令如果用ALU進(jìn)行實(shí)現(xiàn)的話,必然會耗費(fèi)太多的CPU周期,為實(shí)現(xiàn)在一個指令周期內(nèi)對32位數(shù)據(jù)進(jìn)行任意位的移位操作,因此有必要在執(zhí)行單元中設(shè)計(jì)專用硬件移位寄存器,在執(zhí)行移位類指令時由它進(jìn)行32位數(shù)據(jù)的移位。

  圖1給出了32位CPU執(zhí)行單元總體結(jié)構(gòu)數(shù)據(jù)流結(jié)構(gòu)簡圖,并省略了所有控制信號。圖中Abus為雙向32數(shù)據(jù)總線,Bbus為單向32位數(shù)據(jù)總線。由于考慮到要實(shí)現(xiàn)INTEL X86系列所有的移位類指令(RCR,RCL,ROR,ROL等),所以移位寄存器在設(shè)計(jì)時采用雙輸入端,即實(shí)際該移位寄存器最大能實(shí)現(xiàn)64位移位。通過特殊的指令預(yù)設(shè)置方法,并通過增加冗余位實(shí)現(xiàn)標(biāo)志位的設(shè)置。

  

 

  3 移位寄存器單元的設(shè)計(jì)

  3.1 矩陣移位器和樹狀移位器

  在CPU中移位寄存器單元的設(shè)計(jì)一般采用的是矩陣結(jié)構(gòu)和樹狀結(jié)構(gòu)的移位器。

  3.1.1 矩陣結(jié)構(gòu)(Matrix Style)移位器

  它的結(jié)構(gòu)為一傳輸門組成的陣列。行數(shù)等于操作數(shù)據(jù)寬度,列數(shù)等于最多能移位數(shù)如圖2所示(以4位舉例)。

  

 

  其中A3~A0是4位數(shù)據(jù)輸入線,sh3~sh0是 4根控制信號線。每次進(jìn)行N位移位操作,對應(yīng)的shN為高,其它控制信號為低。

  這種結(jié)構(gòu)的優(yōu)點(diǎn)是:(1)數(shù)據(jù)傳輸?shù)乃俣瓤?,每個信號到達(dá)輸出端只經(jīng)過了一級傳輸,不受移位器位數(shù)限制;(2)版圖很規(guī)整。缺點(diǎn)是:(1)每根控制信號的負(fù)載太大,如32位移位器,每根信號線(sh0,sh1,……sh31)都要驅(qū)動32個開關(guān)管;(2)所需晶體管數(shù)目太多,如n位移位器所需晶體管數(shù)為2× n×n=2n2 (傳輸門部分采用CMOS實(shí)現(xiàn)),所帶來的功耗和芯片面積也會增加;(3)每一移位操作只需一根控制線為1,所以需輔以額外的譯碼單元。[!--empirenews.page--]3.1.2 樹狀結(jié)構(gòu)(Tree Style)移位器

 

  這種結(jié)構(gòu)M位移位器所需的級數(shù)是log 2M每一級都由兩根信號線(shn和sh n#)控制數(shù)據(jù)的傳輸,數(shù)據(jù)在第i級要么移動2 i位或者不移動。 樹狀移位器如圖3所示。

  

 

  這種結(jié)構(gòu)的優(yōu)點(diǎn)是:(1)晶體管數(shù)目少, n位移器所需晶體管數(shù)目為2×n×log n(傳輸門部分采用CMOS實(shí)現(xiàn)),版圖面積小于矩陣移位器;(2)控制信號shN~sh0本身就是二進(jìn)制表示,不需要額外的譯碼單元。缺點(diǎn)是:數(shù)據(jù)通路所需經(jīng)過的開關(guān)管數(shù)目太多,M位移位器所需的級數(shù)是log 2M,因此導(dǎo)致延時太大。

  3.2 矩陣-樹狀結(jié)構(gòu)移位器

  由上面的分析我們可以看出,如果所設(shè)計(jì)的處理器為16位以下CPU,那其移位器不管采用上述哪種方案都能達(dá)到要求,但當(dāng)數(shù)據(jù)寬度到32位以上,從功耗,速度及版圖面積考慮以上方案的固有缺點(diǎn)就會顯得非常突出。在本設(shè)計(jì)中,移位寄存器的實(shí)際輸入為64位,為結(jié)合矩陣結(jié)構(gòu)的優(yōu)點(diǎn)(速度快、版圖規(guī)整)和樹狀結(jié)構(gòu)的優(yōu)點(diǎn)(晶體管數(shù)目少、譯碼簡單),我們在設(shè)計(jì)中采用矩陣-樹狀結(jié)構(gòu)整個移位寄存器的是由雙總線輸入,即輸入64位,表1中列舉了不同級別比例的矩陣-樹狀結(jié)構(gòu)所需晶體管數(shù)目(n1為tree的級數(shù),n2為matrix的控制線,n3為matrix中用的晶體管數(shù)目)。經(jīng)過綜合考慮,我們采用第2行的矩陣-樹狀級別比例,即矩陣部分最大能實(shí)現(xiàn)8位移位,樹狀部分最大能實(shí)現(xiàn)4位移位。

  

 

  經(jīng)過各方面綜合考慮,我們所設(shè)計(jì)的移位寄存器的前級為矩陣結(jié)構(gòu)部分(輸入數(shù)據(jù)為64位,控制信號8位),由這一部分形成一36位的數(shù)據(jù)送入下一級樹狀結(jié)構(gòu)(輸入數(shù)據(jù)為36位,控制信號2位)部分再完成剩余的4位移位,形成32位輸出數(shù)據(jù)。結(jié)構(gòu)簡圖如圖4所示。

  

 

  在這個結(jié)構(gòu)中,后級的樹狀移位器最高實(shí)現(xiàn)3 位移位。輸入的2bit信號為2進(jìn)制碼,這兩位由移位計(jì)數(shù)器sh4~sh0直接將最低兩位送入(在后一節(jié)將介紹)。前級的矩陣結(jié)構(gòu)完成64位輸入36位輸出,我們設(shè)64位數(shù)據(jù)輸入由Abus,Bbus提供,如圖5所示。每一小格代表4位數(shù)據(jù)。這64位數(shù)據(jù)送入矩陣移位器后,根據(jù)計(jì)數(shù)器的高三位sh4~sh2 進(jìn)行譯碼對其進(jìn)行4,8,12,16,20,24,28,32中的一種移位(對應(yīng)8bits中的一位為高)。形成36位的數(shù)據(jù)輸出送入下級樹狀移位器以完成剩余位數(shù)的移位。36位數(shù)據(jù)輸出格式如圖6所示。其中COUNT表示總共移位數(shù)。

  

 

  

 

  4 指令的預(yù)處理及移位類指令的實(shí)現(xiàn)

  在我們設(shè)計(jì)的這片CPU中,需要對INTEL的 X86系列移位類指令進(jìn)行兼容。因此移位寄存器單元需要在周圍譯碼和鎖存單元的配合下,要能在一個指令節(jié)拍內(nèi)實(shí)現(xiàn)ROL,ROR,RCL,RCR, SHL,SHR,SAR,其中RCL,RCR實(shí)現(xiàn)了帶標(biāo)志位C的移位(指令說明見文獻(xiàn)[4])。因此需由處理器的控制單元在每類移位指令移位之前進(jìn)行指令的預(yù)處理。

  4.1 移位寄存器單元總體結(jié)構(gòu)

  最終設(shè)計(jì)出的移位寄存器單元總體結(jié)構(gòu)如圖7 所示,其中其核心部分的矩陣-樹狀結(jié)構(gòu)的移位寄存器就是使用上一節(jié)所描述的結(jié)構(gòu)。記數(shù)器中的數(shù)據(jù)(sh4~sh0)在移位上一拍由Bbus寫入,并進(jìn)行譯碼,其中低兩位(sh1,sh0)直接送樹狀結(jié)構(gòu)移位部分,高三位(sh4,sh3,sh2)經(jīng)過譯碼產(chǎn)生8位控制信號送入矩陣移位部分。Abus和Bbus輸入鎖存器能鎖存32位數(shù)據(jù)輸入,并根據(jù)不同指令的要求進(jìn)行操作,對指令進(jìn)行預(yù)處理。移位結(jié)果送ALU輸出鎖存器,并對CF寄存器進(jìn)行設(shè)置。

  

[!--empirenews.page--]4.2 指令的預(yù)處理

 

  由于要對實(shí)現(xiàn)帶進(jìn)位CF的移位并在移位操作后對CF進(jìn)行設(shè)置,在一般情況下這需要CPU的控制單元提供多周期指令節(jié)拍來實(shí)現(xiàn)。在本設(shè)計(jì)中,將 Abus和Bbus輸入鎖存器設(shè)計(jì)為能根據(jù)不同的指令實(shí)現(xiàn)清0和帶CF左移一位或右移一位的操作,以便為移位做好數(shù)據(jù)上的準(zhǔn)備,使輸入數(shù)據(jù)的0~32位移位能在一個指令周期內(nèi)完成。對不同的指令具體設(shè)置情況如圖8所示。圖中CF表示為進(jìn)位標(biāo)志位;len為操作數(shù)長度(如32位數(shù)據(jù)); n為移位數(shù);DATA表示輸入鎖存輸出的數(shù)據(jù)為操作數(shù)據(jù)本身; 0表示輸入鎖存輸出的數(shù)據(jù)為0;CF:DATA(-1)表示輸入鎖存輸出的數(shù)據(jù)為操作數(shù)帶CF右移一位;DATA(-1):CF表示輸入鎖存輸出的數(shù)據(jù)為操作數(shù)帶CF左移一位;SIGN_EXT表示輸入鎖存輸出的數(shù)據(jù)為操作數(shù)帶符號擴(kuò)展。橫線下為移位前Abus和Bbus鎖存器中數(shù)據(jù)預(yù)處理完后的格式,橫線上方位移位完成后數(shù)據(jù)輸出及進(jìn)位CF所處位置。

  

 

  例:RCL AX , CL 指令

  設(shè)AX=0001H , CL="3" , CF=1

  Abus鎖存器輸出數(shù)據(jù)為操作數(shù)本0001H;

  Bbus鎖存器輸出的數(shù)據(jù)為操作數(shù)帶CF右移一位為1000H;

  在輸出中,CF在輸出結(jié)果的最左端為0。

  5 驗(yàn)證及結(jié)論

  通過verilog的行為仿真及starsim的時序仿真顯示,性能完全符合要求。對比INTEL X86指令集中移位類指令標(biāo)準(zhǔn)執(zhí)行周期為4~7個機(jī)器周期,本設(shè)計(jì)移位類指令平均執(zhí)行時間為2個指令周期,因此大大提高了移位類指令執(zhí)行效率。移位寄存器作為CPU中執(zhí)行單元的專用硬件,其性能的好壞直接影響到CPU處理移位類指令的速度和效率。本文采用的矩陣-樹狀結(jié)構(gòu)移位寄存器,配合指令預(yù)處理技術(shù),能有效實(shí)現(xiàn)32位數(shù)據(jù)的移位操作,并兼容INTEL X86系列的所有移位類指令還可作為通用硬件方便地移植到其他指令級別的CPU設(shè)計(jì)之中。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉