當前位置:首頁 > EDA > 電子設(shè)計自動化
[導讀]摘要:為了使基于FPGA設(shè)計的信號處理系統(tǒng)具有更高運行速度和具有更優(yōu)化的電路版圖布局布線,提出了一種適用于FPGA結(jié)構(gòu)的改進型WALLACE TREE架構(gòu)乘法器。首先討論了基于標準單元3:2壓縮器的改進型6:4壓縮器,根據(jù)FP

摘要:為了使基于FPGA設(shè)計的信號處理系統(tǒng)具有更高運行速度和具有更優(yōu)化的電路版圖布局布線,提出了一種適用于FPGA結(jié)構(gòu)的改進型WALLACE TREE架構(gòu)乘法器。首先討論了基于標準單元3:2壓縮器的改進型6:4壓縮器,根據(jù)FPGA中slice的結(jié)構(gòu)特點通過在FPGA Editer軟件工具編輯,對該壓縮器進行邏輯優(yōu)化,將其應(yīng)用于FPGA的基本單元slice結(jié)構(gòu)中。并對乘法器的其他部分結(jié)構(gòu)優(yōu)化整合,實現(xiàn)一個資源和性能達到合理平衡,且易于在FPGA中實現(xiàn)的乘法器。實際運行結(jié)果表明,該乘法器的關(guān)鍵路徑延時小于8.4 ns,使乘法器時鐘頻率和系統(tǒng)性能都得到很大提高。
關(guān)鍵詞:乘法器;WALLACE;FPGA;6:4壓縮器

    在數(shù)字信號處理中,乘法器是整個硬件電路時序的關(guān)鍵路徑。速度和面積的優(yōu)化是乘法器設(shè)計過程的兩個主要考慮因素。由于現(xiàn)代可編程邏輯芯片F(xiàn)PGA的集成度越來越高,及其相對于ASIC設(shè)計難度較低和產(chǎn)品設(shè)計周期短,受到很多廠家和研究機構(gòu)的關(guān)注。利用它的可編程和可擴展性,可將傳統(tǒng)乘法器設(shè)計方法應(yīng)用到FPGA芯片中。乘法器設(shè)計基本上是部分積的生成及其之間的相加的優(yōu)化過程。針對FPGA內(nèi)部固有結(jié)構(gòu)的特點,本文著重介紹了一種基于WALLACETREE優(yōu)化算法的改進型乘法器架構(gòu)。根據(jù)FPGA內(nèi)部標準獨特slice單元,有必要對WALLACE TREE部分單元加以研究優(yōu)化,從而讓在FPGA的乘法器設(shè)計中的關(guān)鍵路徑時延得以減小,整體時鐘性能得以提高。也能夠使FPGA的面積資源合理優(yōu)化,提高器件的整體資源利用率。

1 WALLACE TREE結(jié)構(gòu)
    WALLACE TREE是對部分積規(guī)約,減小乘法器關(guān)鍵路徑時延的一種算法。傳統(tǒng)WALLACE TREE結(jié)構(gòu)的CSA(Carry Save Adder)陣列乘法器如圖1所示,其中“·”代表生成的多個部分乘積項,相應(yīng)電路中用邏輯與門來實現(xiàn)。求和陣列將前面生成的多個部分積通過3:2 CSA壓縮器,將其壓縮成2個部分積,最后通過末級進位相加得到所需的最終乘積結(jié)果。圖中矩形框所示為3:2 CSA壓縮器,其電路邏輯等效于一個全加器結(jié)構(gòu)。通過運算可知N個部分積,要經(jīng)類似的log(2N/3)級3:2壓縮,就可得到2個部分積。



2 壓縮器的優(yōu)化
    由于FPGA內(nèi)部的結(jié)構(gòu)是固定的,沒有以上WALLACE TREE所需要的CSA標準全加器結(jié)構(gòu)。因此,在傳統(tǒng)的FPGA電路綜合實現(xiàn)時,該CSA全加
器被綜合在FPGA內(nèi)部查找表(LUT)和進位鏈中,占用了整個slice單元的資源。由于經(jīng)典WALLACETREE結(jié)構(gòu)不具有良好的對稱性且需要權(quán)重對齊等因素,勢必要增大FPGA電路的復雜度,增加大量的FPGA內(nèi)部布局和布線資源,在FPGA中不規(guī)則的布局布線結(jié)構(gòu),也增大了關(guān)鍵路徑的時延。
    為在FPGA中較好地實現(xiàn)WALLACE TREE結(jié)構(gòu),結(jié)合FPGA中最小標準單元的結(jié)構(gòu)silce,對CSA全加器單元結(jié)構(gòu)加以改進。如圖2所示,可將WALLACE TREE相鄰的平級3:2 CSA壓縮器合并成一個6:4壓縮器。該壓縮器只需使用1個FPGA的silce資源,就能實現(xiàn)其數(shù)字邏輯。下面以3×3乘法器為例,進行WALLACE TREE壓縮器的推導和優(yōu)化。如圖2的第一個部分積,部分積低位空白應(yīng)補0,高位空白位用該部分積的最高位補齊。


    下面對2個3:2 CSA壓縮器合并成一個6:4壓縮器單元運算邏輯做理論推導,其中:
   
    合并這兩項3:2壓縮為6:4壓縮時,A1B2和P23屬同級進位,在計算過程中可將這兩項的位置互換,因此上式可推導演化成:
   

3 改進CSA的FPGA實現(xiàn)
    Xilinx提供了一項強大的用戶界面軟件工具FPGA Editer,可以通過手動編輯和修改FPGA最基本的標準單元slice結(jié)構(gòu),使其符合所需要的邏輯。圖3左邊是一個WALLACE TREE 6:4壓縮的整體結(jié)構(gòu),右邊是實現(xiàn)架構(gòu)中一個6:4壓縮的FPGA內(nèi)部標準單元slice。slice電路中虛線是器件原有的預布線,實線是根據(jù)實際電路邏輯手動編輯后slice內(nèi)部電路布線。根據(jù)上一面的推導式(5)~(8),slice內(nèi)部的2個查找表(LUT)單元被配置成2輸入異或門單元。為了使整體WALLACE TREE布線齊整,還將式(7)直通邏輯實現(xiàn)也在該級slice壓縮器中完成,其中輸入電平A1B2經(jīng)過2個MUX和一個配置為1的常有效LATCH輸出到,形成一個直通電路。


    從圖3可以看出,WALLACE TREE的6:4壓縮器單元只用一個slice就可以實現(xiàn)。而幾乎所有Xilinx的FPGA器件內(nèi)部slice結(jié)構(gòu)都類似,因此該6:4壓縮器在基本的FPGA器件中都可以通過此手動編輯方法實現(xiàn),形成一個可供頂層WALLACETREE邏輯調(diào)用的硬宏模塊。

4 乘法器的FPGA實現(xiàn)和仿真
    在頂層乘法器WALLACE TREE邏輯架構(gòu)設(shè)計中,可以通過描述語言模塊例化來調(diào)用前面手動實現(xiàn)的6:4壓縮器,可將slice壓縮模塊看成一個FPGA中固有的IP硬宏模塊,調(diào)用方法與使用FPGA器件內(nèi)部的其他IP沒有區(qū)別。在FPGA Editer中對各個模塊相互位置按樹的層次和數(shù)字邏輯順序進行約束排列,形成一個約束文件。這樣FPGA芯片面積資源不僅得到充分的利用,在時序方面也會減小關(guān)鍵路徑的時延,提高時鐘頻率。
    該乘法器的末級加法器要把WALLACE TREE得到的最后2個部分積快速的相加得到最終結(jié)果。末級加法器的實現(xiàn)方法有CPA(Carry Propaga tion Adder),該加法器的利用超前進位,可以使進位鏈這個關(guān)鍵路徑的時序在邏輯上層次減小。但該加法器在FPGA綜合實現(xiàn)后形成復雜結(jié)構(gòu),帶來的是利用了很大的布局面積和布線資源。FPGA內(nèi)部結(jié)構(gòu)中以其特有縱向結(jié)構(gòu)的超級進位鏈,可將進位的器件延時和布線延時優(yōu)化??梢岳迷撨M位鏈,合理進行布局約束優(yōu)化,使進位鏈路徑時序減小。實踐表明,在16×16的加法器中,該進位鏈的時延只有6 ns左右,大大減小了整個乘法器關(guān)鍵路徑延時。在圖4中列出了本設(shè)計的FPGA布局布線布局布線后仿真結(jié)果。該結(jié)果在XILINX-Virtex5-VC5VSX35T器件中運行,通過ModelSim仿真輸出采集。multin_a和multin_b分別是16位乘數(shù),acc_out是相乘后輸出的32位結(jié)果,rst_n是復位清0信號。整個設(shè)計的硬件描述語言采用Verelog語言,其中例化了預先用FPGA Editer工具設(shè)計好的6:4硬宏壓縮模塊。


    圖5給出了WALLACE TREE乘法器設(shè)計的XILLNX-Virtex5-VC5VSX35T器件實際運行性能參數(shù)。該結(jié)果是FPGA器件以系統(tǒng)時鐘為120 MHz運行時,通過XILLNX公司ISE套裝軟件ChipScope采集獲取的數(shù)據(jù)。圖中,unt1和unt2采用FPGA內(nèi)部一個測試計數(shù)器輸出的16位無符號乘數(shù),將其輸入WALLACE TREE乘法器運算后,得到一組32位乘積結(jié)果。該實測結(jié)果表明,該結(jié)構(gòu)的乘法器能工作正常工作在120 MHz系統(tǒng)時鐘的條件下,其實現(xiàn)電路關(guān)鍵路徑的延時小于8.33ns。


    表1分別列出了16×16,24×24位乘法器在FPGA中用工具默認方法和本文方法生成的資源和時序?qū)φ請D??梢钥闯?,本文的結(jié)構(gòu)更合理,資源和速度都得到了一定程度的優(yōu)化。



5 結(jié)語
    本文根據(jù)FPGA內(nèi)部標準單元結(jié)構(gòu),提出了一種改進的WALLACE TREE 6:4壓縮器的新型邏輯結(jié)構(gòu),并用Xilinx提供的工具套件FPGA Edi-ter實現(xiàn)了該壓縮器單元。結(jié)合乘法器在FPGA中的仿真表明,該結(jié)構(gòu)的乘法器在提高系統(tǒng)的時鐘頻率和節(jié)省布局布線方面都有很大的優(yōu)勢。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉