當(dāng)前位置:首頁 > 模擬 > 模擬
[導(dǎo)讀]介紹了一種適用于較小面積應(yīng)用場合AES密碼算法的實現(xiàn)方案。結(jié)合該算法的特點,在常規(guī)輪變換中提出一種加/解密列混合變換集成化的硬件結(jié)構(gòu)設(shè)計,通過選擇使用同一個模塊,可以實現(xiàn)加密和解密中的線性變換,既整合了部分加/解密硬件結(jié)構(gòu),又節(jié)約了大量的硬件資源。仿真與綜合結(jié)果表明,加/解密運算模塊面積不超過25 000個等效門,有效地減小了硬件實現(xiàn)面積,同時該設(shè)計方案也滿足實際應(yīng)用性能的需求。

0 引言
    密碼模塊是安全保密系統(tǒng)的重要組成部分,其核心任務(wù)就是加/解密數(shù)據(jù)。目前,分組密碼算法AES以其高效率、低開銷、實現(xiàn)簡單等特點被廣泛應(yīng)用于密碼模塊的研制。隨著計算機信息技術(shù)和超大規(guī)模集成電路技術(shù)的成熟與發(fā)展,通過硬件來實現(xiàn)密鑰模塊的內(nèi)部運作,可保證在外界無密鑰的明文流動,能夠?qū)崿F(xiàn)真正意義上的保密。此外,硬件實現(xiàn)還具有高速、高可靠性等特點。目前許多AES算法的硬件實現(xiàn)采用基于RAM查找表方式來實現(xiàn)算法中最關(guān)鍵的SubBytes部分。本文采用復(fù)合域來實現(xiàn)SubBytes部分的求逆運算,以便于采用組合邏輯減小面積。同時采用加/解密運算中列變換的部分電路進行復(fù)用,從而進一步節(jié)省實現(xiàn)面積。這樣可以使AES密碼應(yīng)用于RFID系統(tǒng),IC卡等面積要求較小的場合。

1 AES算法簡介
    AES算法是一種迭代型分組密碼,其分組長度和密鑰長度均可變,各自可以獨立指定為128 b,192 b,256 b。本文主要討論分組長度和密鑰長度為128 b的情況。AES算法是將輸入的明文(或密文)分成16個字節(jié),在第一個Add Round Keys變換后進入10輪迭代。迭代過程的前9輪完全相同,依次經(jīng)過字節(jié)代替(substitute bytes)、行移位(shift rows)、列混合(mixcolumns)、輪密鑰加(add round keys),最后一輪則跳過了列混合(mix columns)。解密過程與加密過程類似,但執(zhí)行順序與描述內(nèi)容有所不同,因此AES算法的加解密運算需要分別實現(xiàn)。

2 AES算法的硬件設(shè)計
   
根據(jù)AES算法的原理和基本結(jié)構(gòu),將整個AES算法模塊分成4個相對獨立的子模塊:接口模塊、控制單元模塊、加解密運算模塊、密鑰擴展模塊。本文所設(shè)計的密碼算法不包括密鑰發(fā)生器,所用的密鑰通過接口模塊由外部輸入,加解密運算后的數(shù)據(jù)經(jīng)輸出接口輸出。AES算法模塊的總體結(jié)構(gòu)如圖1所示。


2.1 接口模塊的設(shè)計
    輸入接口模塊的主要任務(wù)是:將數(shù)據(jù)傳送到加解密運算模塊,將外部輸入的密鑰傳送到密鑰擴展模塊。由于明文和密鑰輸入都是128位,將導(dǎo)致整個模塊的輸入/輸出過多,占用太多資源,考慮到本文的設(shè)計主要應(yīng)用于對面積要求較小的場合使用,如RFID系統(tǒng)中數(shù)據(jù)的傳輸,即每次傳輸?shù)臄?shù)據(jù)是64位,故采用4個32位寄存器,在時鐘的控制下每次輸入1組32位,通過4個時鐘周期可得到128位的數(shù)據(jù),可以有效減少資源的占用。輸出接口模塊的作用是將128位的解密運算結(jié)果輸出,同樣也采取32位分4組輸出的方法。
2.2 控制模塊的設(shè)計
    控制模塊的主要任務(wù)是實現(xiàn)加/解密運算模塊與密鑰擴展模塊工作的啟動??刂颇K在時鐘脈沖控制下,產(chǎn)生控制加/解密模塊中字節(jié)替代、行移位、列混合、密鑰加各部分工作信號??捎?個兩狀態(tài)的狀態(tài)機實現(xiàn)控制。當(dāng)新的數(shù)據(jù)或密鑰輸入時,通過狀態(tài)機的信號可判斷上次加/解密運算是否完成。如果狀態(tài)機信號處于忙狀態(tài),說明加解密運算正在進行,需要等待;如果信號處于空閑狀態(tài),說明加解密運算已經(jīng)完成,可以啟動加解密運算模塊與密鑰擴展模塊,將數(shù)據(jù)和密鑰分別輸入到加解密運算模塊與密鑰擴展模塊中,開始新一組數(shù)據(jù)的加解密運算。
2.3 加解密運算模塊的設(shè)計
    AES算法的輪變換特點使之在硬件實現(xiàn)時可以有多種方式:串行方式,輪變換可采用組合邏輯實現(xiàn);在10輪迭代過程中,前一輪結(jié)果可直接作為下一輪的輸入;并在1個周期內(nèi)完成1個分組運算,使吞吐量達到最佳狀態(tài)。但需要大量的存儲器資源和組合邏輯資源支持,一般的FP-GA芯片難以滿足容量的需求,而且時鐘頻率非常低;基本迭代反饋方式,所有迭代只用1個輪變換模塊,10個時鐘周期完成1個分組運算,資源占用較少;輪內(nèi)流水線方式,在輪變換中插入寄存器,將每輪運算分成多個操作段,每個時鐘完成1個操作段,其優(yōu)點是可以提高算法運行的時鐘頻率。但輪內(nèi)各級流水部件不能同時執(zhí)行,因此增加了算法運行的時鐘數(shù)目。輪內(nèi)流水線級數(shù)越多,時鐘數(shù)目也越多,雖然算法仿真頻率可以達到很高,但吞吐量并沒有明顯提高。
    綜上比較可知,本文AES算法的硬件實現(xiàn)的目的是盡量減少資源的占用,使面積盡可能減小。故采用基本迭代反饋工作方式設(shè)計。
2.3.1 SubBytes()和InvSubBytes()的設(shè)計
    字節(jié)代替是整個AES硬件實現(xiàn)中最為重要的變換,在加解密運算模塊及密鑰擴展模塊中字節(jié)代替是主要的運算過程。因此,字節(jié)代替的硬件設(shè)計決定了整個AES算法硬件實現(xiàn)的速度和面積。字節(jié)代替可以通過查找表和算術(shù)運算的方式得到。傳統(tǒng)的AES算法使用查找表方法實現(xiàn)字節(jié)代替,可以提高求逆速度,但由于該變換輸入的數(shù)據(jù)為8位,加密和解密所用的替換字節(jié)表不同,因此需要的選擇器和寄存器數(shù)量較多,硬件實現(xiàn)面積較大,故主要用于高速AES的實現(xiàn)。算術(shù)運算的方式在硬件設(shè)計上表現(xiàn)為組合邏輯,采用算術(shù)運算的方式實現(xiàn)則會降低硬件設(shè)計的復(fù)雜度,減小面積。
2.3.2 ShiftRows()和InvShiftRows()的設(shè)計
    行移位變換作用在中間態(tài)的行上,將狀態(tài)中的行按不同的偏移量進行循環(huán)移位。加密運算中間態(tài)的0~3行,分別向右循環(huán)移動O,1,2,3個字節(jié)。該操作僅是將數(shù)據(jù)按字節(jié)進行移動,硬件實現(xiàn)時只需在布線上進行調(diào)整,基本不占硬件資源。
    解密過程只是行移位的逆變換,即分別向左循環(huán)移動0,1,2,3個字節(jié)。同樣,該操作也僅將數(shù)據(jù)按字節(jié)移動。如果有字節(jié)的位置改變,只需在布線上進行修改。
2.3.3 MixColumns()和InvMixColumns()的設(shè)計
    MixColumns()變換以矩陣中的列為單位,將每列看作一個GF(28)域上的四階多項式,將多項式乘以c(x)/d(x)并對x4+1取模。其中c(x)為:
   
    在相應(yīng)的解密過程中:
   
同樣對取模。
    為了降低整個模塊的復(fù)雜度,考慮將加解密運算中列混合變換的部分電路進行復(fù)用,對比加解密運算所乘的多項式,可以發(fā)現(xiàn){03}x可以用表示,同理:
   

這樣:
   
    由于,式(8)只需要4個異或門就可實現(xiàn)。將該單元記為xtime()函數(shù)。其硬件結(jié)構(gòu)如圖2所示。加密時所取的系數(shù)較小{01,02,03},所以只需經(jīng)過一次xtime()單元,便將乘法運算轉(zhuǎn)換為移位操作和加法運算的復(fù)合。


    而解密時,Mixcolumns()的系數(shù)是{09,OB,OE,OD),實現(xiàn)這些乘法顯然比加密時需要更多的時間。由式(3)可知,InvMixcolumns()也可用xtime()函數(shù)與異或門實現(xiàn)。這樣,就可以實現(xiàn)加/解密列混合變換電路的復(fù)用,從而節(jié)約電路面積,提高解密運算速度。
2.3.4 密鑰加AddRoundKey()的設(shè)計
    在AES算法中,加法用異或操作實現(xiàn)。密鑰加是中間狀態(tài)的每一字節(jié)按位與輪密鑰進行異或操作,加法的逆運算也用異或操作,所以可采用逐位異或操作實現(xiàn)加解密運算的AddRoundkey()。AddRoundkey()的逆運算是其自身。因此本文在常規(guī)輪中把加密時的密鑰加、列混合變換和解密時的密鑰加、列混合變換集成為同一模塊,通過加解密信號的選擇,實現(xiàn)加解密運算的列變換和密鑰加功能。這樣可消除加解密硬件結(jié)構(gòu)的差異,同時也可降低輪密鑰處理的復(fù)雜度。
2.4 密鑰擴展模塊的設(shè)計
    輪密鑰的產(chǎn)生是AES加解密運算的基礎(chǔ),密鑰擴展模塊的作用就是產(chǎn)生除了初始密鑰本身之外的10個輪密鑰,分別用于10輪加解密運算。
加密運算采用密鑰內(nèi)部擴展的方式,即加密運算與密鑰擴展并行完成。這一過程,每一輪變換都要和相應(yīng)密鑰擴展輪次生成的子密鑰進行異或,因此需使用狀態(tài)機控制加密運算和密鑰擴展的同步,否則會發(fā)生混亂。需要指出,使用內(nèi)部擴展方式可以提高整個加密運算速度。而解密運算采用外部擴展方式,即密鑰擴展完之后再進行解密運算,因為解密運算使用的初始密鑰是密鑰擴展生成的最后一輪子密鑰。

3 仿真測試與結(jié)果
   
根據(jù)前述設(shè)計思路和優(yōu)化措施,系統(tǒng)采用Mentor公司專門為各邏輯器件制造廠商設(shè)計的第三方專用仿真工具ModelSim 6.o進行功能仿真,給出了最后的功能仿真圖。
3.1 加密運算的仿真測試
    一次完整的加密操作,需要12個時鐘周期。其中,10個周期用于10個輪循環(huán)變換,1個時鐘周期用于初始的密鑰擴展,1個時鐘周期用于密文的輸出。加密運算的功能測試仿真波形如圖3所示。


    從圖3給出的加密運算功能仿真結(jié)果可以看出,加密運算與密鑰擴展過程是并行進行。當(dāng)“rst”變?yōu)榈碗娖剑?ldquo;ld”變?yōu)楦唠娖綍r,明文3243f6a8885a308d313198a2e0370734與密鑰2b7el5l628aed2a6abf7158809cf4f3c分別同時加載到加解密運算模塊與密鑰擴展模塊中;在下一個時鐘周期,密鑰擴展模塊生成1輪子密鑰,等待加密輪變換中的密鑰加操作。當(dāng)完成1次加密過程后,“done”信號變?yōu)楦唠娖剑瑫r輸出密文3925841d02dc09fbdc118597196a0632。從圖3中同時也可以看出,密鑰擴展模塊總是提前一個時鐘周期生成下一輪的子密鑰,這樣可以保證密鑰擴展與加密運算同時進行而不會發(fā)生錯亂,并且還可提高加密速度,節(jié)約資源占用和減少面積。使用DC進行綜合和優(yōu)化后,加密運算模塊面積不超過20 000個等效門,其中組合邏輯面積為14 264門,非組合邏輯面積為3 878門。
3.2 解密運算的仿真測試
    在解密過程中,完成一次解密操作同樣需要12時鐘周期。其中,10個周期用于10個輪循環(huán)變換,1個時鐘周期用于初始密鑰的加載,1個時鐘周期用于密文的輸出。在解密過程中,本文采用在解密之前所生成的10輪子密鑰,因為解密初始需要的子密鑰是密鑰擴展得到的最后一輪子密鑰,而最后一輪需要的子密鑰是密鑰擴展的初始密鑰。如圖4所示。


    解密過程與密鑰擴展過程不是同步的,當(dāng)“kld”為高電平時,從第1個時鐘周期開始,便將初始密鑰2b7e151628aed2a6abf7158809cf4f-3c輸入到密鑰擴展模塊中,之后經(jīng)過10個時鐘周期生成10輪子密鑰,并存儲到寄存器中。當(dāng)“ld”為高電平時,密文3925841d02dc09fbdcll-8597196a0632開始加載到解密模塊中,經(jīng)過10個時鐘周期將解密的密文輸出,同時“done”信號變?yōu)楦唠娖?,表示解密過程結(jié)束,并輸出明文3243f6a8885a308d313198a2e0370734。
    對比圖3與圖4仿真測試結(jié)果可知,加解密運算的功能正確,即解密運算能夠正確地解出加密運算的密文。解密運算模塊使用DC進行綜合和優(yōu)化后面積不超過25 000個等效門。其中組合邏輯面積為10 495門,非組合邏輯面積為14 142門。由于密鑰擴展與解密過程不是同步進行,占用了寄存器存儲解密過程所需的10輪子密鑰,所以非組合邏輯面積比加密運算模塊大。但需要指出,由于加/解密運算模塊部分電路采用復(fù)用的方法實現(xiàn),所以整個加/解密運算模塊的實際總面積比沒有復(fù)用時減小。

4 結(jié)語
    根據(jù)設(shè)計思路和優(yōu)化措施,本文使用Verilog硬件描述語言實現(xiàn)AES密碼算法,并在ModelSim 6.O工具下進行仿真,證明本文設(shè)計的正確性。為了更進一步做比較,證明本文設(shè)計思路的合理性和優(yōu)化措施的有效性,同樣采取未優(yōu)化的設(shè)計方案實現(xiàn)了該算法,通過在Dc中進行綜合、布線,兩相比較,優(yōu)化后的設(shè)計比優(yōu)化前節(jié)省了22%的邏輯單元,處理速度提高了13%。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉