利用FPGA來(lái)實(shí)現(xiàn)RC6算法的設(shè)計(jì)與研究
引 言
RC6是作為AES(Advanced Encryption Standard)的候選算法提交給NIST(美國(guó)國(guó)家標(biāo)準(zhǔn)局)的一種新的分組密碼。它是在RC5的基礎(chǔ)上設(shè)計(jì)的,以更好地符合AES的要求,且提高了安全性,增強(qiáng)了性能。根據(jù)AES的要求,一個(gè)分組密碼必須處理128位輸入/輸出數(shù)據(jù)。盡管RC5是一個(gè)非常快的分組密碼,但它處理128位分組塊時(shí)用了2個(gè)64位工作寄存器;而AES目前在講究效率和簡(jiǎn)潔方面不支持64位操作,于是RC6修正這個(gè)錯(cuò)誤,使用4個(gè)32位寄存器而不是2個(gè)64位寄存器,以更好地實(shí)現(xiàn)加解密。利用FPGA來(lái)實(shí)現(xiàn)RC6算法,可以提高運(yùn)算速度。芯片設(shè)計(jì)為RC6算法處理器,輔助計(jì)算機(jī)處理器完成加解密操作,可以方便地實(shí)現(xiàn)對(duì)加解密的分析和研究。因此,此芯片可以作為協(xié)處理器來(lái)看待。
1 RC6算法
1.1 RC6算法概述
RC6秉承了RC5設(shè)計(jì)簡(jiǎn)單、廣泛使用數(shù)據(jù)相關(guān)的循環(huán)移位思想,同時(shí)增強(qiáng)了抵抗攻擊的能力,改進(jìn)了RC5中循環(huán)移位的位數(shù)不依賴(lài)于寄存器中所有位的不足。RC6新的特色是輸入的明文由原先2個(gè)區(qū)塊擴(kuò)展為4個(gè),另外在運(yùn)算方面則是使用了整數(shù)乘法,而整數(shù)乘法的使用則在每一個(gè)運(yùn)算回合中增加了擴(kuò)散(diffusion)的行為,并且使得即使很少的回合數(shù)也有很高的安全性。同時(shí),RC6中所用的操作可以在大部分處理器上高效率地實(shí)現(xiàn),提高了加密速度。RC6是一種安全、架構(gòu)完整而且簡(jiǎn)單的區(qū)塊加密法。它提供了較好的測(cè)試結(jié)果和參數(shù)方面相當(dāng)大的彈性。RC6可以抵抗所有已知的攻擊,能夠提供AES所要求的安全性,可以說(shuō)是近幾年來(lái)相當(dāng)優(yōu)秀的一種加密法。
RC6不再使用2個(gè)64位工作寄存器,而是用4個(gè)32位寄存器。這就使得在每次循環(huán)中要進(jìn)行2次循環(huán)移位操作,讓更多的數(shù)據(jù)位來(lái)決定循環(huán)次數(shù)。RC6把明文分別存在4個(gè)區(qū)塊A、B、C、D,剛開(kāi)始分別包含明文的初始值,加密運(yùn)算后則為4個(gè)密文的輸出值。
1.2 RC6的工作原理
RC6是參數(shù)變量的分組算法,實(shí)際上是由3個(gè)參數(shù)確定的一個(gè)加密算法族。一個(gè)特定的RC6可以表示為RC6一w/r/b,3個(gè)參數(shù)w、r和b分別為字長(zhǎng)、循環(huán)次數(shù)和密鑰長(zhǎng)度。AES中,w=32,r=20。本設(shè)計(jì)中,密鑰長(zhǎng)度b為128位(16字節(jié))。RC6用4個(gè)w位的寄存器A、B、C、D來(lái)存放輸入的明文和輸出的密文。明文和密文的第一個(gè)字節(jié)存放在A的最低字節(jié),經(jīng)過(guò)加解密后,得到的明文和密文的最后一個(gè)字節(jié)存放在D的最高字節(jié)。
1.2.1 RC6一w/r/b基本運(yùn)算
基本運(yùn)算共有如下6種:①模2w加算運(yùn)算,表示為“+”;②模2w減法運(yùn)算,表示為“一”;③逐位異或運(yùn)算,表示為“⊕”;④循環(huán)左移,字a循環(huán)左移b位表示為“a<<>>b”;⑥模2w乘法,表示為“×”。
1.2.2 RC6一w/r/b加密算法
輸入:明文存放在4個(gè)w位輸入寄存器A、B、C、D
式中:e一2.782 818 284 59…(自然對(duì)數(shù));φ=1.618 033 988 749…(黃金分割)
當(dāng)w分別為16、32、64時(shí),常數(shù)Pw、Qw分別如表1所列。在本設(shè)計(jì)中,w=16,輸入為128位的主密鑰,得到的是44個(gè)32位子密鑰。
2 RC6加解密算法協(xié)處理器設(shè)計(jì)
2.1 RC6協(xié)處理器的頂層結(jié)構(gòu)設(shè)計(jì)
RC6協(xié)處理器包含以下3個(gè)模塊:加解密模塊,加解密函數(shù)模塊和ROM模塊。頂層結(jié)構(gòu)如圖1所示。
加解密模塊:包括輸入和輸出、加/解密選擇、狀態(tài)機(jī),以及函數(shù)調(diào)用聲明和ROM調(diào)用取址。用于輸入128位明文或密文,并且利用一個(gè)狀態(tài)機(jī)定義程序順序執(zhí)行和保證循環(huán)控制,實(shí)現(xiàn)對(duì)ROM的44個(gè)子密鑰讀取,以及將數(shù)據(jù)輸入函數(shù)中進(jìn)行處理。由于輸入ROM的地址是在一個(gè)時(shí)鐘控制下,子密鑰數(shù)據(jù)的輸出有一定的延時(shí),所以利用一個(gè)控制變量cnt實(shí)現(xiàn)地址提前一個(gè)時(shí)鐘左右輸入ROM,ROM接收到后輸出子密鑰,使在進(jìn)行數(shù)據(jù)加解密處理時(shí),已經(jīng)有準(zhǔn)備好的子密鑰調(diào)用。
加解密函數(shù)模塊:利用work用戶自定義函數(shù)庫(kù),定義算法中用到的函數(shù)。其中包括5個(gè)函數(shù),分別是:RFunct、afunct、cfunct、lshift、rshift。頂層文件循環(huán)調(diào)用此函數(shù)21次,進(jìn)行加解密運(yùn)算。
ROM模塊:先在QuartusII里面將預(yù)定義的子密鑰輸入rc6keyrom.mif文件中,調(diào)用QuartusII的MegaWizardPlug—In Manager,自動(dòng)生成ROM,供頂層文件調(diào)用。需要提前利用QuartusII建立一個(gè).mif文件,將子密鑰的數(shù)據(jù)輸入。
2.2 RC6協(xié)處理器的頂層原理圖
如圖2所示,基于FPGA的RC6算法協(xié)處理器分3個(gè)模塊:頂層模塊、RC6加解密函數(shù)模塊和ROM模塊。共有260個(gè)I/0口,包括131輸入端口和129個(gè)輸出端口。
2.3 各模塊的功能及實(shí)現(xiàn)
2.3.1 ROM模塊
圖3為QuartusII自動(dòng)生成的ROM模塊。ROM取址需要由加解密模塊提供地址輸入,然后輸出子密鑰。輸入地址為address[4..0],輸出為q[63..0]兩個(gè)子密鑰一起輸出到主程序中進(jìn)行。
ROM模塊在輸入地址和得到子密鑰數(shù)據(jù)之間,有一定的延時(shí),從地址“00”輸入,開(kāi)始讀取到輸出子密鑰總時(shí)間約一個(gè)時(shí)鐘周期左右。所以在主函數(shù)調(diào)用ROM時(shí),需提前1~2個(gè)時(shí)鐘輸入地址。
由以上5個(gè)函數(shù)和加解密控制信號(hào),可以實(shí)現(xiàn)此算法的一次計(jì)算。主函數(shù)將需要進(jìn)行計(jì)算的128位數(shù)據(jù)da—tain、2個(gè)子密鑰keyl和key2,以及加解密控制信號(hào)輸入到RFunct函數(shù)里;函數(shù)rfunct將其分配到a、b、c、d四個(gè)寄存器,計(jì)算b=(b+b+1)×b和d=(d+d+1)×d;然后調(diào)用左移函數(shù)計(jì)算templ=b<<<5和temp2=d<<<5,調(diào)用afunct和cfunct計(jì)算a和c,再重組a、b、c、d為dataout,結(jié)束運(yùn)算后輸出dataout。
2.3.3 加解密控制模塊
如圖4所示,RC6加解密端口定義為:
輸入端口
reset:復(fù)位信號(hào),高電平有效?! lk:工作時(shí)鐘?! set:加解密選擇信號(hào),高電平為加密操作,反之則為解密操作?! eyin[63..O]:從ROM輸入的子密鑰輸入。 datain[127..O]:待加解密數(shù)據(jù)的輸入端。輸出端口
flag:加解密結(jié)束信號(hào),高電平有效?! eyad出[4..O]:向ROM輸入5位的地址信號(hào)?! ataout[127..O]:RC6加解密模塊輸出的128位加解密后的數(shù)據(jù)。模塊功能
從ROM模塊中,接收包含2個(gè)子密鑰的數(shù)據(jù)keyin,并在前32位和后32位分別為一個(gè)32位子密鑰,根據(jù)zset信號(hào)對(duì)密鑰和數(shù)據(jù)進(jìn)行加解密操作。
在主程序中利用一個(gè)狀態(tài)機(jī)來(lái)實(shí)現(xiàn)加解密運(yùn)算:第1個(gè)狀態(tài)進(jìn)行數(shù)據(jù)的初步處理,將128位數(shù)據(jù)分成4個(gè)32位數(shù)據(jù)保存在a、b、c、d這4個(gè)寄存器中;第2個(gè)狀態(tài)進(jìn)行數(shù)據(jù)的初步運(yùn)算,將結(jié)果保存在128位寄存器data中;第3個(gè)狀態(tài)和第4個(gè)狀態(tài)控制循環(huán)運(yùn)算與ROM進(jìn)行20次交互,一邊接收ROM子密鑰數(shù)據(jù),一邊對(duì)data進(jìn)行運(yùn)算,最后一個(gè)狀態(tài),接收最后2個(gè)密鑰,進(jìn)行最后的加解密運(yùn)算,得到新的a、b、c、d,重新組合成加/解密后的數(shù)據(jù),將其輸出。
2.3.4 加解密頂層模塊
RC6加解密算法的頂層模塊包括了加解密控制模塊和ROM模塊。輸入/輸出信號(hào)描述如下:
輸入信號(hào)
reset:復(fù)位信號(hào),高電平有效?! lk:工作時(shí)鐘?! set:加解密選擇信號(hào),高電平加密操作,反之則為解密操作?! atain[l27..0]:待加/解密數(shù)據(jù)的輸入端。輸出信號(hào)
flag:加解密結(jié)束信號(hào),高電平有效。 dataout[l27..0]:128位加解密后得到的數(shù)據(jù)。此加解密模塊需要260個(gè)I/0端口,如果加入串口通信,可將128位的輸入信號(hào)和輸出信號(hào)分別利用l位的輸入端口和1位的輸出端口來(lái)實(shí)現(xiàn)數(shù)據(jù)傳輸,非常方便。
2.4 仿真結(jié)果分析
圖5為RC6加解密算法的功能仿真圖,輸入和輸出是128位。當(dāng)輸入明文為128位全零數(shù)據(jù)時(shí),得到的加密結(jié)果是36A5C38F78F781564EDF29C11EA44898,解密結(jié)果是全零。另外,還測(cè)試了其他的一些數(shù)據(jù),根據(jù)官方公布的標(biāo)準(zhǔn),此加解密模塊功能正確。
在進(jìn)行仿真時(shí),RC6加解密模塊工作時(shí)鐘周期為100ns,頻率為10 MHz。從reset低電平開(kāi)始后的第一個(gè)時(shí)鐘上升沿(0.45μs),至加解密運(yùn)算結(jié)束并輸出結(jié)束信號(hào)flag(上升沿,8.958 376μs),總共耗時(shí)約為8.5μs。
圖5 RC6加解密算法功能仿真圖
結(jié) 語(yǔ)
本文基于FPGA技術(shù),實(shí)現(xiàn)了RC6算法。整個(gè)設(shè)計(jì)包括加解密函數(shù)模塊、加解密控制模塊、ROM模塊、UART模塊、輸入/輸出控制模塊等,通過(guò)軟件的仿真,并將程序下載到FPGA芯片進(jìn)行硬件調(diào)試,驗(yàn)證了設(shè)計(jì)的正確性和有效性。