在ARM微處理器上實(shí)現(xiàn)Rijndael加密算法
引 言
2000年10月2日,美國國家標(biāo)準(zhǔn)局NIST宣布,比利時(shí)密碼學(xué)家Joat Daemen和Vincent Rijmen設(shè)計(jì)的“RijndaeI算法”以安全性好、運(yùn)算速度快、存儲(chǔ)要求低、靈活性強(qiáng)最終當(dāng)選AES。該算法對(duì)目前的各種威脅是免疫的。這標(biāo)志著信息技術(shù)有了新的安全工具,為計(jì)算機(jī)網(wǎng)絡(luò)和電子商務(wù)的發(fā)展提供了強(qiáng)有力的保障。
在當(dāng)前數(shù)字信息技術(shù)和網(wǎng)絡(luò)技術(shù)高速發(fā)展的后PC時(shí)代,嵌入式系統(tǒng)技術(shù)已經(jīng)廣泛地滲透到科學(xué)研究、工程設(shè)計(jì)、軍事技術(shù)、各類產(chǎn)業(yè)和商業(yè)文化藝術(shù)以及人們的日常生活等方方面面中,成為目前最熱門的技術(shù)之一。
本文使用北京博創(chuàng)興業(yè)科技有限公司研制的UP-NETARM300嵌入式開發(fā)板,在ARM SDT 2.51集成開發(fā)環(huán)境下,建立基于μC/OS-Il操作系統(tǒng)的工程文件,分別調(diào)用ARM匯編程序和C程序在嵌入式微處理器上實(shí)現(xiàn)了Rijndael算法,并比較了兩者的效率。下面以分組長度和密鑰長度都是128位為例,介紹調(diào)用ARM匯編程序?qū)崿F(xiàn)加密算法的過程。本實(shí)現(xiàn)算法可以將密鑰長度擴(kuò)展
到192位或256位。
1 Rijndael加密算法簡介
1.1 算法流程結(jié)構(gòu)
Rijndael加密算法的128位輸入分組用以字節(jié)為單位的正方形矩陣描述。該數(shù)組被復(fù)制到State數(shù)組。加密過程分為四個(gè)階段:密鑰擴(kuò)展、輪密鑰加、Nr-1(對(duì)應(yīng)128、192、256位密鑰長度,Nr分別為10、12、14)輪變換及最后一輪變換。輪變換包括字節(jié)代換、行移位、列混淆和輪密鑰加四個(gè)過程,最后一輪變換包括字節(jié)代換、行移位和輪密鑰加三個(gè)過程。用偽C代碼表示如下:
Rijndael (State, CipherKey) {
KeyExpansion (CipherKey, ExpandKey); //密鑰擴(kuò)展
AddRoundKey (State, RoundKey); //輪密鑰加
For (i=1;i<Nr;i++)
Round (State, ExpandKey+4*i); //輪變換
FinalRound (State, ExpandKey+4 * Nr); //最后一輪變換}
Round (State, RoundKey){ //輪變換
SubByte (State); //字節(jié)代換
ShiftRow(State); //行移位
MixColumn(State); //列混淆
AddRoundKey(State, RoundKey); 輪密鑰加
FinalRound(State, RoundKey) { //最后一輪變換
SubByte(State);
ShiftRow(State);
AddRoundKey(State,RoundKey);
1. 2算法所使用的主要變換
(1)字節(jié)代換SubByte
用一個(gè)簡單的查表操作代替了基于矩陣乘法的復(fù)雜仿射變換。Rijndael定義了一個(gè)16×16字節(jié)的S盒矩陣,包含8位值所能表達(dá)的256種可能的變換。把Statc中每個(gè)字節(jié)的高4位作為行值,低4位作為列值,取出S盒中對(duì)應(yīng)行列的元素作為新的字節(jié)輸出。
行移位變換ShiftRow:State的第一行保持不變,第2、3、4行分別循環(huán)左移1、2、3個(gè)字節(jié)。
(2)列混淆變換MixColumn
可表示為如下基于系數(shù)矩陣CoefMix與State的矩陣乘法:
乘積矩陣中的每個(gè)元素S'i,j是系數(shù)矩陣中一行元素CoefMix[i,k]與State矩陣中對(duì)應(yīng)一列元素State[k,j]的乘積之和。這里的加法與乘法都定義在有限域GF(28)上:加法即按位異或操作,乘法遵循GF(28)上的多項(xiàng)式乘法規(guī)則。
(3)密鑰擴(kuò)展KeyExpanxsion
以4個(gè)字密鑰為輸入,生成44字?jǐn)U展密鑰數(shù)組ω[44],為初始輪密鑰加階段和后面10輪變換提供輪密鑰。輸入密鑰直接被復(fù)制到擴(kuò)展密鑰數(shù)組的前4個(gè)字,然后每次用4個(gè)字填充擴(kuò)展密鑰數(shù)組余下的部分。在擴(kuò)展密鑰數(shù)組中,ω[i]值依賴于ω[i-1]和ω[i-4]。ω?cái)?shù)組中下標(biāo)不是4的倍數(shù)時(shí),ω[i]為ω[i-1]和ω[i-4]的異或。下標(biāo)為4的倍數(shù)時(shí),首先將ω[i-1]的4個(gè)字節(jié)循環(huán)左移1個(gè)字節(jié),然后利用S盒對(duì)每個(gè)字節(jié)進(jìn)行字節(jié)代換,再與輪常量按位異或。輪常量是1個(gè)字,其最右邊3個(gè)字節(jié)為O,最左邊1個(gè)字節(jié)的值RC[j]與輪數(shù)j相關(guān)。RC[1]=1,RC[j]=2·RC[j-1],乘法定義在GF(28)上。RC[j]值以十六進(jìn)制表示。
(4)輪密鑰加AddRoundKey
是基于State列的操作,即把State一列中的4個(gè)字節(jié)與輪密鑰RoundKey的1個(gè)字進(jìn)行“異或”。
2 ARM匯編編程實(shí)現(xiàn)Rijndael算法的要點(diǎn)
2. 1源程序組成及功能
源程序包含main.c和ARM匯編程序Rijndael.s。main.c用C語言編寫,主要完成調(diào)用μC/OS-II函數(shù)進(jìn)行系統(tǒng)初始化及I/O的全部功能,并調(diào)用Rijndael.s對(duì)明文加密。明文、密鑰及密文均在開發(fā)板顯示屏上輸出。
Rijndael.s用ARM匯編編程語言編寫,是實(shí)現(xiàn)加密算法的關(guān)鍵程序。
2. 2 Rijndael.s程序?qū)崿F(xiàn)加密算法步驟
Rijndael.s主要通過ARM匯編子程序調(diào)用完成加密算法,包括1個(gè)代碼段和1個(gè)數(shù)據(jù)段。它把算法所使用的所有變換均用同名ARM匯編子程序?qū)崿F(xiàn)。代碼段包括以下幾個(gè)模塊:
首先,進(jìn)行明文、密鑰預(yù)處理。明文可以從開發(fā)板鍵盤上接收,也可以是常量或參數(shù)傳遞過來的變量。
其次,調(diào)用子程序KeyExpansion完成密鑰擴(kuò)展。
第三,調(diào)用子程序AddRoLundKey完成初始輪密鑰加。
第四,輪變換。包括四個(gè)步驟:①調(diào)用于程序SubByte進(jìn)行字節(jié)代換;②調(diào)用子程序ShiftRow進(jìn)行行移位;③調(diào)用子程序MixColumn進(jìn)行列混淆;④調(diào)用子程序Ad-dRoundKey進(jìn)行輪密鑰加。本過程重復(fù)9次。
第五,最后一輪變換。包括三個(gè)步驟:①調(diào)用子程序SubByte進(jìn)行字節(jié)代換;②調(diào)用子程序ShiftRow進(jìn)行行移位;③調(diào)用子程序AddRoundKey進(jìn)行輪密鑰加。
最后,對(duì)生成的密文進(jìn)行進(jìn)一步處理,即把密文視為4×4數(shù)組,將其行與列對(duì)調(diào)。
在數(shù)據(jù)段中對(duì)轉(zhuǎn)換過程中使用到的部分?jǐn)?shù)據(jù)或中間變量進(jìn)行了定義并初始化。如字節(jié)代換中的S盒及列混淆變換中的系數(shù)矩陣等。
2.3 ARM匯編子程序代碼設(shè)計(jì)舉例
在所有子程序中,列混淆變換和密鑰擴(kuò)展的代碼設(shè)計(jì)難度較高,算法較復(fù)雜。下面是列混淆子程序的代碼設(shè)計(jì):
MixColumn ;子程序入口
ldr r0,=State ;取變量地址
ldr r1,=CoefMix
ldr r2,=Temp ;Temp中間變量
mov r3,#0 ;i=0
loop_i ;i循環(huán)入口
mov r4,#0 ;j=0
loop_j ;j循環(huán)入口
mov r5,#0 ;k=0
loop_k ;k循環(huán)入口
mov r6,r3,lsl #2
add r6,r6,r5
ldrb r6,[r1,r6] ;讀取CoefMix[i,k]
mov r7,r5,lsl #2
add r7,r7,r4
ldrb r7,[r0,r7] ;讀取State[k,j]
loop_temp ;此循環(huán)用來計(jì)算
mov r8,r3,lsl #2
add r8,r8,r4
and r9,r6,#1
cmp r9,#1 ;判斷CoefMix[i,k]的最低位是否為1
bne notequal ;若不為1,轉(zhuǎn)向執(zhí)行
ldrb r9,[r2,r8] ;若為1,則Temp[i,j)+=State[k,j]
eor r9,r9,r7
strb r9,[r2,r8]
notequal
mov r6,r6,lsr #1 ;CoefMix[i,k]邏輯右移1位
and r9,r7,#0x80
mov r7,r7,lsl #1 ;State[k,j]邏輯左移1位
and r7,r7,#0xff
cmp r9,#0x80 ;移位后State[k,j]最高位是否為1
blt littlethan ;如不為1,轉(zhuǎn)向執(zhí)行
eor r7,r7,#0xlb ;如為1,則State[k,j]與#0xlb異或littlethan
cmp r6,#0 ;CoefMix[i,k]與0比較
bgt loop_temp ;如大于0,轉(zhuǎn)到標(biāo)號(hào)loop_temp處執(zhí)行,否則讀取CoefMix[i,k+1]
add r5,r5,#1
cmp r5,#4
blt loop_k ;執(zhí)行k循環(huán)
add r4,r4,#1
cmp r4,#4
blt loop_j ;執(zhí)行j循環(huán)
add r3,r3,#1
cmp r3,#4
blt loop_I ;執(zhí)行i循環(huán)
mov r3,#0
renew ;用Temp更新State
ldrb r4,[r2,r3]
strb r4[r0,r3]
add r3,r3,#1
cmp r3,#16
blt renew
MixColumnend
mov pc,lr ;子程序返回
3 Rijndael加密算法實(shí)現(xiàn)效率比較
在調(diào)用ARM匯編程序?qū)崿F(xiàn)Rijndael加密算法之余,還在嵌入式微處理器ARM上通過調(diào)用C子程序?qū)崿F(xiàn)了Rijndael算法,同樣獲得了正確結(jié)果。表1、表2是兩種實(shí)現(xiàn)方式的空間與時(shí)間效率比較。
由表1知,ARM子程序比C子程序所占用的空間明顯小得多,前者僅為后者的55%。由表2,運(yùn)行一次ARM匯編程序Rijndael.s程序完成加密算法,僅需約0.657 tick(此處,1000 tick=1s),而運(yùn)行一次c子程序約需0.996 tick,比前者增加了52%。
結(jié)語
高級(jí)加密標(biāo)準(zhǔn)Rijndael算法在嵌入式微處理器ARM上的實(shí)現(xiàn)具有一定的實(shí)用價(jià)值。經(jīng)University of Califor-nia,San Diego在因特網(wǎng)上提供的測(cè)試程序Interactive Ri-jndael Test Vectors in JavaScript驗(yàn)證,本實(shí)現(xiàn)算法是正確的。