Cortex--M0單片機二-十進制整數(shù)轉(zhuǎn)換的快速算法
為了提高Cortex—M0系列單片機應(yīng)用系統(tǒng)的二進制到十進制BCD碼整數(shù)轉(zhuǎn)換代碼的執(zhí)行效率,采用除十求余數(shù)法來實現(xiàn)。該快速算法的核心內(nèi)容是通過高效的匯編語言來實現(xiàn)常數(shù)除法,無論在程序代碼的運行時間和存儲空間上,都遠勝于sprintf函數(shù)。
在單片機應(yīng)用系統(tǒng)中,一般都需要高效快速地完成系統(tǒng)所需要的任務(wù),并在任務(wù)完成后使系統(tǒng)進入睡眠或低功耗狀態(tài),以便最大限度地節(jié)省系統(tǒng)功耗,增強系統(tǒng)的抗干擾能力。因此,必須優(yōu)化和提高系統(tǒng)中各個模塊的運算速度,以最大限度地壓縮軟件運行時間。許多單片機應(yīng)用系統(tǒng)中都需要進行二進制整數(shù)轉(zhuǎn)換為十進制BCD碼的操作,以便實現(xiàn)系統(tǒng)信息的顯示。對于Cortex—M0系列單片機,由于其指令系統(tǒng)中沒有十進制調(diào)整指令和除法指令,使得一些文獻中提供的高效算法和技巧不再適用于這類單片機,從而造成上述轉(zhuǎn)換操作成為影響系統(tǒng)性能的重要因素,因此提高上述數(shù)制轉(zhuǎn)換速度對于提高系統(tǒng)運行效率有極大的促進作用。
1 傳統(tǒng)的實現(xiàn)方法
要實現(xiàn)快速運算,很自然地想到經(jīng)典的雙字節(jié)二進制整數(shù)轉(zhuǎn)換成3字節(jié)BCD碼整數(shù)的子程序。其采用的算法是預(yù)先將一個3字節(jié)隊列的內(nèi)容清除為0,然后依次將需要變換成BCD碼的二進制整數(shù)的每位依次左移至CY位,再把3字節(jié)隊列中的數(shù)據(jù)帶進位自身相加,并對相加的結(jié)果進行十進制調(diào)整。通過16次移位完成運算,結(jié)果為壓縮格式的3字節(jié)BCD編碼。由于ARM指令系統(tǒng)中沒有類似于MCS-51單片機系統(tǒng)中的十進制調(diào)整指令,所以在Cortex—M0系列單片機上實現(xiàn)該算法比較困難。
2 快速算法概述
本快速算法采用除十求余數(shù)法來實現(xiàn)。設(shè)需要轉(zhuǎn)換的數(shù)據(jù)也就是被除數(shù)為W,除數(shù)為10,整數(shù)除法的商為S,除法運算的余數(shù)為R,根據(jù)數(shù)學運算規(guī)則有:
S=W/10 (1)
R=W-S×10=W-(W/10)×10 (2)
經(jīng)過上述的運算,所得余數(shù)R就是從被除數(shù)中分離出來的個位數(shù)字,也就是首先得到了被除數(shù)的最低位的BCD碼。為了獲取被除數(shù)其他位的BCD碼,只需要將上面得到的商S作為新的被除數(shù)W,然后重復(fù)執(zhí)行上述整數(shù)除法運算,就可以分別得到被除數(shù)其他位上的BCD碼,從而完成將二進制數(shù)轉(zhuǎn)換為BCD碼的操作。實現(xiàn)上述操作的關(guān)鍵在于如何快速地完成除數(shù)為10的快速除法任務(wù)。
3 除法運算的實現(xiàn)
為了將被除數(shù)除以10,可以將其轉(zhuǎn)化為將被除數(shù)乘以0.1來實現(xiàn),為此可以先寫出十進制數(shù)據(jù)0.1所對應(yīng)的二進制小數(shù)的表示形式:
(0.1)D=0.000 1100 1100 1100 1100 1100 1100 1100 1100 1100……為方便32位單片機進行整數(shù)運算,預(yù)先將上式中的二進制數(shù)左移35位,即將其擴大235倍后得到除數(shù)10的魔術(shù)數(shù)(MagIC_Number)為:
Magic_Number=CCCCCCCDH(十六進制數(shù))當?shù)玫匠龜?shù)10的魔術(shù)數(shù)后,將被除數(shù)與該魔術(shù)數(shù)相乘,然后將所得的乘積右移35位,即將乘積縮小235倍后得到最終的數(shù)據(jù)就是所期望的除法結(jié)果。
由于Cortex—M0系列單片機的乘法指令只能保留兩個32位數(shù)相乘后的乘積的低32位,乘積的高32位被舍棄,所以不能直接采用被除數(shù)與除數(shù)的魔術(shù)數(shù)相乘的方法來實現(xiàn)將除法轉(zhuǎn)換為乘法的運算。好在這個魔術(shù)數(shù)很有特點,可以將其表示為:
Magic_Number=C0000000H+0C000000H+0CC0000H+0CCCCH (3)由于是通過求余數(shù)的方法來獲取原始數(shù)據(jù)的各位BCD碼,所以在不損失運算精度的原則下,舍棄了原魔術(shù)數(shù)Magic_Number的最低位,但這不妨礙最后通過式(2)來求余數(shù)的操作。下面就是對式(1)中的除10操作變換為乘法操作的具體實現(xiàn)方法:
通過(4)式,采用Cortex—M0系列單片機指令中的移位指令和加減法指令的組合運算就可以快速地得到整數(shù)除法的商S,進而采用式(2)來求余數(shù)R。
4 算法中除法運算的匯編代碼實現(xiàn)
Cortex—M0系列單片機采用Thumb指令集,式(4)中各數(shù)據(jù)項中的分數(shù)項都可以利用該指令集中的右移指令來實現(xiàn),并且采用多次累加的辦法來完成運算。下面給出具體的匯編語言源程序:
結(jié)語
Cortex—M0系列單片機的開發(fā)一般采用集成開發(fā)環(huán)境,為方便使用,可以將上面的子程序封裝成符合集成開發(fā)環(huán)境調(diào)用規(guī)則的函數(shù),封裝時最好包含有將單字節(jié)、雙字節(jié)、三字節(jié)和四字節(jié)數(shù)據(jù)轉(zhuǎn)化為BCD碼的多個函數(shù)。為測試該函數(shù)的性能,在IAR集成開發(fā)環(huán)境下,將General options→Library Options選項卡中的Printf formatter設(shè)置成Tiny模式,以便盡量減小Sprintf函數(shù)的代碼長度和運行時間。為敘述方便,這里假定封裝好的函數(shù)名為Hex2Bcd,表1給出其與系統(tǒng)函數(shù)sprintf的指令運行周期數(shù)(CCSTEP)的對比數(shù)據(jù)。
由表1可以看出,Hex2Bcd函數(shù)的平均運行時間不足sprintf函數(shù)的5%,速度優(yōu)勢極其明顯。另外Hex2Bcd函數(shù)的程序代碼僅有100字節(jié)左右,遠少于sprintf函數(shù)的1.5 KB,極大地節(jié)省了存儲空間。因此,本文中的快速算法具有很強的實用性,值得推廣應(yīng)用。