ADSP-TSl01S嵌入式系統(tǒng)的混合編程

時間：2007-04-17 22:13:00

關(guān)鍵字：嵌入式系統(tǒng) 混合編程 ADSP-TS BSP

手機(jī)看文章

掃描二維碼
隨時隨地手機(jī)看文章

[導(dǎo)讀]ADSP-TSl01S嵌入式系統(tǒng)的混合編程

摘要 C語言和匯編語言混合編程兼顧了程序的高效率和可讀性，已經(jīng)成為DSP芯片嵌入式系統(tǒng)開發(fā)的一種流行的編程方法。闡述基于ADI公司的ADSP-TSl01 DSP的C語言和匯編語言混合鳊程應(yīng)遵循的接口規(guī)范以及C程序的優(yōu)化方法。
關(guān)鍵詞 ADSP-TSl01S C語言匯編語言混合編程

ADSP-TSl01S是美國ADI公司推出的一款具有極高性能的數(shù)字信號處理器(DSP)芯片，其專為大信號處理任務(wù)和通信應(yīng)用進(jìn)行了結(jié)構(gòu)上的優(yōu)化設(shè)計，在嵌人式信號處理中得到廣泛應(yīng)用。ADSP-TSl01S的軟件設(shè)計可以采用匯編語言、高級語言(C/C++)或高級語言與匯編語言混合編程。完全采用匯編編程，執(zhí)行效率高，但對于復(fù)雜算法編寫難度大，開發(fā)周期長，可讀性和可移植性差；而完全采用C編程雖然可以彌補(bǔ)匯編的缺陷，但是程序的執(zhí)行效率相對較低，大概只有匯編程序的10％～20％，對于實(shí)時性要求很高的處理，如雷達(dá)信號處理，很難滿足要求。采用混合語言編程，用c語言構(gòu)建框架，用匯編完成運(yùn)算量較大的核心處理模塊及硬件底層管理，就可以把兩者的優(yōu)點(diǎn)有效地結(jié)合起來。C和匯編語言的混合編程有三種形式：一是對C程序編譯后形成的匯編程序進(jìn)行手工修改與優(yōu)化；二是直接在C代碼中插入?yún)R編語句，只需在匯編語句兩邊加上雙引號和括號，在括號前面加上標(biāo)識“asm"，如asm(“匯編語句”)；三是分別編寫C程序和匯編程序，再獨(dú)立編譯成目標(biāo)代碼模塊鏈接。第一種方法對程序可讀性負(fù)面影響較大。第二種方法適用于C與匯編效率差異較大的情況，如進(jìn)入中斷的中斷子程序等。第三種方法最常用，需要遵循一些規(guī)定的接口規(guī)范和標(biāo)準(zhǔn)。

1 混合編程的接口規(guī)范和標(biāo)準(zhǔn)
    ①在C／C++環(huán)境下，TigerSHARC定義了一套嚴(yán)格的寄存器規(guī)則，它分為三類：
    第一類是保留寄存器，j16～j25、k16～k25、xr24～xr31、yr24～yr31，共40個，作為編譯系統(tǒng)庫函數(shù)專門使用的寄存器。編寫程序時應(yīng)避免使用這些寄存器，以免誤改了系統(tǒng)庫函數(shù)。若在子程序中使用到，必須在被調(diào)用時保存，調(diào)用完后釋放。
    第二類是堆棧專用寄存器，k26、27和j26、j27四個，這些寄存器在調(diào)用時都需要保護(hù)。
    第三類是高速暫存寄存器，包括除了以上兩類寄存器以外的所有寄存器。用法和匯編中的普通寄存器是一樣的，使用前不需要保存寄存器內(nèi)容。

    在默認(rèn)情況下，cjmp寄存器用作存放被調(diào)函數(shù)的返回地址，但在嵌套調(diào)用中，這個值會被修改。為了保證安全返回，一般把返回地址存放在堆棧頂偏移地址為0的地方。

    函數(shù)調(diào)用有時需要參數(shù)傳遞，通常，若參數(shù)少于5個，則通過寄存器傳遞，如表1所列。

如果在C／C++調(diào)用函數(shù)中作了正確的函數(shù)返回聲明，則被調(diào)用的匯編函數(shù)可使用寄存器j8、xr8和xr9返回有效值。j8用于返回整數(shù)或地址；xr9：8可提供雙字結(jié)果返回。若返回值大于2個字長，則必須為它們分配存儲空間，令j8為返回值，指向該空間的首地址即可。

②在C／C++中聲明的全局變量及函數(shù)，匯編中加“一”前綴才能使用；在匯編中的對象必須用”一”前綴命名，并用．g10bal聲明為全局變量，才可在C／C++中訪問到。具體格式如表2所列。

2 混合編程的調(diào)用和中斷
2.1 函數(shù)調(diào)用
C編譯器對函數(shù)調(diào)用有一系列嚴(yán)格的規(guī)則。除了特殊的運(yùn)行支持函數(shù)外．任何函數(shù)與c函數(shù)互調(diào)都必須遵循這些規(guī)則。函數(shù)調(diào)用的標(biāo)準(zhǔn)運(yùn)行模式為：①調(diào)用者將參數(shù)莊人堆棧。壓入時按照反序進(jìn)行，即最右邊的參數(shù)位于堆棧的頂部。②調(diào)用函數(shù)。③調(diào)用結(jié)束時，調(diào)用者將參數(shù)彈出堆棧并返回。整個過程離不開堆棧操作。函數(shù)調(diào)用中的堆棧結(jié)構(gòu)示意圖如圖1所示。

    ADSP-TSl01S的堆棧是一個先入后出存儲區(qū)(如圖1)，用堆棧指針(j／k27)和幀指針(j／k26)來管理堆棧。調(diào)用函數(shù)時，編譯器在運(yùn)行棧中建立一個幀以存儲信息，當(dāng)前函數(shù)幀稱為局部幀。j／k26指向當(dāng)前函數(shù)的局部幀的開始，即棧底。j／k27指向棧頂，工作方式是向低地址變化。每調(diào)用一次函數(shù)，就建立一個新幀。C環(huán)境利用局部幀來實(shí)現(xiàn)如下功能：

    ①保護(hù)函數(shù)的返回地址及相關(guān)寄存器：把函數(shù)返回地址保存在j27+0的位置(棧頂)，同時設(shè)置jZ6為j27-0x40(棧底)，得到長度為64的棧區(qū)，并在棧區(qū)內(nèi)保護(hù)相關(guān)寄存器。
    ②分配局部變量：在局部變量賦初值的時候，系統(tǒng)在堆棧內(nèi)給它分配一個空間。
    ③傳遞函數(shù)參數(shù)：前4個參數(shù)傳遞給相應(yīng)寄存器(見表1)，后續(xù)參數(shù)按順序裝載到堆棧j27+0xC起始的空間中。注意，如果傳遞的參數(shù)是結(jié)構(gòu)類型，則其所有元素將入棧。例：第五個參數(shù)是兩元素的結(jié)構(gòu)體，則元素一放于jZ7+0xC，元素二放于j27+0xD，匯編子程序在使用參數(shù)時只需從對應(yīng)的位置上讀取即可。

    C環(huán)境在調(diào)用C函數(shù)時自動管理這些操作，當(dāng)匯編與C接口時，必須采用與C一樣的方式進(jìn)行操作。這個過程可用圖1詳細(xì)描述。特別需要注意的是，由于C編譯器不提供檢查堆棧溢出的任何手段，因此必須保證有足夠的空間用于堆棧；否則若發(fā)生溢出現(xiàn)象，將破壞程序的運(yùn)行環(huán)境，從而導(dǎo)致程序的癱瘓。

2.2 中斷
    中斷是DSP控制程序執(zhí)行的重要方式。通常，DSP工作在包含多個外部異步事件的環(huán)境中，這些異步事件的隨機(jī)發(fā)生要求DSP能中斷當(dāng)前的處理程序并轉(zhuǎn)向執(zhí)行該事件處理程序，執(zhí)行完后又要求返回被中斷的原程序繼續(xù)處理步驟，這一過程就是中斷。中斷源可以來自片內(nèi)或片外的設(shè)備，例如時鐘、A／D等。中斷的設(shè)置包含兩步——①打開中斷屏蔽寄存器的相應(yīng)中斷位，②設(shè)置中斷服務(wù)程序的入口地址，這樣就能實(shí)現(xiàn)中斷的正常運(yùn)行。中斷服務(wù)程序是特殊的函數(shù)，不能帶返回值，不能傳遞參數(shù)，內(nèi)容須短而有效。標(biāo)準(zhǔn)運(yùn)行模式為：①保存斷點(diǎn)地址并保護(hù)所有用到的寄存器，②執(zhí)行中斷服務(wù)程序，③釋放寄存器并返回。

    ADSP-TSl01s中C語言中斷實(shí)現(xiàn)有兩種方法：一種是采用interrupt(int，vuid(*func(int)))函數(shù)來設(shè)置中斷矢量表，這個函數(shù)定義在signal.h頭文件中。第一個參量表示需響應(yīng)的中斷位，在這個頭文件中也有定義；第二個參數(shù)即是中斷服務(wù)程序。應(yīng)該引起注意的是，采用這種方法時，IMASK寄存器的異常中斷位必須打開，因?yàn)閕nterrupt()庫函數(shù)要使用trap語句來產(chǎn)生陷阱，必須打開異常中斷，陷阱才能設(shè)置成功，中斷矢量表的設(shè)置才能完成，否則，中斷來l臨并不會進(jìn)入指定的中斷服務(wù)程序。另一種與匯編語言中斷服務(wù)程序的實(shí)現(xiàn)類似。以定時器O為例，設(shè)置好IMASK后，用_builtin_sysreg_write(_ⅣTIMEROHP，(int)timer0h_isr)函數(shù)設(shè)置中斷矢量表，用#pragma interrupt來標(biāo)識中斷服務(wù)程序即可。這種方法更簡單快捷，但它只適用于Visua1DSP++3.5以上版本，而第一種方法適用于任何版本。

3 程序優(yōu)化
    程序優(yōu)化包括匯編優(yōu)化和C優(yōu)化。手寫匯編程序的優(yōu)化空間相當(dāng)大，可以產(chǎn)生非常高效的程序代碼。由于許多相關(guān)書籍都有介紹，就不再贅述，這里主要介紹C程序的優(yōu)化。

    一般DSP的C編譯器都會提供優(yōu)化編譯器，采用優(yōu)化編譯就可以生成效率更高的匯編代碼，在某些情況下，執(zhí)行優(yōu)化的程序代碼要快10～20倍。從某種程度上說，C程序的效率主要取決于C編譯器所能進(jìn)行優(yōu)化的范圍和數(shù)量。應(yīng)說明的是，TSl01S編譯器的默認(rèn)設(shè)置是不使用優(yōu)化器，它可以進(jìn)行以下幾個不同級別的優(yōu)化，優(yōu)化程度由低到高：

    ①Debugging：“-g”開啟。編譯器產(chǎn)生調(diào)試信息，以確保目標(biāo)碼與相應(yīng)的源代碼匹配。
    ②DefauIt：編譯器進(jìn)行基本的高級優(yōu)化。例如對明確標(biāo)明的內(nèi)聯(lián)函數(shù)進(jìn)行內(nèi)聯(lián)。
    ③Procedural optimization：“-o”啟動。編譯器對要編譯的文件中的每一過程進(jìn)行高級優(yōu)化。如果同時開啟“-g”，由于“-O”項(xiàng)有更高的優(yōu)先級，會限制調(diào)試功能。
    ④Interprocedural optimization：“-ipa"打開。除了基本優(yōu)化外，編譯器將對所有源文件的整個程序進(jìn)行高級優(yōu)化操作，將刪除從沒被調(diào)用的函數(shù)和變量，會明顯減少代碼長度。

    以上“-g”、“-O”、“-ipa”在編譯信息中可以看到。優(yōu)化級越高，優(yōu)化的范圍就越廣。應(yīng)注意的是，使用C優(yōu)化編譯可以提高程序的運(yùn)行效率，但由于優(yōu)化時采用了一些優(yōu)化措施，使得C和匯編的交叉列表文件不如在不用優(yōu)化時得到的那樣清晰。因此，在調(diào)試程序時，最好先不用優(yōu)化編譯進(jìn)行調(diào)試，待程序調(diào)試成功后再用優(yōu)化編譯進(jìn)行優(yōu)化。采用C優(yōu)化編譯時，為了保證程序的正確性，特別需要注意幾點(diǎn)：

    ①使用asm行匯編語句時必須特別小心。優(yōu)化器在優(yōu)化過程中會對程序代碼重新進(jìn)行組織，寄存器使用也比較靈活，同時程序中的有些變量或表達(dá)式可能會被刪除。雖然asm語句不會被刪除，但asm語句的前后環(huán)境可能因優(yōu)化而發(fā)生很大的變化。因此，當(dāng)asm語句涉及到C環(huán)境或訪問C變量時，使用優(yōu)化器可能會得到不正確的結(jié)果。此時，必須對編譯后得到的匯編語句進(jìn)行仔細(xì)的檢查，以確保asm語句在程序中的正確性。一般而言，當(dāng)asm語句僅涉及諸如控制中斷寄存器或I／0口等硬件操作時，使用優(yōu)化是比較安全的。

    ②在高級優(yōu)化中，C語言源函數(shù)中從未使用過的變量和函數(shù)將被刪除。若匯編子函數(shù)的C外部變量在C程序中從未使用過，有可能被刪除并導(dǎo)致編譯失敗。使用retain_name pragma可以避免變量和函數(shù)因優(yōu)化而被刪除。例如：
    保留函數(shù)

    ③使用volatile變量避免優(yōu)化。一個定義為volatile的變量是說這個變量可能會被意想不到地改變，比如，并行設(shè)備的硬件寄存器(如狀態(tài)寄存器)，一個中斷服務(wù)子程序中會訪問到的非自動變量，多線程應(yīng)用中被幾個任務(wù)共享的變量。采用volatile限定詞，優(yōu)化器在用到這個變量時必須每次都重新讀取這個變量的值，而不是使用保存在寄存器里的備份。

    ④C語言程序應(yīng)盡量避免使用指針運(yùn)算。指針轉(zhuǎn)換會在一定程度上降低運(yùn)行效率。
    ⑤在“-ipa'’使能的情況下，在循環(huán)前使用#pragmann_alias可以起到進(jìn)一步優(yōu)化程序的功能。一般來說，對于循環(huán)中不存在迭代運(yùn)算(使用上一次結(jié)果)的情況，優(yōu)化效果很好。
    ⑥使用PM限定詞定義數(shù)據(jù)塊。默認(rèn)情況下數(shù)組存放在DM區(qū)，即第一塊數(shù)據(jù)區(qū)(0x80000-0x8ffff)中。使用PM限定的數(shù)組放在第二塊數(shù)據(jù)區(qū)(0x100000-0x10ffff)中。由于兩塊數(shù)據(jù)區(qū)有獨(dú)立的128位數(shù)據(jù)總線相連，因此可以實(shí)現(xiàn)單周期內(nèi)的雙數(shù)據(jù)同時訪問。

4 混合編程在系統(tǒng)程序管理中的應(yīng)用
    下面是一個嵌入式系統(tǒng)管理實(shí)例。系統(tǒng)由4片DSP構(gòu)成，作為系統(tǒng)管理的DSP0負(fù)責(zé)通過IRQ0接收控制臺從RS232串口傳來的控制字，譯碼，并通過控制flag3產(chǎn)生下降沿觸發(fā)IRQ3中斷來啟動其他各片DSP。這里用C搭建框架，匯編控制底層硬件，效率高，可讀性強(qiáng)。由于篇幅限制，這里略去了串口初始化、串口數(shù)據(jù)接收函數(shù)以及其他芯片的處理程序。

    以下是系統(tǒng)管理中的混合編程。
    Main.c文件：

5 總結(jié)
實(shí)踐證明，采用混合編程的軟件更加符合一般系統(tǒng)對時間和空間的嚴(yán)格約束。設(shè)計良好的混合編程軟件既能有效滿足嵌入式系統(tǒng)對功能與性能的需求，也可以為程序的擴(kuò)展和移植預(yù)留足夠的空間?？傊?strong>混合編程是嵌入式系統(tǒng)軟件優(yōu)化的重要途徑。