基于Nios的FFT算法軟硬件協(xié)同設(shè)計
摘要:在深入研究Nios自定制指令的軟硬件接口的基礎(chǔ)上,利用Matlab/DSP Builder建立快速傅里葉變換FFT核心運(yùn)算指令基本模型,然后用Altera公司提供的Singacompiler工具對其進(jìn)行編譯,產(chǎn)生 QuartusⅡ能夠識別的VHDL源程序,并將此程序在Nios中自定制成相關(guān)的FFT運(yùn)算指令。利用自定制的FFT運(yùn)算指令,在Nios中利用C語言 編寫基于Nios的FFT算法程序,實現(xiàn)了FFT運(yùn)算的軟硬件協(xié)同設(shè)計。經(jīng)測試表明,將FFT算法加入到Nios嵌入式處理器指令集中,可以幫助系統(tǒng)完成 復(fù)雜的數(shù)據(jù)處理任務(wù),增強(qiáng)Nios系統(tǒng)的實時處理能力。該設(shè)計方法打破了軟硬件間的屏障,大大加快了系統(tǒng)的功能驗證。
關(guān)鍵詞:FFT;自定制指令;軟硬件協(xié)同設(shè)計;EP2C5Q208C8
在自動控制領(lǐng)域,往往要對被控對象進(jìn)行狀態(tài)檢測,從而作出下一步的處理,達(dá)到控制的目的,因此自動控制系統(tǒng)離不開對被控系統(tǒng)的狀態(tài)進(jìn)行監(jiān)測,以便對其進(jìn)行 處理,例如滾動軸承故障、電動機(jī)故障等均可以利用頻譜分析法對其進(jìn)行狀態(tài)監(jiān)測和故障診斷。要檢測被控對象的狀態(tài),就離不開數(shù)字信號處理,因此,數(shù)字信號處 理應(yīng)用廣泛。并且FFT(快速傅里葉變換)促進(jìn)了數(shù)字信號處理的發(fā)展,它可應(yīng)用傅里葉變換理論所能涉及的任何領(lǐng)域。對于FFT工程的實現(xiàn)方法有軟件法和硬 件法,即通過軟件程序完成FFT運(yùn)算,這種方法可適用于各種數(shù)字信號處理的應(yīng)用場合,很靈活,但缺點是不能進(jìn)行實時處理。而使用專用硬件完成數(shù)字信號處理 的方法能夠?qū)崿F(xiàn)實時處理,但外圍電路相對復(fù)雜,不易擴(kuò)展,靈活性差,且價格昂貴。因此人們一方面尋求結(jié)構(gòu)簡單、運(yùn)算速度快,存儲量小的FFI實現(xiàn)方法,另 一方面采用先進(jìn)的VLSI技術(shù)改進(jìn)實現(xiàn)FFT的硬件結(jié)構(gòu),將算法硬件化。
Nios嵌入式處理器是FPGA生產(chǎn)廠商Althera推出的軟核CPU,它是一種面向用戶的、可靈活定制的通用RISC嵌入式CPU。用戶可以在 Nios指令系統(tǒng)中增加用戶自定義指令,以增強(qiáng)對強(qiáng)實時軟件算法的處理能力,可以把一個復(fù)雜的標(biāo)準(zhǔn)指令序列簡化為一條用硬件實現(xiàn)的單個指令。特別是在需要 使用大量FFT算法的場合,可以根據(jù)用戶的需要,定制專門的FFT處理器硬件和定制一些諸如復(fù)數(shù)乘法或復(fù)數(shù)加法等傳統(tǒng)運(yùn)算指令,使Nios系統(tǒng)不但具有常 規(guī)數(shù)字信號處理器功能,而且具有軟件實現(xiàn)FFT運(yùn)算處理的特點。
1 FFT算法原理
1.1 按時間抽取的基-2 FFT算法
設(shè)序列x(n)長度為N,且滿足N=2M,M為正整數(shù)。按n的奇偶把x(n)分解為2個N/2點的子序列:
則可將DFT化為:
式中,X1(k)與X2(k)分別是x1(r)及x2(r)的N/2點DFT。[!--empirenews.page--]
由此可以看到,一個N點DFT已分解成2個N/2點的DFT。這2個N/2點的DFT再按照式(4)組合成1個N點DFT。這里應(yīng)該看到 X1(k),X2(k)只有N/2個點,即k=O,1,…,(N/2)-1。而X(k)卻有N個點,即k=O,1,…,N-1,故用式(4)計算得到的只 是X(k)的前一半的結(jié)果,要用X1(k),X2(k)來表達(dá)全部的X(k)值,還必須應(yīng)用系數(shù)的周期性,這樣可得到:
說明后半部分k值(N/2≤k≤N-1)所對應(yīng)的X1(k),X2(k)分別等于前半部分k值(O≤k≤(N/2)-1)所對應(yīng)的X1(k),X2(k)。這樣,就可將X(k)表達(dá)為前后兩部分:
其運(yùn)算關(guān)系可以利用蝶形運(yùn)算流程圖來形象地描述,圖l為按時間抽取法的蝶形運(yùn)算流程圖符號。
1.2 按頻率抽取的基-2FFT算法
仍設(shè)序列點數(shù)為N=2M,M為正整數(shù)。在把輸出X(k)按k的奇偶分組之前,先把輸入序列按前、后各一半(不是按偶奇)分開,把N點DFT寫成2部分,則可將DFT化為:
[!--empirenews.page--]
圖2為按頻率抽取法的蝶形運(yùn)算流程圖符號,這樣,就把1個N點DFT按k的奇偶分解為2個N/2點的DFT了。
由以上分析可知,F(xiàn)FT算法中最核心的是蝶形運(yùn)算單元。而一個蝶形運(yùn)算單元主要由一次復(fù)數(shù)乘法,兩次復(fù)數(shù)加法構(gòu)成。為此整個FFT算法中,復(fù)數(shù)乘法和復(fù)數(shù)加法是最為核心的運(yùn)算單元。
2 FFT算法軟硬件協(xié)同設(shè)計
軟硬件協(xié)同設(shè)計指對系統(tǒng)中的軟硬件部分使用統(tǒng)一的描述和工具進(jìn)行集成開發(fā),完成全系統(tǒng)的設(shè)計驗證并跨越軟硬件界面進(jìn)行系統(tǒng)優(yōu)化。其基本的設(shè)計流程是先用 VHDL語言和C語言進(jìn)行系統(tǒng)描述并進(jìn)行模擬仿真和系統(tǒng)功能驗證;然后對軟硬件實現(xiàn)進(jìn)行功能劃分,分別用語言進(jìn)行設(shè)計并將其綜合起來進(jìn)行功能驗證和性能預(yù) 測等仿真確認(rèn)(協(xié)調(diào)模擬仿真);其次進(jìn)行軟件和硬件詳細(xì)設(shè)計;最后進(jìn)行系統(tǒng)測試。
根據(jù)上面的分析可知,F(xiàn)FT算法中最核心的是蝶形運(yùn)算單元,而復(fù)數(shù)乘法和復(fù)數(shù)加法又是蝶形運(yùn)算單元的核心,因此可以采取Nios的自定義指令功能,定制一條復(fù)數(shù)乘法指令和一條復(fù)數(shù)加法指令,以便完成一次蝶形運(yùn)算。
2.1 建立NiosⅡ嵌入式處理器系統(tǒng)
首先,利用QuartusⅡ建立項目工程,選用的目標(biāo)器件為CycloneⅡEP2C5Q:再用SOPCBuider創(chuàng)建NiosⅡ組件 模型,生成硬件描述文件,鎖定引腳后進(jìn)行綜合與適配,生成NiosⅡ硬件系統(tǒng)下載文件;然后建立NiosⅡ嵌入式系統(tǒng),從SOPC Builder組件欄中加入所需的組件(如NiosⅡCPU核、定時器Timer、JTAG_UART、Avalon三態(tài)總線橋、鍵輸入I/O口和 Flash等)。另外,為了實現(xiàn)NiosⅡ處理器對EPCS Flash存儲器的讀寫訪問,還要加入EPCS Serial FlashController組件。通過此控制器將用于FPGA配置的SOF文件和CPU運(yùn)行的軟件一并存于EPCS器件中,以便大大簡化硬件系統(tǒng)組成 結(jié)構(gòu)。為了保證所有組件的地址安排是合法的,要對各組件地址實行自動分配;最后進(jìn)行全程編譯(即分析、綜合、適配和輸出文件裝配),完成NiosⅡ硬件系 統(tǒng)的設(shè)計。
2.2 利用DSP Builder生成復(fù)數(shù)乘法模塊
使用DSP Builder在FPGA上進(jìn)行DSP模塊的設(shè)計,可實現(xiàn)高速DSP處理。但是,在實際應(yīng)用中,除了要求DSP高速外,由于DSP處理的算法往往比較復(fù) 雜,如果單純使用DSPBuilder來實現(xiàn)純硬件的DSP模塊,會耗費過多的硬件資源,因此有時也無法完成許多算法復(fù)雜的模型。而NiosⅡ則是一個建 立在FPGA上的嵌入式微處理器軟核,它有一個重要的特性是具有自定制指令。在DSP算法中會反復(fù)出現(xiàn)一些運(yùn)算(如復(fù)數(shù)乘法器、整數(shù)乘法器、浮點乘法器 等),而在通用的CPU中都沒有專門用于復(fù)數(shù)乘法計算和浮點乘法計算的相關(guān)指令。在系統(tǒng)設(shè)計中,利用MA-TLAB、DSP Builder或者VHDL設(shè)計并生成復(fù)數(shù)乘法器、整數(shù)乘法器、浮點乘法器等硬件模塊。在QuartusⅡ環(huán)境中對上述文件做一些修正后,在SOPC Builder窗口中將它們定制為相應(yīng)的指令,并可設(shè)定或修改執(zhí)行該指令的時鐘周期。在進(jìn)行DSP算法運(yùn)算時,可通過匯編或C語言,甚至C++語言來運(yùn)用 這些自定義指令進(jìn)行嵌入式程序設(shè)計。
根據(jù)復(fù)數(shù)運(yùn)算,設(shè)2個復(fù)數(shù)為a+bj和c+dj,則乘法表述為:
在MATLAB/Simulink下建立如圖3所示的復(fù)數(shù)乘法模型,圖中的Dataal、Databl和Resultl是DSP Builder中SOPCLibrary中Custom Ins-truction中的模塊,分別對應(yīng)Nios內(nèi)部ALU的2個輸入信號dataa和datab,以及ALU的輸出信號result。 Datareal、DataImag、DatbReal、Da-thlmag是一個總線位轉(zhuǎn)換模塊;BusConeatenation是總線復(fù)合模塊。 Dataa toComplex和Datab to Complex是一個實數(shù)轉(zhuǎn)復(fù)數(shù)的模塊,Com-plex Product是復(fù)數(shù)乘法模塊,Real Result是復(fù)數(shù)解出實部和虛部的模塊。
該模型完成了1個16位的復(fù)數(shù)乘法。在這個設(shè)計中,利用Nios32的32位數(shù)據(jù)位寬,把32位分成2部分,分別放入復(fù)數(shù)的實部和虛部,實部、虛部的位寬 都是16位,正好構(gòu)成1個32位數(shù),兩個16位復(fù)數(shù)進(jìn)行運(yùn)算后,把結(jié)果設(shè)為16位復(fù)數(shù),也用32位表示。設(shè)此模型的文件名為co-mplex.mdl。并 點擊Signalcompiler,對complex.mdl進(jìn)行轉(zhuǎn)換,在轉(zhuǎn)換窗口中分別作如下選擇:器件選擇CycloneⅡ;綜合器選擇Quart- usⅡ;“SOPC Info”的generate SOPC Builder PTF File項要選擇打勾。分別單擊轉(zhuǎn)換按鈕1-Convert和綜合按鈕2-Synthesis即可將其轉(zhuǎn)換成標(biāo)準(zhǔn)的VHDL語言。
2.3 在Nios中加入復(fù)數(shù)乘法指令
在已建立的SOPC設(shè)計中,雙擊CPU項,點擊“Import”按紐,點擊“ADD"按紐,打開Complex_ei.vhd,再點擊 “Readport-list from files"按紐,點擊“ADD to System”按紐,加入該設(shè)計作為指令執(zhí)行模塊。最后再將整個項目重新編譯一次,鎖定引腳后,再下載到目標(biāo)器件中。為此即在Nios指令中定制了一條名 為COMP的復(fù)數(shù)乘法指令,在進(jìn)行C語言編程時,其調(diào)用格式為z=nm_comp(x,y),其中x和y為兩個復(fù)數(shù),其運(yùn)算結(jié)果放在z中。用同樣的方法, 可以建立復(fù)數(shù)加法指令和復(fù)數(shù)減法指令。由此可見,利用DSP Builder很容易地實現(xiàn)了FFT算法中的復(fù)數(shù)運(yùn)算指令的定制。同時在定制指令時,對于浮點數(shù)的處理,采用統(tǒng)一為幾位二進(jìn)制有效數(shù)字的辦法來解決的,比 如說:小數(shù)位數(shù)固定為4位,整數(shù)位數(shù)固定為6位,那么可以定義一個向量signal num:std_logic_vector(9down to 0);在做運(yùn)算的時候,注意高6位是整數(shù)、低4位是小數(shù),就可以達(dá)到實型數(shù)據(jù)的處理。[!--empirenews.page--]
2.4 FFT算法軟件設(shè)計
在NiosⅡ硬件系統(tǒng)設(shè)計完成后,將配置文件下載到指定的FPGA中,通過SOPC Builder軟件窗口,可進(jìn)入NiosⅡIDE軟件開發(fā)環(huán)境進(jìn)行軟件設(shè)計。
通過SOPC Buider軟件窗口,啟動NiosⅡIDE,然后新建工程,在新建工程的過程中,選擇剛才產(chǎn)生的CPU,新工程產(chǎn)生后,在工程添加文件,在文件中寫入程 序代碼。在軟件編程時設(shè)計者可以使用多種方式使用自定制指令,為了簡化軟件開發(fā)者使用自定義指令的編程,在生成的SDK中的.h文件中已經(jīng)包含了自定義指 令的宏定義,可以直接用在C中。下面以基2,8點FFT為例加以說明。在定制了兩條復(fù)數(shù)運(yùn)算指令后,可以使用C語言編程實現(xiàn)FFT算法。由于有基本的復(fù)數(shù) 運(yùn)算指令和復(fù)數(shù)加法指令,為此采用C語言編寫程序,其算法變得相當(dāng)簡單,F(xiàn)FT核心算法如下:
2.5 系統(tǒng)測試
采用Altera公司的Cyclone Ⅱ系列芯片EP2C5Q208C8。用Altera提供的Nios SDK,將編譯后的可執(zhí)行代碼,通過計算機(jī)串口下載到FPGA上的Nios系統(tǒng)內(nèi)存中去并運(yùn)行,將輸出結(jié)果與Matlab仿真結(jié)果進(jìn)行了比較。比較結(jié)果如 表l所示,其中參考值是用MATLAB按FFT計算得到的結(jié)果,測試值是在Nios中利用C語言編寫的FFT程序計算的結(jié)果,表中某些數(shù)據(jù)誤差較大,是因 為本系統(tǒng)采用定點數(shù)據(jù)精度不夠,只要增加定點數(shù)據(jù)的位數(shù)就可提高運(yùn)算的精度。
3 結(jié)束語
Nios是一個性價比較高的微處理器,它是以軟核的方式提供給用戶,并專為在Altera的FPGA上實現(xiàn)作了優(yōu)化,用于SOPC(片上可編程系統(tǒng))集 成,最后在FPGA上實現(xiàn),通過它可以創(chuàng)建Nios CPU設(shè)計項目,從而為設(shè)計人員提供SOPC設(shè)計必需的軟硬件設(shè)計平臺。在定制的NiosCPU設(shè)計項目中利用Nios的用戶自定義指令功能,可以達(dá)到 FFT運(yùn)算的軟硬件協(xié)同設(shè)計,實現(xiàn)了快速FFT的變換。由于軟件直接控制硬件,所以編譯過后的軟件調(diào)試工作,基本上都是軟硬件協(xié)同完成的。因此速度快,占 用資源少,容易擴(kuò)展。