用戶自定制Nios處理器的FFT算法指令
1 引言
在Altera的Nios嵌入式處理器中。用戶可以在Nios指令系統(tǒng)中增加用戶自定制指令來滿足某種特定的應(yīng)用需求。自定制指令可以訪問存儲(chǔ)器或Nios系統(tǒng)外的邏輯資源。增強(qiáng)系統(tǒng)的實(shí)時(shí)處理能力,特別適用于DSP、數(shù)據(jù)包處理及對(duì)計(jì)算密集型軟件進(jìn)行優(yōu)化。
Altera高性能快速傅立葉變換(FFT)處理器IP核FFT V2.2.0為實(shí)現(xiàn)高速FFT算法提供了成功的解決方案,將FFT算法定制為Nios嵌入式處理器的用戶指令,用已實(shí)現(xiàn)的高性能FFT算法作為Nios嵌入式系統(tǒng)的一個(gè)加速模塊,使系統(tǒng)可以完成復(fù)雜的數(shù)據(jù)處理任務(wù)。
2 Nios自定制指令的軟硬件接口
使用用戶自定制指令,用戶能夠向Nios的ALU和指令系統(tǒng)增加用戶自定制功能,完整的用戶自定制指令包括用戶自定制邏輯和軟件宏兩部分。
用戶自定制邏輯是完成用戶操作的硬件部分,Nios最多支持5個(gè)用戶自定制邏輯作為ALU的一部分。軟件宏提供軟件接口,Nios將創(chuàng)建相應(yīng)C/C++和匯編的宏代碼,使得用戶能夠訪問用戶自定制邏輯。Nios自定制指令支持多種設(shè)計(jì)文件,主要有Verilog HDL、VHDL、EDIF netlist file、Quartus II Block Design File等。由于用戶自定制指令邏輯需要直接連到ALU上.所以Nios提供一套預(yù)先定義好名稱和功能的接口,如圖1所示。Nios配置向?qū)?huì)掃描用戶自定義邏輯,搜索需要的端口。并把這些端口連到ALU上,這就要求用戶自定制邏輯必須指定所需的端口類型,使用預(yù)先定義的端口名稱。保證自定制邏輯端口能正確地連到ALU。
當(dāng)然,Nios也允許用戶自定制指令與Nios系統(tǒng)外部的功能模塊進(jìn)行信息交流。如果配置向?qū)]能識(shí)別用戶邏輯模塊的某個(gè)端口。它將該端口引出到系統(tǒng)模塊的頂層.使得外部邏輯可以訪問這些信號(hào),這些端口用export標(biāo)記。當(dāng)用戶自定制邏輯被集成到Nios處理器的ALU后.可以通過軟件訪問用戶自定制邏輯,Nios系統(tǒng)中包括5個(gè)用戶操作碼,如表1所示,用戶可以通過用C/C++或匯編寫的宏來調(diào)用這些操作碼,通過它們來訪問用戶自定制邏輯。
表1 用戶操作碼、類型和操作
寫C/C++代碼時(shí),Nios寄存器的使用是透明的,編譯器會(huì)自動(dòng)選擇寄存器,而在匯編中則必須指定寄存器。在增加了用戶自定制指令后,Nios配置向?qū)?huì)自動(dòng)創(chuàng)建相應(yīng)的宏,支持對(duì)宏進(jìn)行手工命名,以提高軟件代碼的可讀性。
在C/C++中通過一個(gè)函數(shù)調(diào)用來訪問用戶自定義指令。SOPC Builder自動(dòng)生成的Nios系統(tǒng)頭文件(excalibur.h)里包含了C/C++的宏定義,有兩種不同的C/C++宏可供使用,其中前一個(gè)使用了prefix端口,后一個(gè)沒有使用prefix端口。
nm_
nm_
3 FFT算法實(shí)現(xiàn)
FFT算法由Altera的FFT IP核FFT V2.2.0實(shí)現(xiàn),F(xiàn)FT V2.2.0是一個(gè)高性能、參數(shù)化快速傅立葉變換(FFT)處理器IP核,對(duì)Altera StratixII、Stratix GX、Stratix以及Cyclone系列器件進(jìn)行了設(shè)計(jì)優(yōu)化.可以完成變換長(zhǎng)度為2m(6≤m≤14)的基-2/4按頻率抽?。―IF)的復(fù)數(shù)FFT算法,IP核使用模塊浮點(diǎn)結(jié)構(gòu)可在
數(shù)據(jù)處理過程中保持最大數(shù)據(jù)動(dòng)態(tài)范圍,以獲得最大信噪比SNR與最少邏輯需求之間的平衡。
此處FFT V2.2.0相關(guān)參數(shù)設(shè)置為:變換長(zhǎng)度(Transform Length)選擇1024點(diǎn),數(shù)據(jù)精度選擇16位,旋轉(zhuǎn)因子精度選擇16位,I/O數(shù)據(jù)流選擇Streaming形式,復(fù)數(shù)乘法器結(jié)構(gòu)(Structure)由3個(gè)乘法器、5個(gè)加法器完成。
圖2給出了FFT算法模塊的外部端口,I/O接口協(xié)議采用Atlantic接口,輸入接口為主設(shè)備匯端(Master Sink),輸出接口為主設(shè)備源端(Master Source),Atlantic接口相關(guān)內(nèi)容可查閱文獻(xiàn)3,圖3為FFT在Modelsim環(huán)境下的仿真結(jié)果。
4 定制Nios核的FFT指令
應(yīng)用SOPC Builder系統(tǒng)開發(fā)工具建立一個(gè)嵌入Nios軟核的基本SOPC系統(tǒng),系統(tǒng)組件如圖4所示。顯然,用戶可以根據(jù)實(shí)際應(yīng)用的需要增加其它SOPC系統(tǒng)組件,這里僅分析定制FFT算法指令相關(guān)內(nèi)容。
通過自定制指令“Custom Instruction”界面中Import按鈕導(dǎo)入設(shè)計(jì)好的FFT.vhd文件,定制用戶指令FFT,這里使用USR1操作碼,如圖5所示。
在Nios系統(tǒng)中用戶自定制邏輯必須與指定的端口類型匹配,對(duì)于FFT來說,其輸入和輸出都是實(shí)部和虛部為16位的復(fù)數(shù),正好可以用一個(gè)32位的值來表示 這樣FFT.vhd程序的端口(port)可以按如下方法設(shè)置:
PORT(
clk:IN STD_ LOGIC;
reset:IN STD_LOGIC;
dataa:IN STD_LOGIC_VECTOR(31 DOWNTO 0);
result:OUT STD_LOGIC_VECTOR(31 DOWNTO 0);
start:IN OUT STD_LOGIC:=‘0’;
clk_en:IN STD LOGIC:=‘0’
……
?。?;
即將程序中原有16位長(zhǎng)的data_real_in,data_imag_in,fft_real_out,fft_imag_out端口換成兩個(gè)32的輸入輸出端口dataa和result,另外,還必須加上start和clk_en兩個(gè)輸入端口,雖然這兩個(gè)端口信號(hào)在程序中沒有作用。端口例化時(shí)再與原有端口對(duì)應(yīng),如下所示:
data_real_in => dataa(31 downto 16),
data_imag_in => dataa(15 downto 0),
fft_real_out => result(31 downto 16),
fit_imag_out => result(15 downto 0),
FFT其余Atlantic接口信號(hào)用export標(biāo)記,這些端口引出到系統(tǒng)模塊的頂層,外部邏輯可以訪問這些信號(hào)。
重新生成SOPC系統(tǒng)并更新后得到如圖6所示的加入自定制FFT算法指令的Nios處理器,將其全程編譯并下載到相應(yīng)FPGA后,結(jié)合Atlantic接口邏輯、FIFO存儲(chǔ)器電路,用戶即可在C或C++中調(diào)用nm_fft指令來完成1024點(diǎn)的高速FFT算法。
5 結(jié)論
自定制Nios處理器的用戶指令方法,使設(shè)計(jì)者可以為某種特定的應(yīng)用定制自己的指令,定制指令的方法在降低軟件復(fù)雜性的同時(shí),明顯地提高了Nios處理器的性能.幫助系統(tǒng)完成復(fù)雜的數(shù)據(jù)處理。
本文作者創(chuàng)新點(diǎn):基于IP核FFT V2.2.0實(shí)現(xiàn)了變換長(zhǎng)度為1024點(diǎn)的高速復(fù)數(shù)FFT算法,提出了一種新穎的在Nios嵌入式系統(tǒng)中定制用戶FFT算法指令的方法,使系統(tǒng)可以完成復(fù)雜的數(shù)據(jù)處理任務(wù),增強(qiáng)了系統(tǒng)的實(shí)時(shí)處理能力。
參考文獻(xiàn):
?。?]梁曦捷,肖璋.一種基于FPGA的順序迭代FFT設(shè)計(jì) 微計(jì)算機(jī)信息,2005,1-2
?。?]Altera DataSheet FFT Compiler Megacore Function User Guide 2.2.0 rev1 2005.10
?。?]Altera DataSheet Custom instructions for the Nios embedded Processor User Guide ve1.1.2 2002.9
?。?]Altera DataSheet Altera Interface Functional Specificmion Ver.3.0 2002.6
[5]潘松 黃繼業(yè) 曾毓 SOPC技術(shù)實(shí)用教程[M]北京清華大學(xué)出版社2005年3月131-139