關鍵詞:Matlab;FPGA;System Generator;DSP
近年來,在數(shù)字通信、網(wǎng)絡、視頻和圖像處理領域,FPGA已經(jīng)成為高性能數(shù)字信號處理系統(tǒng)的關鍵元件。FPGA的邏輯結構不僅包括查找表、寄存器、多路復用器、存儲器,而且還有快速加法器、乘法器和I/O處理專用電路。FPGA具有實現(xiàn)高性能并行算法的能力,是構成高性能可定制數(shù)據(jù)通路處理器(數(shù)字濾波、FFT)的理想器件。如Virtex-II Pro FPGA包含高性能的可編程架構、嵌入式PowerPC處理器和3.125Gbps收發(fā)器等。
但是,FPGA在數(shù)字信號處理領域的廣泛應用受限于幾個因素。首先,DSP開發(fā)人員不熟悉硬件設計,尤其是FPGA。他們使用Matlab驗證算法,運用C語言或匯編語言編程,通常不會使用硬件描述語言(VHDL或Verilog)實現(xiàn)數(shù)字設計。其次,雖然VHDL語言也提供了許多高層次的語言抽象,但是基于并行硬件系統(tǒng)的VHDL程序設計與基于微處理器的串行程序設計有很大的不同。
基于以上原因,Xilinx公司開發(fā)了基于Matlab的System Generator for DSP工具。System Generator for DSP是Simulink中一個基于FPGA的信號處理建模和設計工具。該工具可以將一個DSP系統(tǒng)表示為一個高度抽象的模塊,并自動將系統(tǒng)映射為一個基于FPGA的硬件方案。重要的是,該System Generator for DSP實現(xiàn)這些功能并沒有降低硬件性能。
1 System Generator for DSP的特點
Simulink為DSP系統(tǒng)提供了強有力的高層次建模環(huán)境,可大量應用于算法開發(fā)和驗證。System Generator for DSP作為Simulink的一個工具箱很好地體現(xiàn)了這些特性,同時又可以自動將設計轉(zhuǎn)換為可綜合的高效硬件實現(xiàn)方案。該硬件實現(xiàn)方案忠實于原始設計,因此設計模型與硬件實現(xiàn)在采樣點(在Simulink中定義)是一一對應的。通過使用Xilinx精心設計的IP(intellectual property)核可以使硬件方案具有較小的延遲和體積。雖然System Generator中的IP模塊是經(jīng)過功能抽象的,但是對于熟悉FPGA的設計者來說,該模塊也具有直接訪問底層硬件細節(jié)的能力。例如,可以指定System Generator乘法器模塊使用Virtex-II系列FPGA中的專用高速乘法器元件,用戶定義的IP模塊也能夠作為黑盒子插入系統(tǒng)之中,等等。
使用System Generator for DSP實現(xiàn)系統(tǒng)設計的主要特點有:
●在Simulink中實現(xiàn)FPGA電路的系統(tǒng)級建模,并自動生成硬件描述語言。
●自動生成Modelsim測試程序,支持軟硬件仿真。
●支持用戶創(chuàng)建的Simulink模塊。
●使用Xilinx FPGA自動實現(xiàn)硬件系統(tǒng)。支持的Xilinx FPGA系列包括Spartan-II、Spartan-IIE、Spar-tan-3、Virtex、Virtex-E、Virtex-II、Virtex-II Pro。
2 使用System Generator for DSP實現(xiàn)系統(tǒng)級建模
傳統(tǒng)的DSP系統(tǒng)開發(fā)人員在設計一個DSP系統(tǒng)時,一般先研究算法,再使用Matlab或C語言驗證算法,最后由硬件工程師在FPGA或DSP上實現(xiàn)并驗證。典型的DSP系統(tǒng)設計流程如下:
(1) 用數(shù)學語言描述算法。
(2) 設計環(huán)境中使用雙精度數(shù)實現(xiàn)算法。
(3) 將雙精度運算變?yōu)槎c運算。
(4) 將設計轉(zhuǎn)換為有效的硬件實現(xiàn)。
使用System Generator for DSP可以簡化這一過程。設計人員先在Matlab中對系統(tǒng)進行建模和算法驗證,經(jīng)過仿真后便可以直接將系統(tǒng)映射為基于FPGA的底層硬件實現(xiàn)方案??捎茫樱椋恚酰欤椋睿胩峁┑膱D形化環(huán)境對系統(tǒng)進行建模。System Generator for DSP包括被稱為Xilinx blockset的Simulink庫和模型到硬件實現(xiàn)的轉(zhuǎn)換軟件,可以將Simulink中定義的系統(tǒng)參數(shù)映射為硬件實現(xiàn)中的實體、結構、端口、信號和屬性。另外,System Generator可自動生成FPGA綜合、仿真和實現(xiàn)工具所需的命令文件,因此用戶可以在圖形化環(huán)境中完成系統(tǒng)模型的硬件開發(fā)。圖1為使用System Generator for DSP設計系統(tǒng)的流程圖。
在Matlab中,我們可以通過Simulink的庫瀏覽器使用Xilinx blockset庫中的模塊,Xilinx blockset庫中的模塊可以與Simulink其它庫中的模塊自由組合。Xilinx blockset庫中最重要的模塊是System Gen-erator,利用該模塊可完成系統(tǒng)級設計到基于FPGA的底層硬件設計的轉(zhuǎn)換工作。可以在System Generator模塊的屬性對話框中選擇目標FPGA器件、目標系統(tǒng)時鐘周期等選項。System Generator?qū)ⅲ兀椋欤椋睿?blockset中的模塊映射為IP庫中的模塊,接著從系統(tǒng)參數(shù)(例如采樣周期)推斷出控制信號和電路,再將Simulink的分層設計轉(zhuǎn)換為VHDL的分層網(wǎng)表,之后,System Generator即可調(diào)用Xilinx CORE Generator和VHDL模擬、綜合、實現(xiàn)工具來完成硬件設計。
由于一般的FPGA綜合工具不支持浮點數(shù),因此System Generator模塊使用的數(shù)據(jù)類型為任意精度的定點數(shù),這樣可以實現(xiàn)準確的硬件模擬。由于Simulink中的信號類型是雙精度浮點數(shù),因此在Xil-inx模塊和非Xilinx模塊之間必須插入Gateway In block和Gateway Out block模塊。通常Simulink中的連續(xù)時間信號在Gateway In block模塊中進行采樣,同時該模塊也可將雙精度浮點信號轉(zhuǎn)換為定點信號,而Gateway Out block模塊則可將定點信號轉(zhuǎn)換為雙精度浮點信號。大部分Xilinx模塊能夠根據(jù)輸入信號類型推斷輸出信號的類型。如果模塊的精度參數(shù)定義為全精度,則模塊將自動選擇輸出信號類型以保證不損失輸入信號精度,并自動進行符號位擴展和補零操作。用戶也可以自定義輸出信號類型來進行精度控制。
3 使用中需注意的問題
在FPGA系統(tǒng)設計中,時鐘的設計十分重要。因此必須正確理解System Generator中的時鐘和FPGA硬件時鐘之間的關系。Simulink中沒有明確的時鐘源信號,模塊在系統(tǒng)參數(shù)中定義的采樣周期點進行采樣。硬件設計中的外部時鐘源對時序邏輯電路十分重要。在System Generator模塊中,通過定義Simulink System Period和FPGA System Clock Period參數(shù)可以建立Simulink采樣周期和硬件時鐘間的關系,也可通過設置這些參數(shù)來改變Simulink中模擬時間和實際硬件系統(tǒng)中時間的比例關系。Simulink的系統(tǒng)周期一般是各模塊采樣周期的最大公約數(shù)。FPGA的硬件時鐘是單位為ns的硬件時鐘周期。例如,若Simulink中有兩個模塊,采樣周期分別為2s和3s,而FPGA系統(tǒng)時鐘周期為10ns,則Simulink系統(tǒng)周期應該為兩個模塊采樣周期的最大公約數(shù)即為1s。這意味著Simulink中的1s對應實際硬件系統(tǒng)的10ns。在生成硬件系統(tǒng)前,System Generator?qū)⒆詣訖z查用戶定義的Simulink系統(tǒng)周期參數(shù)是否與系統(tǒng)中模塊的采樣周期相沖突,如果沖突,則提示用修改Simulink系統(tǒng)周期參數(shù)。
圖4
有些情況會導致System Generator模塊產(chǎn)生不確定數(shù)(NaN-not a number)。如在雙端口RAM模塊中,兩個端口同時對模塊中的某一地址進行寫操作時,該地址中的數(shù)據(jù)將被標記為NaN。如果模塊中有不確定數(shù)出現(xiàn),則表明該模塊的最終硬件實現(xiàn)將會有不可預測的行為,當Simulink進行仿真時,System Generator?qū)蹲皆撳e誤。
4 應用實例
圖2是一個圖像處理應用實例的系統(tǒng)實現(xiàn)框圖。該應用實例使用5×5的二維FIR濾波器完成圖像增強預處理。該系統(tǒng)將輸入圖像分別延遲0×N(N為輸入圖像寬度)、1×N、2×N、3×N、4×N個采樣點后輸入5個Line Buffer,數(shù)據(jù)在Line Buffer中緩存后并行輸入5個5抽頭的MAC FIR濾波器。濾波器系統(tǒng)存儲于FPGA的塊RAM中,圖像數(shù)據(jù)經(jīng)濾波器處理后輸出。圖3為Line Buffer?qū)崿F(xiàn)框圖,圖4為5×5濾波器框圖。