基于FPGA IP核的FFT實現(xiàn)與改進(jìn)
摘要 利用FPGA IP核設(shè)計了一種快速、高效的傅里葉變換系統(tǒng)。針對非整數(shù)倍信號周期截斷所導(dǎo)致的頻譜泄露問題,提出了一種通過時輸入信號加窗處理來抑制頻譜泄露的方法。利用Modelsim和Matlab對設(shè)計方案進(jìn)行了仿真,同時在Altera公司的CycloneⅡ硬件平臺上進(jìn)行了驗證。驗證結(jié)果表明,系統(tǒng)性能良好,改進(jìn)效果明顯。
FFT是離散傅里葉變換(DFT)的一種快速算法,被廣泛應(yīng)用于頻譜分析、音頻編碼、圖像處理等數(shù)字信號處理領(lǐng)域。FFT運算復(fù)雜,需要大量的存儲器和運算單元,其硬件實現(xiàn)平臺多種多樣。DSP需要外置存儲器和特定接口,限制了運算速度。ASIC雖能滿足速度要求,但其硬件電路復(fù)雜、可擴(kuò)展性差、且價格昂貴。FPGA具有陜速并行運算、高集成度、低功耗等特點,且具有豐富的IP核資源,方便調(diào)用,適合FFT算法的實現(xiàn)。
對于512點FFT處理器,如果該512個輸入數(shù)據(jù)不是信號周期的整數(shù)倍,即非整數(shù)倍周期截斷,則會出現(xiàn)頻譜泄露現(xiàn)象。窗函數(shù)處理的宗旨是減小頻譜泄露。常規(guī)的FFT硬件實現(xiàn)方法均不考慮由于非整數(shù)倍截斷導(dǎo)致的頻譜泄露問題。針對以上問題,本文設(shè)計了一種基于Altera IP核的512點FFT系統(tǒng),同時通過對輸入信號的加窗處理,抑制了非整數(shù)倍信號周期截斷所產(chǎn)生的頻譜泄露。
1 原理概述
1.1 FFT原理
離散傅里葉變換(DFT)算法為
FFT為DFT的快速算法,其方法多種多樣,基本可以分為按時間抽取法和按頻率抽取法兩類。此處介紹基-4頻率抽取法。令N=4M,對式(1)N點的DFT可按如下方法作按頻率出抽取
4個等式可定義為一個蝶形運算,蝶形運算可看作基-4FFT基本運算單元。參與蝶形運算的4個節(jié)點是有規(guī)律的,分別為(n)、(n+N/4)、(n+2N/4)和(n+3N/4)。接著再將X(4r)、X(4r+1)、X(4r+2)和X(4r+3)分別分解為4個長度為N/16的序列,基本結(jié)構(gòu)是每一級的運算由N/4個蝶形運算構(gòu)成,經(jīng)過迭代log4N次后完成計算。FFT算法的本質(zhì)是利用系數(shù)
的共軛對稱性和周期性,將長序列DFT分解成短序列DFT,避免了大量的重復(fù)運算,從而提高運算效率。
1.2 窗函數(shù)原理
當(dāng)對輸入信號非整數(shù)倍周期截斷,即512個輸入數(shù)據(jù)不是輸入信號周期的整數(shù)倍時,會出現(xiàn)頻譜泄露現(xiàn)象。對輸入信號進(jìn)行加窗處理,可以有效地抑制頻譜泄露。常用的窗函數(shù)有矩形窗(Rectangle Window)、漢寧窗(Hanning Window)、海明窗(Hamming Window)、布拉克曼窗(Blackman Window)等,不同的窗函數(shù)具有不同的特點,表現(xiàn)在主瓣旁瓣寬度,頻率識別精度及幅度識別精度等方面。圖1為Matlab仿真圖,分別為原始信號,原始信號加窗(海明窗)結(jié)果,原始信號做512點FFT結(jié)果,原始信號加窗后再做512點FFT結(jié)果,這4幅圖直觀形象地描述了時域信號做FFT后的頻域結(jié)果,以及原始信號是否加窗對FFT結(jié)果的影響。
2 FFT IP核
FFT IP核是高速執(zhí)行的,參數(shù)可配置的FFT處理器,可以實現(xiàn)復(fù)數(shù)形式的FFT變換和IFFT變換。想要正確地使用FFT IP核,首先需要了解其引擎結(jié)構(gòu)、數(shù)據(jù)流結(jié)構(gòu)和關(guān)鍵管腳信號。
2.1 引擎結(jié)構(gòu)
FFI IP核有兩種不同的引擎結(jié)構(gòu):四輸出和單輸出,結(jié)構(gòu)如圖2(a)和圖2(b)所示。核心區(qū)別在于FFT蝶形處理器的吞吐量。一個時鐘周期內(nèi),四輸出結(jié)構(gòu)可以計算出所有4個蝶形輸出,單輸出結(jié)構(gòu)可以計算出一個蝶形輸出。
2.2 數(shù)據(jù)流結(jié)構(gòu)
FFI IP核支持流、變量流、緩沖突發(fā)、突發(fā)4種數(shù)據(jù)流結(jié)構(gòu)。流結(jié)構(gòu)允許連續(xù)輸入數(shù)據(jù),同時輸出連續(xù)的復(fù)數(shù)數(shù)據(jù)流。變量流產(chǎn)生一個與流結(jié)構(gòu)類似的連續(xù)輸出數(shù)據(jù)流。緩沖突發(fā)結(jié)構(gòu)需要存儲資源相對較少,但平均吞吐量也相應(yīng)降低。突發(fā)結(jié)構(gòu)的執(zhí)行過程與緩沖突發(fā)結(jié)構(gòu)類似,對于給定的參數(shù)設(shè)置,突發(fā)結(jié)構(gòu)需要更少的存儲資源。
其中,clk為時鐘信號;reset_n為復(fù)位信號;inverse為FFT處理器變換模式選擇信號,選擇FFT或IFFF;sink_valid為輸入數(shù)據(jù)有效信號;sink_sop為輸入第一個數(shù)據(jù)標(biāo)志信號;sink_eop為輸入最后一個數(shù)據(jù)標(biāo)志信號;sink_real為輸入實部數(shù)據(jù);sink_imag為輸入虛部數(shù)據(jù);sink_error為輸入錯誤標(biāo)志;source_ready為輸出等待狀態(tài)標(biāo)志;sink_ready為輸入等待狀態(tài)標(biāo)志;source_error為輸出錯誤標(biāo)志;source_real為結(jié)果實部數(shù)據(jù);source_imag為結(jié)果虛部數(shù)據(jù);source_exp為結(jié)果補(bǔ)償系數(shù);source_valid為結(jié)果有效信號;source_sop為
輸出第一個數(shù)據(jù)標(biāo)志信號;source_eop為輸出最后一個數(shù)據(jù)標(biāo)志信號。
3 方案設(shè)計
系統(tǒng)主要由三部分組成:A/D采集模塊、FPGA處理模塊及MCU運算顯示模塊,系統(tǒng)框圖如圖4所示。A/D采集外部信號數(shù)據(jù),將其存入FPGA內(nèi)部緩存RAM。當(dāng)FFT輸入有效時,讀取緩存中的數(shù)據(jù),同時與窗函數(shù)表中的對應(yīng)系數(shù)做乘法運算,結(jié)果輸入FFT核中,F(xiàn)FT核處理結(jié)束后將數(shù)據(jù)存入緩存RAM中。單片機(jī)讀取緩存RAM中的結(jié)果數(shù)據(jù),進(jìn)行相應(yīng)的模值計算,并通過LCD顯示結(jié)果頻譜圖形。該方案的核心在于窗函數(shù)與FFT運算核的設(shè)計與實現(xiàn)。
3.1 窗函數(shù)設(shè)計
前端數(shù)據(jù)緩存采用雙口RAM核,深度512,位寬8 bit,存放A/D采集到的信號數(shù)據(jù)。窗函數(shù)表采用ROM核,深度512,位寬8 bit,存放窗函數(shù)數(shù)據(jù)。通過Matlab生成512點Hamming窗函數(shù)系數(shù)表,由于該數(shù)據(jù)為浮點數(shù),而本設(shè)計中全部采用定點運算,故對窗函數(shù)系數(shù)進(jìn)行256倍放大,將其變?yōu)槎c整數(shù),數(shù)據(jù)范圍為0~255。將系數(shù)表生成mif文件,作為ROM的初始化文件。該RAM和ROM采用同一套讀出地址,保證相應(yīng)數(shù)據(jù)同步讀出,做乘法運算,得到16 bit結(jié)果數(shù)據(jù)。由于Hamming窗數(shù)據(jù)是實際數(shù)據(jù)的256倍,所以需要對乘法結(jié)果進(jìn)行右移8位操作,得到8bit FFT輸入數(shù)據(jù)。設(shè)計模塊如圖5所示,該模塊實現(xiàn)了輸入信號數(shù)據(jù)的加窗處理。
3.2 FFT核設(shè)計
FFT核采用MegaWizard FFT v11.1,變換點數(shù)選擇512,數(shù)據(jù)精度8 bit,引擎結(jié)構(gòu)選擇單輸出結(jié)構(gòu),引擎數(shù)為1,I/O數(shù)據(jù)流結(jié)構(gòu)選擇突發(fā)(Burst)結(jié)構(gòu)。FFT輸出數(shù)據(jù)有3種:實部數(shù)據(jù)、虛部數(shù)據(jù)和補(bǔ)償指數(shù)數(shù)據(jù)。采用兩個雙口RAM核,深度均為512,寬度均為8 bit,分別存放
FFT核的實部結(jié)果數(shù)據(jù)和虛部結(jié)果數(shù)據(jù)。由于每512個FFT輸出數(shù)據(jù),補(bǔ)償指數(shù)均相同,所以設(shè)置一個8 bit的寄存器存放補(bǔ)償指數(shù)即可。設(shè)計模塊如圖6所示,該模塊實現(xiàn)了加窗處理后的信號數(shù)據(jù)的快速傅里葉變換。
4 仿真與硬件驗證
4.1 系統(tǒng)仿真
FPGA開發(fā)環(huán)境為QuartusII 11.1,仿真環(huán)境為Modelsiml0.0。仿真時,由Matlab生成波形數(shù)據(jù)mif文件,作為仿真測試數(shù)據(jù)文件存入波形緩存RAM中。通過Quartus II調(diào)用Modesim對測試工程進(jìn)行仿真,仿真時序如圖7所示。經(jīng)時序分析可知,工作時鐘頻率為100 MHz(period= 10 ns),每進(jìn)行一次512點處理到全部輸出處理結(jié)果共耗時36.9μs。
將仿真結(jié)果數(shù)據(jù)導(dǎo)入Matlab,得到結(jié)果由圖8(a)知,對信號周期整數(shù)倍截斷FFT處理后,得到單一的正確的頻譜圖;如圖8(b)知,對信號周期非整數(shù)倍截斷FFT處理后,頻譜出現(xiàn)嚴(yán)重泄露,且幅度值下降;如圖8(c)知,對信號周期非整數(shù)倍截斷,加窗后做FFT處理,頻譜泄露現(xiàn)象有明顯的改進(jìn),但幅度值因為加窗處理而相應(yīng)下降。仿真結(jié)果表明,F(xiàn)FT系統(tǒng)設(shè)計正確,且加窗處理對信號周期非整數(shù)倍截斷導(dǎo)致的頻譜泄露問題有良好的改進(jìn)效果。
4.2 硬件驗證
ADC選用ADS9238,它是一款高速高動態(tài)范圍A/D轉(zhuǎn)換器,12 bit,最高采樣時鐘達(dá)65 MSample·s-1。MCU選用c8051F120單片機(jī),LCD選用ZLG320240K-FFSSWE-YBC,分辨率為320×240,可以滿足字符、漢字及圖形等各種顯示需求。FPGA選用Altera公司的Cyclone II EP2C8Q208 C8N,該芯片資源豐富,包含8256個LEs,36個4 kbit Block RAM,18個內(nèi)部乘法器和208個I/O資源,并支持FFT IP核。
FFT處理時鐘為100 MHz,A/D采樣率為10 MHz,采樣點數(shù)為512,故頻譜分辨率f=10 MHz/512=19.531 kHz。當(dāng)輸入信號為390.625 kHz時,512個采樣點表示20個信號周期;當(dāng)輸入信號為400.390 kHz時,512個采樣點表示20.5個信號周期。在加窗和不加窗兩種情況下分別對頻率為390.625 kHz和400.390 kHz的正弦信號進(jìn)行采樣,得到如圖9的結(jié)果。
圖9中(a)為不加窗的情況下對390.625 kHz的輸入信號進(jìn)行采樣,由于512個點正好是20倍截斷,所以只在頻譜的第20個點有單一幅值,說明FFT系統(tǒng)工作正常。而且由于是整數(shù)倍截斷,結(jié)果沒有頻譜泄露;圖9(b)為不加窗的情況下對400.390 kHz的輸入信號進(jìn)行采樣,由于512個點正好為20.5倍截斷,非整數(shù)倍截斷,所以結(jié)果中存在嚴(yán)重的頻譜泄露;圖9(c)為加窗的情況下對400.390 kHz的輸入信號進(jìn)行采樣,可以看到,頻譜泄露現(xiàn)象得到較好的改善。硬件測試結(jié)果表明,F(xiàn)FT系統(tǒng)設(shè)計正確,且加窗處理對信號周期非整數(shù)倍截斷導(dǎo)致的頻譜泄露問題有良好的改進(jìn)效果。
5 結(jié)束語
本文利用Altera公司的IP核設(shè)計了一種FFT系統(tǒng),該方法設(shè)計簡單、資源利用率高、運算速度快,試驗證明具有良好性能。同時針對非整數(shù)倍周期截斷導(dǎo)致的頻譜泄露問題,提出了一種通過加窗改進(jìn)的方法,經(jīng)硬件平臺驗證,其改進(jìn)效果明顯。由于加窗導(dǎo)致的幅值變化問題,本文尚未作詳細(xì)論證,有待進(jìn)一步的研究。