當(dāng)前位置:首頁 > 電源 > 數(shù)字電源
[導(dǎo)讀]設(shè)計(jì)實(shí)現(xiàn)了基于FPGA的256點(diǎn)定點(diǎn)FFT處理器。處理器以基-2算法為基礎(chǔ),通過采用高效的兩路輸入移位寄存器流水線結(jié)構(gòu),有效提高了碟形運(yùn)算單元的運(yùn)算效率,減少了寄存器資源的使用,提高了最大工作頻率,增大了數(shù)據(jù)吞吐量,并且使得處理器具有良好的可擴(kuò)展性。詳細(xì)描述了具體設(shè)計(jì)的算法結(jié)構(gòu)和各個(gè)模塊的實(shí)現(xiàn)。設(shè)計(jì)采用Verilog HDL作為硬件描述語言,采用QuartusⅡ設(shè)計(jì)仿真工具進(jìn)行設(shè)計(jì)、綜合和仿真,仿真結(jié)果表明,處理器工作頻率為72 MHz,是一種高效的FFT處理器IP核。

0 引言
    快速傅里葉變換(FFT)在雷達(dá)、通信和電子對(duì)抗等領(lǐng)域有廣泛應(yīng)用。近年來現(xiàn)場可編程門陣列(FPGA)的飛速發(fā)展,與DSP技術(shù)相比,由于其并行信號(hào)處理結(jié)構(gòu),使得FPGA能夠很好地適用于高速信號(hào)處理系統(tǒng)。由于Altera等公司研制的FFT IP核,價(jià)錢昂貴,不適合大規(guī)模應(yīng)用,在特定領(lǐng)域中,設(shè)計(jì)適合于自己領(lǐng)域需要的FFT處理器是較為實(shí)際的選擇。
    本文設(shè)計(jì)的FFT處理器,基于FPGA技術(shù),由于采用移位寄存器流水線結(jié)構(gòu),實(shí)現(xiàn)了兩路數(shù)據(jù)的同時(shí)輸入,相比傳統(tǒng)的級(jí)聯(lián)結(jié)構(gòu),提高了蝶形運(yùn)算單元的運(yùn)算效率,減小了輸出延時(shí),降低了芯片資源的使用。在OFDM系統(tǒng)的實(shí)際應(yīng)用中,因它可以采用快速傅里葉變換,能方便快捷地實(shí)現(xiàn)調(diào)制和解調(diào),故結(jié)合MIMO技術(shù),設(shè)計(jì)的FFT處理器結(jié)構(gòu),可以很好地應(yīng)用于2根天線的MIMO-OFDM系統(tǒng)中。

1 FFT處理的應(yīng)用及DIF FFT算法原理
    圖1給出一個(gè)2根天線MIMO-OFDM系統(tǒng)中FFT的使用??焖俑道锶~變換算法基本上分為兩大類:時(shí)域抽取(DIT)和頻域抽取(DIF),這里設(shè)計(jì)的FFT處理器采用基-2 DIF算法。



    對(duì)于N點(diǎn)序列x(N),其傅里葉變換

   


    將x(n)分成上、下兩部分,得:
   
    這樣將兩個(gè)N點(diǎn)的DFT分成兩個(gè)N/2點(diǎn)的DFT,分的方法是將x(k)按序號(hào)k的奇、偶分開。通過這種方式繼續(xù)分下去,直到得到兩點(diǎn)的DFT。采用DIF方法設(shè)計(jì)的FFT,其輸入是正序,輸出是按照奇偶分開的倒序。

2 移位寄存器流水線結(jié)構(gòu)的FFT
    在傳統(tǒng)流水線結(jié)構(gòu)的FFT中,需要將全部數(shù)據(jù)輸入寄存器后,可開始蝶形運(yùn)算。在基-2 DIF算法中可以發(fā)現(xiàn),當(dāng)前N/2個(gè)數(shù)據(jù)進(jìn)入寄存器后,運(yùn)算便可以開始,此后進(jìn)入的第N/2+1個(gè)數(shù)據(jù)與寄存器第一個(gè)數(shù)據(jù)進(jìn)行蝶形運(yùn)算,以此類推。
    由于采用頻域抽取法,不需要對(duì)輸入的數(shù)據(jù)進(jìn)行倒序處理,簡化了地址控制,這樣,可以采用移位寄存器的方式,依次將前N/2個(gè)數(shù)據(jù)移入移位寄存器,在N/2+l時(shí)刻,第一個(gè)數(shù)據(jù)移出移位寄存器,參與運(yùn)算。相對(duì)于傳統(tǒng)的RAM讀寫方式,采用移位寄存器存儲(chǔ)結(jié)構(gòu)綜合后的最大工作頻率為500 MHz,遠(yuǎn)大于RAM方式的166 MHz。
    當(dāng)移位寄存器相繼有數(shù)據(jù)移出時(shí),在移位寄存器中會(huì)出現(xiàn)空白位。此時(shí),引入第二路數(shù)據(jù),在第一路數(shù)據(jù)依次移出進(jìn)行蝶算時(shí),第二路數(shù)據(jù)依次補(bǔ)充到移位寄存器的空白位中,為運(yùn)算做準(zhǔn)備。通過這樣一種類似“乒乓操作”的結(jié)構(gòu),可以使蝶形運(yùn)算模塊中的數(shù)據(jù)不間斷地輸入,運(yùn)算效率達(dá)到100%。不同于傳統(tǒng)的“乒乓操作”結(jié)構(gòu),由于使用移位寄存器,不需要兩塊RAM,可以省掉一半的寄存器。圖2為256點(diǎn)FFT處理器的第一級(jí)結(jié)構(gòu)。

[!--empirenews.page--]
    基于上述基本原理,將這種移位寄存器結(jié)構(gòu)擴(kuò)展到整個(gè)FFT系統(tǒng)的各級(jí),可以發(fā)現(xiàn)各級(jí)使用的移位寄存器數(shù)量是遞減的。現(xiàn)使用一個(gè)8點(diǎn)結(jié)構(gòu)來進(jìn)行說明。
    如圖3所示,數(shù)據(jù)由輸入l和輸入2進(jìn)入第一級(jí)。通過開關(guān)進(jìn)行選通控制。由于是N=8的運(yùn)算,所以各級(jí)分別加入4級(jí)、2級(jí)和1級(jí)的移位寄存器。


    分兩路來說明運(yùn)算過程:
    將K1打到位置①,第一路數(shù)據(jù)進(jìn)入移位寄存器,待第一路的前4個(gè)數(shù)據(jù)存入4級(jí)移位寄存器后,第一路進(jìn)入的第5個(gè)數(shù)據(jù)與移位寄存器移出的第1個(gè)數(shù)據(jù)進(jìn)行蝶形運(yùn)算。
    由于輸出結(jié)果有上下兩路,第二級(jí)是一個(gè)四點(diǎn)的DFT,所以對(duì)于上路的輸出結(jié)果x0(0)+x0(4)類似于第一級(jí),直接存入下一級(jí)寄存器,為四點(diǎn)運(yùn)算做準(zhǔn)備,下路的輸出,先存入本級(jí)2級(jí)移位寄存器中,等到上路的四點(diǎn)運(yùn)算開始,第二級(jí)的移位寄存器有空白位時(shí),移入第二級(jí),為下路的四點(diǎn)運(yùn)算做準(zhǔn)備。所以第一級(jí)蝶形運(yùn)算上路輸出前N/4=2個(gè)進(jìn)入下一級(jí)寄存器,下路輸出的數(shù)據(jù)依次存入本級(jí)移位寄存器中。
    當(dāng)?shù)谝患?jí)的輸出前N/4=2個(gè)數(shù)據(jù)x0(0)+x0(4)和x0(1)+x0(5)存入第二級(jí)移位寄存器時(shí),運(yùn)算便可以開始,這時(shí)開關(guān)K2打到位置②,此時(shí)第一級(jí)上路輸出的數(shù)據(jù)x0(2)+x0(6),即第一級(jí)上路輸出的第三個(gè)數(shù)據(jù)與第二級(jí)移位寄存器移出的第一個(gè)數(shù)據(jù),即x0(O)+x0(4)進(jìn)行蝶形運(yùn)算,輸出的第四個(gè)數(shù)據(jù)x0(3)+x0(7)與x0(1)+x0(5)進(jìn)行蝶算。在這個(gè)運(yùn)算過程中,第一級(jí)的2級(jí)移位寄存器移出數(shù)據(jù)依次移位存入到第二級(jí)的移位寄存器產(chǎn)生的空白位中。
    兩個(gè)時(shí)鐘后,第一級(jí)上路輸出的四個(gè)數(shù)據(jù)完成了蝶形運(yùn)算,K2打到位置①,在接下來的兩個(gè)時(shí)鐘里,第一級(jí)中2級(jí)移位寄存器的輸出依次與此時(shí)第二級(jí)中2級(jí)移位寄存器的輸出數(shù)據(jù)進(jìn)行蝶形運(yùn)算,即與,與完成第一級(jí)下路輸出的四個(gè)數(shù)據(jù)的蝶形運(yùn)算。
    此時(shí),第一路在第一級(jí)運(yùn)算后的輸出數(shù)據(jù),在第二級(jí)完成了全部的蝶形運(yùn)算。第二級(jí)的輸出結(jié)果同第一級(jí)一樣,蝶形運(yùn)算的上路輸出前N/8=1個(gè)進(jìn)入下一級(jí)寄存器,后一個(gè)數(shù)據(jù)直接進(jìn)入后一級(jí)進(jìn)行碟算,下路輸出的數(shù)據(jù)存入本級(jí)移位寄存器中。
    第三級(jí)的運(yùn)算與第二級(jí)和第一級(jí)類似,即移入1級(jí)寄存器的數(shù)據(jù)與其后一個(gè)數(shù)據(jù)進(jìn)行碟算,同時(shí)使前一級(jí)寄存器的輸出數(shù)據(jù)進(jìn)入后一級(jí)寄存器的空白位中,然后開關(guān)打到位置②,對(duì)下路輸出數(shù)據(jù)進(jìn)行碟算。
    對(duì)于第二路數(shù)據(jù),通過開關(guān)控制,在第二級(jí)中,待第一路第一級(jí)下路輸出數(shù)據(jù)進(jìn)行蝶形運(yùn)算時(shí),移入寄存器的空白位,為運(yùn)算做準(zhǔn)備,由于前級(jí)運(yùn)算周期是后級(jí)運(yùn)周期的兩倍,對(duì)于第二級(jí)碟算模塊而言,數(shù)據(jù)仍然是不間斷輸入的。通過這樣兩路數(shù)據(jù)的交替運(yùn)算和存儲(chǔ),實(shí)現(xiàn)“乒乓操作”,從而提高了蝶形運(yùn)算模塊的運(yùn)算效率。圖4是256點(diǎn)FFT的具體運(yùn)算輸入和輸出時(shí)序圖。對(duì)于只有一路數(shù)據(jù)的應(yīng)用場合,可以在前級(jí)加入,門控開關(guān)和數(shù)據(jù)緩沖寄存器分成兩路數(shù)據(jù),實(shí)現(xiàn)一路數(shù)據(jù)的不間斷讀入。


    由于采用移位寄存器結(jié)梅,各級(jí)寄存器使用的數(shù)量都是固定的,即為N/2+N/4。其中,N為該級(jí)DFT運(yùn)算的點(diǎn)數(shù),各級(jí)使用的移位寄存器深度逐級(jí)遞減,從而大大降低了寄存器的使用數(shù)量。
    此外,由于各級(jí)結(jié)構(gòu)固定,所以大點(diǎn)數(shù)FFT只是小點(diǎn)數(shù)FFT基礎(chǔ)上級(jí)數(shù)的增加,而且由于移位寄存器的輸出相對(duì)于RAM而言不需要復(fù)雜的地址控制,所以這種結(jié)構(gòu)的FFT處理器具有非常好的可擴(kuò)展性。比如需要實(shí)現(xiàn)512點(diǎn)的FFT,只需要在256點(diǎn)的基礎(chǔ)上增加一級(jí)即可。

3 具體模塊的設(shè)計(jì)
3.1 控制與地址產(chǎn)生模塊

    由于兩路數(shù)據(jù)同時(shí)輸入,為了防止發(fā)生兩路數(shù)據(jù)間的串?dāng)_,對(duì)數(shù)據(jù)的控制顯得極其關(guān)鍵。從上面的算法結(jié)構(gòu)分析中知道,由于后級(jí)的DFT運(yùn)算點(diǎn)數(shù)是前一級(jí)的一半,所以后一級(jí)的開關(guān)轉(zhuǎn)換周期也是前一級(jí)的一半,基于這種關(guān)系,可以使用一個(gè)8位計(jì)數(shù)器的每一位狀態(tài)來對(duì)各級(jí)開關(guān)進(jìn)行控制。最高位控制第一級(jí),同時(shí)由于上一級(jí)數(shù)據(jù)進(jìn)入下一級(jí)需要一個(gè)時(shí)鐘,所以下一級(jí)的開關(guān)轉(zhuǎn)換時(shí)刻要比上一級(jí)延遲一個(gè)時(shí)鐘周期。[!--empirenews.page--]
    對(duì)于移位寄存器,在實(shí)現(xiàn)時(shí),各級(jí)的前級(jí)移位寄存器深度為N/2-1,從本質(zhì)而言,是使運(yùn)算開始的時(shí)鐘上升沿到來時(shí),數(shù)據(jù)已經(jīng)出現(xiàn)在碟算模塊輸入線上,而不需要下一個(gè)時(shí)鐘的驅(qū)動(dòng)來移出寄存器,比如第二級(jí)移位寄存器的級(jí)數(shù)為63。這樣,運(yùn)算周期正好是2的倍數(shù),從而方便使用計(jì)數(shù)器的各位直接對(duì)開關(guān)進(jìn)行控制。
    同時(shí),計(jì)數(shù)器還可以用來產(chǎn)生所需旋轉(zhuǎn)因子的RAM地址。根據(jù)各級(jí)蝶形運(yùn)算所需旋轉(zhuǎn)因子的規(guī)律,可以利用計(jì)數(shù)器的高位補(bǔ)零來產(chǎn)生查找表的地址。比如,對(duì)于第一級(jí),因?yàn)樾枰谧畹臀坏谝淮纬霈F(xiàn)1時(shí)提供,第二次出現(xiàn)1時(shí)提供,…,以此類推,周期為128,所以可以使用計(jì)數(shù)器的低七位作為地址。對(duì)于第二級(jí),由于所需要的地址為偶數(shù),可以由計(jì)數(shù)器的[6:1]和最低位置O產(chǎn)生。表l為8點(diǎn)時(shí)使用三位計(jì)數(shù)器輸出旋轉(zhuǎn)因子的地址情況。


    控制和地址產(chǎn)生模塊的仿真結(jié)果如圖5所示,其中sel代表開關(guān)控制,addr代表產(chǎn)生的地址。


3.2 蝶形運(yùn)算模塊
    蝶算模塊由一個(gè)復(fù)數(shù)加法器,一個(gè)復(fù)數(shù)減法器和一個(gè)旋轉(zhuǎn)因子的復(fù)數(shù)乘法器構(gòu)成,如圖6所示。


    旋轉(zhuǎn)因子乘法器通常由4次實(shí)數(shù)乘法和2次加/減法運(yùn)算實(shí)現(xiàn),但因?yàn)閏os和sin的值可以預(yù)先存儲(chǔ),通過下面的算法可以簡化復(fù)數(shù)乘法器:
    (1)存儲(chǔ)如下三個(gè)系數(shù):C,C+S,C-S
    (2)計(jì)算:E=X-Y和Z=C*E=C*(X-Y)
    (3)用R=(C-S)*Y+Z,I=(C+S)*X-Z,
得到需要的結(jié)果。
    這種算法使用了3次乘法,1次加法和2次減法,但是需要使用存儲(chǔ)3個(gè)表的ROM資源。
    設(shè)計(jì)中數(shù)據(jù)的輸入為16位復(fù)數(shù),所以將旋轉(zhuǎn)因子cos(2kπ/N),sin(2kπ/N)量化成帶符號(hào)數(shù)的16位二進(jìn)制數(shù)后,存儲(chǔ)到ROM中,由于值域不同,需要注意C+S和C-S的表要比C表多1位精度。
    運(yùn)算后的結(jié)果需要除以量化時(shí)乘以的倍數(shù)16b011111llllllllll。具體實(shí)現(xiàn)時(shí)由于除法運(yùn)算在FPGA器件需要消耗較多的資源,設(shè)計(jì)中采用二進(jìn)制數(shù)移位的方法來實(shí)現(xiàn)除法運(yùn)算。為了防止數(shù)據(jù)溢出,設(shè)計(jì)對(duì)輸出結(jié)果除以2。圖7為蝶形運(yùn)算模塊的RTL級(jí)結(jié)構(gòu)圖。


[!--empirenews.page--]3.3 倒序輸出模塊
    由頻域抽取的基-2算法可知,運(yùn)算結(jié)果需要倒序輸出??梢韵葘⒔Y(jié)果存儲(chǔ)到RAM中,然后使用O~255的二進(jìn)制數(shù)倒序產(chǎn)生RAM讀取地址,依次將結(jié)果讀出,其中實(shí)現(xiàn)一個(gè)8位二進(jìn)制數(shù)倒序的算法如下:
    (1)將8位數(shù)字的相鄰兩位交換位置;
    (2)將相鄰的兩位看作1組,相鄰兩組交換位置;
    (3)將相鄰的4位看作1組,相鄰兩組交換位置。
    經(jīng)過這樣的交換位置后,輸出即為原來8位二進(jìn)制數(shù)的倒序。
    舉例對(duì)于8位二進(jìn)制數(shù)10110110來說,第一次交換位置的結(jié)果是01111001,第二次交換位置的結(jié)果是11010110,最后交換位置的結(jié)果是01101101??梢娬檬窃瓉頂?shù)字的倒序。
    另外,由于設(shè)計(jì)的是兩路數(shù)據(jù)同時(shí)寫入,一路數(shù)據(jù)讀出,所以讀取的頻率是寫入頻率的2倍,使用PLL實(shí)現(xiàn)原始時(shí)鐘的二倍頻,用來讀取RAM。倒序模塊仿真結(jié)果如圖8所示。


    最終生成的FFT處理器模塊圖如圖9所示。

 



4 仿真結(jié)果
    各級(jí)間數(shù)據(jù)時(shí)序情況如圖10所示,設(shè)計(jì)的FFT處理器仿真結(jié)果如圖1l所示。采用一路階梯遞增信號(hào)和另一路:XXXX信號(hào)進(jìn)行仿真,通過與Matlab計(jì)算結(jié)果進(jìn)行對(duì)比,結(jié)果基本一致,可以滿足系統(tǒng)要求。系統(tǒng)總的延時(shí)由延時(shí)最大的第一級(jí)決定,為第一級(jí)運(yùn)算的延時(shí)加上倒序輸出的延時(shí),總共是(256+128)×clk,相對(duì)于一般流水線結(jié)構(gòu)(256×讀入周期+7×128×蝶算周期+128×讀入周期),系統(tǒng)延時(shí)大為減少。


    通過仿真可知,系統(tǒng)最大頻率由蝶形運(yùn)算模塊的最大工作頻率決定。使用QuartusⅡ軟件時(shí)序仿真后,得到處理器的工作頻率為72 MHz。

5 結(jié)語
    通過采用移位寄存器流水線結(jié)構(gòu),可以有效地提高FFT處理器中蝶形運(yùn)算單元的效率,減少寄存器的使用數(shù)量,并且簡化了地址控制,提高處理器的工作頻率,具有良好的可擴(kuò)展性,同時(shí)可以實(shí)現(xiàn)兩路數(shù)據(jù)的同時(shí)輸入,從而增大了一倍的數(shù)據(jù)吞吐量。對(duì)于工作頻率要求較高,數(shù)據(jù)吞吐量較大,尤其對(duì)于需要兩路數(shù)據(jù)輸入的場合,比如兩天線的MIMO-OFDM系統(tǒng),具有很大的實(shí)用價(jià)值。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉