突發(fā)通信中Turbo碼的FPGA實(shí)現(xiàn)
1 Turbo碼編碼器的FPGA實(shí)現(xiàn)
Turbo碼的編碼器是由兩個RSC(遞歸系統(tǒng)卷積碼)分量編碼器和一個交織器組成。RSC碼不僅具有系統(tǒng)碼的優(yōu)點(diǎn),而且對于一個RSC碼,總存在一個具有完全相同柵格結(jié)構(gòu)的NSC碼(非系統(tǒng)卷積碼)。本系統(tǒng)中使用兩個相同的RSC編碼器,生成的多項(xiàng)式都是G=[1,15/13],系統(tǒng)編碼率為1/3。
交織器的功能是利用隨機(jī)化的思想將兩個相互獨(dú)立的短碼組合成一個長的隨機(jī)碼。本課題中Turbo碼交織器的實(shí)現(xiàn)是構(gòu)造一個交織地址發(fā)生器,并根據(jù)輸入的幀長信息,實(shí)時地產(chǎn)生交織地址序列。
圖1為編碼器的FPGA實(shí)現(xiàn)結(jié)構(gòu)圖。編碼前,地址發(fā)生器獲取幀長信息,完成交織地址生成的準(zhǔn)備過程。編碼時,信息序列被依次寫入雙口RAM,待寫完一幀數(shù)據(jù)后,地址產(chǎn)生器開始生成順序地址和交織地址。雙口RAM按兩個地址讀取信息序列X和交織后的信息序列X’進(jìn)行RSC編碼;最后編碼器輸出系統(tǒng)位X和校驗(yàn)位P0和P1。
2 Turbo碼譯碼器的FPGA實(shí)現(xiàn)
Turbo碼譯碼器比較復(fù)雜,下面從譯碼器的接口、內(nèi)部結(jié)構(gòu)、內(nèi)部的時序控制、分量譯碼MAX-Log-MAP算法和SISO模塊的實(shí)現(xiàn)五個方面來詳細(xì)闡述譯碼器的FPGA實(shí)現(xiàn)。
2.1 譯碼器的接口
Turbo碼譯碼器頂層模塊的接口管腳如表1所示。
2.2 譯碼器的內(nèi)部結(jié)構(gòu)
Turbo碼譯碼器由兩個軟輸入/軟輸出分量譯碼器、交織器以及相應(yīng)的解交織器構(gòu)成。譯碼是信息在兩個分量譯碼器之間迭代運(yùn)算的過程。在迭代運(yùn)算中,上一次運(yùn)算得到uk的外信息Λe(uk)作為下一次運(yùn)算uk的先驗(yàn)信息Λa(uk)。Turbo碼分量譯碼器譯碼算法主要有MAP類(最大后驗(yàn)概率譯碼算法)和SOVA類(軟判決Viterbi譯碼算法)[3]。本文采用運(yùn)算復(fù)雜度和性能都適中的MAX-Log-MAP算法。Turbo碼譯碼器FPGA實(shí)現(xiàn)的內(nèi)部結(jié)構(gòu)如圖2所示。
地址發(fā)生器與編碼器相同,用于數(shù)據(jù)的交織和解交織。輸入數(shù)據(jù)存儲器用于存儲輸入的接收數(shù)據(jù),包括系統(tǒng)信息序列存儲器以及各個校驗(yàn)序列存儲器。外信息存儲器用于存儲迭代譯碼產(chǎn)生的外信息。由于外信息要作為下一次譯碼的先驗(yàn)信息,所以這里的外信息存儲器有兩塊,交替存儲兩個分量譯碼器的外信息。SISO模塊即為軟輸入、軟輸出分量譯碼器。整個Turbo碼譯碼器有兩個SISO分量譯碼模塊。但為了節(jié)省資源,本方案只設(shè)計(jì)了一個SISO模塊,將時分復(fù)用作為兩個分量譯碼器。圖2中,表示接收碼字中的系統(tǒng)位,表示接收碼字中的校驗(yàn)位。
2.3 譯碼器內(nèi)部的時序控制
Turbo碼譯碼器內(nèi)部的時序控制由狀態(tài)機(jī)完成。整個譯碼過程分為初始化、接收數(shù)據(jù)存儲、迭代譯碼及硬判決輸出四個過程,且對應(yīng)于狀態(tài)機(jī)的INIT、STORAGE、SISO和OUT四個狀態(tài)。譯碼器的內(nèi)部狀態(tài)轉(zhuǎn)移如圖3所示。初始狀態(tài)INIT完成幀長設(shè)定等初始化工作,并完成交織地址生成的準(zhǔn)備過程,一旦指示第一個數(shù)據(jù)輸入的fd信號有效(高有效)時,則進(jìn)入STORAGE狀態(tài);狀態(tài)STORAGE完成將接收數(shù)據(jù)序列存入單口RAM中,待一幀數(shù)據(jù)寫完后,指示存儲完畢的rdyStr信號置高,進(jìn)入SISO狀態(tài);在狀態(tài)SISO下,SISO分量譯碼器根據(jù)設(shè)定的迭代次數(shù)對接收數(shù)據(jù)進(jìn)行迭代譯碼。當(dāng)?shù)瓿蓵r,rdySiso置高,進(jìn)入OUT狀態(tài);對數(shù)據(jù)硬判決輸出并計(jì)數(shù),此時輸出有效信號ready置高,待全部判決完畢后返回INIT狀態(tài)。
2.4 分量譯碼算法——MAX-Log-MAP算法
MAP算法需要大量的乘法運(yùn)算和指數(shù)運(yùn)算以及大量的存儲,運(yùn)算十分復(fù)雜。Log-MAP算法則將MAP算法中的乘法運(yùn)算轉(zhuǎn)換為對數(shù)域中的加法運(yùn)算(不需要對數(shù)運(yùn)算),適合工程實(shí)現(xiàn)。因此在工程實(shí)現(xiàn)時,可以將原來在對數(shù)域內(nèi)的加法運(yùn)算轉(zhuǎn)換為取兩個數(shù)的較大者加上一個修正項(xiàng)的運(yùn)算。如果將修正項(xiàng)的運(yùn)算也省略,則Log-MAP算法可簡化為MAX-Log-MAP算法。MAX-Log-MAP算法的主要計(jì)算步驟如下[4~5]:
(1)計(jì)算Turbo碼編碼網(wǎng)格圖上分支的路徑度量值:
由于Lc值對譯碼性能影響不大[6],為了方便定點(diǎn)實(shí)現(xiàn),本文中簡化為Lc=1。
2.5 SISO模塊的實(shí)現(xiàn)
分量譯碼器的FPGA實(shí)現(xiàn)的SISO模塊采用模塊化設(shè)計(jì),主要包括前向度量計(jì)算模塊、反向度量計(jì)算及對數(shù)似然比計(jì)算模塊、前向度量存儲器以及歸一化度量存儲器。由于前向度量計(jì)算和反向度量計(jì)算均需要計(jì)算分支度量,因此可以預(yù)先計(jì)算并存儲分支度量。但在本方案中,為了節(jié)省存儲空間,并沒有對分支度量進(jìn)行存儲,而是在前向與反向度量計(jì)算時均計(jì)算一次,而且在反向度量計(jì)算收斂后同時計(jì)算對數(shù)似然比。
用FPGA對算法進(jìn)行定點(diǎn)實(shí)現(xiàn)時,需要考慮到溢出的問題。為防止計(jì)算過程中出現(xiàn)溢出,對前向度量和反向度量計(jì)算過程進(jìn)行歸一化處理。若某時刻的歸一化度量值選擇當(dāng)前時刻前向度量中的最大值,則歸一化便是前向度量和反向度量減去此最大值。歸一化后的前向度量和反向度量計(jì)算公式如下:
SISO模塊內(nèi)部處理流程分為初始化、前向度量計(jì)算和存儲、反向度量計(jì)算和對數(shù)似然值計(jì)算三個部分,且對應(yīng)于狀態(tài)機(jī)的三個狀態(tài)INIT、FSM和RSM。SISO模塊的內(nèi)部時序如圖4所示。INIT狀態(tài)完成內(nèi)部寄存器的初始化設(shè)置,當(dāng)外部輸入信號Siso_start有效時,啟動SISO模塊,進(jìn)入FSM狀態(tài);FSM狀態(tài)中,每8個時鐘周期內(nèi),用式(1)和式(2)計(jì)算出一個時刻對應(yīng)的8個前向度量值,并選擇出其中的最大前向度量值作為歸一化度量值,用式(8)計(jì)算歸一化后的前向度量值。啟動一次前向度量寫信號,存儲當(dāng)前計(jì)算得到的8個前向度量值和當(dāng)前歸一化度量值。當(dāng)所有前向度量計(jì)算完畢時,啟動Fsmrdy信號,進(jìn)入RSM狀態(tài);每10個時鐘周期內(nèi),用式(1)和式(2)計(jì)算出一個時刻對應(yīng)的8個反向度量值,用式(9)計(jì)算歸一化后的反向度量值,用式(4)和式(5)計(jì)算出相應(yīng)時刻的對數(shù)似然比和外信息對數(shù)似然比,并將外信息對數(shù)似然比存儲起來。當(dāng)所有計(jì)算都完成時,啟動Rsmrdy信號,進(jìn)入INIT狀態(tài)。
由于本方案中SISO模塊將時分復(fù)用作為兩個分量譯碼器,對應(yīng)于一次譯碼迭代的兩個半迭代過程。因此圖4中的Decoder_num為低時,SISO模塊作為第一個分量譯碼器,進(jìn)行第一個半迭代運(yùn)算;Decoder_num為高時,SISO模塊作為第二個分量譯碼器,進(jìn)行第二個半迭代運(yùn)算。每次半迭代產(chǎn)生的對數(shù)似然比信息作為下次半迭代的先驗(yàn)信息。用兩塊RAM存儲兩次半迭代產(chǎn)生的外信息對數(shù)似然比。第一個半迭代時,從第二個外信息存儲器中讀取上一次半迭代產(chǎn)生的外信息對數(shù)似然比作為先驗(yàn)信息,計(jì)算得到外信息對數(shù)似然比后存儲到第一個外信息存儲器中;第二個半迭代時,從第一個外信息存儲器中讀取上一次半迭代產(chǎn)生的外信息對數(shù)似然比作為先驗(yàn)信息,計(jì)算得到外信息對數(shù)似然比后存儲到第二個外信息存儲器中。每幀數(shù)據(jù)譯碼的第一次迭代中的第一個半迭代的先驗(yàn)信息設(shè)為0。
迭代滿足迭代終止準(zhǔn)則后,譯碼器停止迭代,由信息的對數(shù)似然比值硬判決輸出譯碼結(jié)果。工程中常用的迭代終止準(zhǔn)則是設(shè)置最大迭代次數(shù)。最大迭代次數(shù)的設(shè)定需要綜合考慮誤碼率性能和系統(tǒng)吞吐量性能。
3 Turbo碼編譯碼器的性能
基于以上提出的Turbo碼編譯碼器的FPGA實(shí)現(xiàn)方案,本文在Xilinx公司的Virtex2系列的XC2V500-6fg256 FPGA芯片上,實(shí)現(xiàn)了幀長在64~1 024范圍之間可變的Turbo編譯碼器。輸入數(shù)據(jù)4bit量化,內(nèi)部數(shù)據(jù)位寬選擇12bit,編碼器模塊和譯碼器模塊在同一塊FPGA芯片上實(shí)現(xiàn)。綜合后時鐘最小周期為7.188ns ,對應(yīng)最高時鐘頻率為139.121MHz,所占的資源如表2所示。
延遲與吞吐量是衡量譯碼器性能的兩個主要指標(biāo)。延遲定義為從第一個數(shù)據(jù)輸入到第一個數(shù)據(jù)輸出間的時間差。吞吐量定義為平均每秒能處理的數(shù)據(jù)量。在幀長為1 024、迭代次數(shù)為5的條件下,譯碼器延時約為1.4ms,吞吐量約為0.72Mbps。
最后,對幀長為128、256、512和1 024四種條件的Turbo碼譯碼器進(jìn)行了誤碼率性能測試。測試系統(tǒng)中加入高斯白噪聲,數(shù)據(jù)采用 BPSK調(diào)制,譯碼器5次迭代。測試結(jié)果的性能曲線如圖5所示。測試結(jié)果表明,在信噪比低于4dB的條件下,跳頻數(shù)傳通信系統(tǒng)采用Turbo編譯碼方案,誤碼率小于10-5,達(dá)到了數(shù)據(jù)傳輸可靠性的要求。由于譯碼器的幀長在64~1 024范圍內(nèi)可變,因此非常適合應(yīng)用在突發(fā)數(shù)據(jù)通信中的差錯控制中。
參考文獻(xiàn)
1 Berrou C, Glavieux A, Thitimajshima P. Near shannon limit error-correcting codeing and decoding: turbo codes. in Proc.ICC′93, Geneva, Switzerland, May. 1993:1064~1070
2 Berrou C. Near optimum error correcting coding and decoding-turbo-codes. IEEE Transcations On Communications, 1996;44(10)
3 萬 蕾. Turbo碼及其在第三代移動通信系統(tǒng)中的應(yīng)用. 北京理工大學(xué)博士學(xué)位論文,2001
4 Robertson P, Villebrun E, Hoeher P. A comparison of optimal and suboptimal MAP decoding algorithms operation in the log domain. in Proc.ICC’95,Seattle,WA,June 1995:1009~1013
5 劉東華. Turbo碼原理與應(yīng)用技術(shù). 北京:電子工業(yè)出版社,2004
6 Worm A, hoeher P, When N. Turbo-decoding without SNR estimation. IEEE Commmun,2000;(4):193~195