基于FPGA的語音信號LPC參數(shù)提取算法的實現(xiàn)

時間：2010-05-20 13:59:59

關(guān)鍵字： FPGA 語音信號 LPC BSP

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀]　摘要: 介紹語音信號LPC分析中部分相關(guān)系數(shù)的舒爾遞推算法的FPGA實現(xiàn)，給出了電路設(shè)計思想及具體電路結(jié)構(gòu)，并對其工作過程進行了詳細分析說明，為嵌入式系統(tǒng)設(shè)計提供了一種有效手段?！　￡P(guān)鍵詞: 部分相關(guān)系數(shù) 舒

　摘要: 介紹語音信號LPC分析中部分相關(guān)系數(shù)的舒爾遞推算法的FPGA實現(xiàn)，給出了電路設(shè)計思想及具體電路結(jié)構(gòu)，并對其工作過程進行了詳細分析說明，為嵌入式系統(tǒng)設(shè)計提供了一種有效手段。

　　關(guān)鍵詞: 部分相關(guān)系數(shù) 舒爾遞推算法 FPGA 并行處理技術(shù)

　　隨著語音技術(shù)應(yīng)用的發(fā)展，越來越多的語音信號數(shù)字處理系統(tǒng)需要按照實時方式或在線方式工作，特別在嵌入式系統(tǒng)設(shè)計中，對系統(tǒng)的硬件環(huán)境要求更高。隨著語音處理算法的日益復(fù)雜，用普通處理器對語音信號進行實時處理，已顯得力不從心。本文將采用新一代現(xiàn)場可編程門陣列FLEX10K系列的FPGA芯片實現(xiàn)語音信號的LPC分析，并通過舒爾(Schur)遞推算法，提取語音信號處理中的重要參數(shù)——部分相關(guān)系數(shù)，即PARCOR系數(shù)。

1 LPC分析及舒爾遞推算法

1.1 LPC分析基本原理

　　線性預(yù)測分析(LPC)是對一給定的時域離散線性系統(tǒng)用輸出信號的過去值的線性組合來估計即將到來的輸出值。即某一時刻n的語音信號的估計值為:

　　按均方誤差最小準則，即LMS算法，可求得預(yù)測器最佳預(yù)測系數(shù)a_i應(yīng)滿足下列方程組:

這組方程稱為LPC正則方程，其中R(l)稱為自關(guān)函數(shù)，它們是進行LPC分析的基礎(chǔ)。

1.2 舒爾遞推算法

將正則方程作適當變換，定義一個變量Q_l^(m)如下:

　其中r(l)=R(l)/R(0)為歸一化自關(guān)函數(shù)。

　　根據(jù)Q_l^(m)的性質(zhì)和正交定理[1]可證明部分相關(guān)系數(shù)K^(m)與Q_l^(m)有下列關(guān)系:

　　由于部分相關(guān)系數(shù)K⁽¹⁾～K^(P)與最佳預(yù)測系數(shù)a₁^(P)～a_P^(P)間存在簡單對應(yīng)關(guān)系，因而部分相關(guān)系數(shù)K^(m)被廣泛應(yīng)用于語音識別、語音合成和低速語音編譯器中。

2 系統(tǒng)設(shè)計

2.1 系統(tǒng)總體設(shè)計

　　由于語音信號具有短時平穩(wěn)性，因此在進行處理時需進行分幀處理，然后逐幀對語音信號進行LPC分析。本系統(tǒng)中，語音信號S(n)的精度為12位，采樣率為20k，幀長為10ms，相應(yīng)于每幀有200個采樣點，每幀提取的部分相關(guān)系數(shù)K^(m)的階數(shù)取為12。

　　對取出的每幀語音S(n)還需進行加窗處理，即用窗函數(shù)W(n)乘S(n)，形成加窗語音信號S_W(n)。為減小Gibbs效應(yīng)的影響，本系統(tǒng)采用的窗函數(shù)為哈明窗。

　　為實現(xiàn)語音信號的LPC分析過程，選擇FLEX10K系列中的EPF10K100器件作為目標芯片進行設(shè)計，因其具有獨特的嵌入式陣列塊EAB而特別適合于對數(shù)字信號進行處理^[2-4]。系統(tǒng)設(shè)計中，采用自頂向下的設(shè)計思想，在頂層采用電路原理圖的設(shè)計方法將系統(tǒng)分為幾個功能模塊，在底層則采用VHDL語言來實現(xiàn)各功能模塊的設(shè)計。為保證系統(tǒng)整體的處理速度，電路設(shè)計采用了流水線作業(yè)方式，以數(shù)據(jù)流驅(qū)動各模塊協(xié)調(diào)工作，同時在一些影響系統(tǒng)整體速度的環(huán)節(jié)采用了并行處理技術(shù)，很好地解決了制約系統(tǒng)速度的“瓶頸”。

　　系統(tǒng)的原理框圖如圖1所示。圖中U3、U10分別為由EAB構(gòu)成的200×12bit和12×12bit的雙口RAM陣列;U₉為由EAB構(gòu)成的200×12bit的ROM查找表，內(nèi)置n=0～199的窗函數(shù)值W(n);U₂、U₄、U₆為數(shù)據(jù)緩沖器;U₇、U₈分別為自關(guān)函數(shù)模塊和舒爾遞推算法模塊;U₁為多路轉(zhuǎn)換開關(guān);U₅是12位乘法器。

　　系統(tǒng)工作原理如下:將一幀語音信號S(n)經(jīng)U1送入U₃，同時啟動加窗過程，窗函數(shù)值W(n)通過查找ROM表U₉獲得，將取出的W_n和S_n送入乘法器U₅相乘，乘積經(jīng)U2和U1又送回U3，得到加窗語音信號S_W(n)，然后將S_W(n)送入自關(guān)函數(shù)模塊U7算出歸一化自關(guān)函數(shù)r(n)，再將r(n)送入舒爾遞推模塊求出部分相關(guān)系數(shù)K^(m)，存入U₁₀。至此，一幀數(shù)據(jù)的LPC分析即告結(jié)束。

2.2 自關(guān)函數(shù)模塊

　　自關(guān)函數(shù)的計算是影響系統(tǒng)速度的關(guān)鍵環(huán)節(jié)，它要進行大量的乘積累加操作。為提高系統(tǒng)運行速度，將加窗語音信號S_W(n)同時存入兩組RAM，采用并行取數(shù)的方式，同時取出參與運算的兩個量，進行乘法運算，運算結(jié)果立即送入累加器進行累加。而此時乘法器又可進行下一對數(shù)據(jù)的乘積運算。整個過程中，乘法器和累加器一直在并行工作，從而保證了系統(tǒng)的流水線操作持續(xù)進行，最大限度地保證了系統(tǒng)的運行速度。

　　自關(guān)函數(shù)模塊的原理框圖如圖2所示。圖中U₁、U₂為EAB構(gòu)成的200×12bit的雙口RAM陣列;U₈是帶清零功能的數(shù)據(jù)寄存器，U₇為加法器，它們二者共同構(gòu)成累加器，為保證中間運算結(jié)果的精度，累加器的寬度為32位;U₃、U₄、U₆、U₉、U₁₀為數(shù)據(jù)寄存器;U₅為12位乘法器，乘積為24位;U₁₁為32位除法器，商取16位。

　　該模塊的工作過程是:將前面得到的加窗語音信號S_W(n)同時存入U₁和U₂，然后按要求從中同時取出兩乘數(shù)S_n和S_n+l送入乘法器U₅進行乘運算，將乘積作為一個操作數(shù)同U8中的數(shù)進行累加。U8起始值被置為零，以后的值就是各次累加的和，最后一次累加的結(jié)果就是自關(guān)函數(shù)R(l)的值。然后再將它的值送入U₁₀，將它同U9中的R(0)相除即得歸一化的自關(guān)函數(shù)值r(l)。整個過程中，由于采用了并行處理技術(shù)，乘法器U₅和累加器U₇與U₈一直處于工作狀態(tài)，從而保證了系統(tǒng)的高速運行。

2.3 舒爾遞推模塊

　　舒爾遞推算法一個很重要的特點是在整個遞推過程中全部參與運算的量的初值、中間值和最終值皆小于1，因此特別適宜于采用定點運算的硬件系統(tǒng)來實現(xiàn)。該模塊的設(shè)計也采用雙RAM結(jié)構(gòu)和同時取數(shù)同時運算的并行處理技術(shù)，所有運算單元的精度都是16位，每處理一次遞推過程，就輸出一個K(m)值。

　　舒爾遞推模塊的原理框圖如圖3所示。圖中U₂、U₃為12×16bit的雙口RAM;U₄、U₆、U₇、U₈、U₉、U₁₁、U₁₃為數(shù)據(jù)寄存器;U₅、U₁₀、U₁₂分別為16位的除法器、乘法器和加法器;U₁為多路轉(zhuǎn)換開關(guān)。該模塊的工作過程是:當歸一化自關(guān)函數(shù)r(l)通過U₁送入U₂和U₃后，立即從中取出Qm和Q0送入除法器U5進行除運算，除得的結(jié)果送入U₈;與此同時又分別從U₂和U₃中同時取出Ql和Q_m-l，將Q_m-l與Km在U₁₀相乘后，送入U₁₁，接著與Q_l在U₁₂進行相加，將結(jié)果經(jīng)U₁₃、U₁重新送回U₂和U₃，接著又進行下一輪遞推，該過程一直要進行到遞推階數(shù)完成。在每一次遞推過程中，當U12在進行當前數(shù)據(jù)的加運算時，U₁₀就可進行下一個數(shù)據(jù)的乘運算。這樣整個過程就可在連續(xù)的流水線方式不間斷地進行。

2.4 算術(shù)運算單元

　　本系統(tǒng)所用到的算術(shù)運算單元有加法器、乘法器和除法器三種。加法器采用標準的全加器來構(gòu)成，而乘法器則采用2的補碼的BOOTH乘法器。下面介紹除法器的設(shè)計思想和工作原理。

　　由于本系統(tǒng)所使用的除法運算都是商小于1的除法，而且除法運算又比乘法運算少得多，因此對速度的影響也較小。綜合考慮速度和資源占用兩方面因素后，設(shè)計了下面的算法來實現(xiàn)除法器。設(shè)有兩個數(shù)A和B，A是被除數(shù)，B是除數(shù)，現(xiàn)在求它們的商Q=A/B，Q<1?，F(xiàn)將Q表示成下列形式:

　　由于上述算法只需進行減法運算和除2運算，所以非常便于用硬件實現(xiàn)，據(jù)此算法設(shè)計的除法器原理框圖如圖4所示。圖中U₂為并入并出移位寄存器，每右移一位，實現(xiàn)一次除2操作;U₅為補碼器，它由反相器和加一電路構(gòu)成，用于對B求補碼;U₇為串入并出移位寄存器;U₆為比較器，用于對A、B兩輸入數(shù)進行比較，若A≥B，則輸出“1”，否則輸出“0”;U₃為數(shù)據(jù)寄存器;U1為多路轉(zhuǎn)換器;U₄為加法器。該電路按下述原理工作:被除數(shù)A經(jīng)U1送入U3并加到比較器U6的A端，除數(shù)B送入U₂后右移一位再加到U₆的B端。經(jīng)U₆比較后，若輸出“1”，則先將U6的輸出移入移位寄存器U7，再將A與B送入由U₄和U₅組成的減法器進行減法運算，所得差值再經(jīng)U₁送入U₃;若輸出為“0”，則僅將U6的輸出移入U7即可。該步完成后，又將U₂右移一位，再重復(fù)上述過程。整個操作一共要進行K次，最后U7中的數(shù)即為A/B的商。

　　在本系統(tǒng)中，將LPC分析與FPGA技術(shù)結(jié)合，充分利用了FPGA作為一種快速、高效的硬件平臺在數(shù)字信號處理領(lǐng)域所具有的獨特優(yōu)勢，實現(xiàn)了語音信號特征參數(shù)的快速提取，為語音信號的進一步處理打下基礎(chǔ)。本系統(tǒng)采用50MHz的時鐘頻率進行工作。為考察其工作性能，對其整體性能指標進行了評估。由于影響整個系統(tǒng)速度的是乘法累加運算，因此它的工作性能也就決定了系統(tǒng)的性能。在求歸一化自關(guān)函數(shù)r(l)過程中，涉及到近200次的乘積累加，采用并行處理技術(shù)和流水線操作方式的FPGA則可以用接近50MHz的數(shù)據(jù)速率進行工作，整個系統(tǒng)的性能同其他芯片相比約提高40%～60%，因此用FPGA技術(shù)來處理語音信號具有得天獨厚的優(yōu)點。

本系統(tǒng)除具有處理速度快的特點外，還具有獨立靈活的輸入輸出接口及一組檢測和控制信號線，可以方便地同任何一種處理器直接連接。由于FPGA自身所具有的抗干擾能力強、可靠性高的優(yōu)點，本系統(tǒng)可廣泛應(yīng)用于自動控制、工業(yè)機器人、語音合成和語音編譯碼等領(lǐng)域，特別對嵌入式系統(tǒng)的設(shè)計具有重要意義。