當前位置:首頁 > 電源 > 數(shù)字電源
[導讀]近年來,高性能數(shù)字信號處理芯片DSP(Digital Signal Process)技術(shù)的迅速發(fā)展,為語音識別的實時實現(xiàn)提供了可能,其中,AD公司的數(shù)字信號處理芯片以其良好的性價比和代碼的可移植性被廣泛地應(yīng)用于各個領(lǐng)域。因此,我們

近年來,高性能數(shù)字信號處理芯片DSP(Digital Signal Process)技術(shù)的迅速發(fā)展,為語音識別的實時實現(xiàn)提供了可能,其中,AD公司的數(shù)字信號處理芯片以其良好的性價比和代碼的可移植性被廣泛地應(yīng)用于各個領(lǐng)域。因此,我們采用AD公司的定點DSP處理芯片ADSP2181實現(xiàn)了語音信號的識別。

  1 語音識別的基本過程

  根據(jù)實際中的應(yīng)用不同,語音識別系統(tǒng)可以分為:特定人與非特定人的識別、獨立詞與連續(xù)詞的識別、小詞匯量與大詞匯量以及無限詞匯量的識別。但無論那種語音識別系統(tǒng),其基本原理和處理方法都大體類似。一個典型的語音識別系統(tǒng)的原理圖如圖1所示。

  


 

  語音識別過程主要包括語音信號的預(yù)處理、特征提取、模式匹配幾個部分。預(yù)處理包括預(yù)濾波、采樣和量化、加窗、端點檢測、預(yù)加重等過程。語音信號識別最重要的一環(huán)就是特征參數(shù)提取。提取的特征參數(shù)必須滿足以下的要求:

  (1)提取的特征參數(shù)能有效地代表語音特征,具有很好的區(qū)分性;

  (2)各階參數(shù)之間有良好的獨立性;

  (3)特征參數(shù)要計算方便,最好有高效的算法,以保證語音識別的實時實現(xiàn)。

  在訓練階段,將特征參數(shù)進行一定的處理后,為每個詞條建立一個模型,保存為模板庫。在識別階段,語音信號經(jīng)過相同的通道得到語音特征參數(shù),生成測試模板,與參考模板進行匹配,將匹配分數(shù)最高的參考模板作為識別結(jié)果。同時,還可以在很多先驗知識的幫助下,提高識別的準確率。

  2 系統(tǒng)的硬件結(jié)構(gòu)

  2.1 ADSP2181的特點

  AD公司的DSP處理芯片ADSP2181是一種16b的定點DSP芯片,他內(nèi)部存儲空間大、運算功能強、接口能力強。有以下的主要特點:

  (1)采用哈佛結(jié)構(gòu),外接16.67MHz晶振,指令周期為30ns,指令速度為33MI/s,所有指令單周期執(zhí)行;

  (2)片內(nèi)集成了80 kB的存儲器:16 kB字的(24b)的程序存儲器和16kB字(16b)的數(shù)據(jù)存儲器;

  (3)內(nèi)部有3個獨立的計算單元:算術(shù)邏輯單元(ALU)、乘累加器(MAC)和桶形移位器(SHIFT),其中乘累加器支持多精度和自動無偏差舍人;

  (4)一個16b的內(nèi)部DMA端口(1DMA),供片內(nèi)存儲器的高速存取;一個8b自舉DMA(BDMA)口,用于從自舉程序存儲器中裝載數(shù)據(jù)和程序;

  (5)6個外部中斷,并且可以設(shè)置優(yōu)先級或屏蔽等。

  由于ADSP2181以上的特點,使得該芯片構(gòu)成的系統(tǒng)體積小、性能高、成本和功耗低,能較好地實現(xiàn)語音識別算法

  2.2 系統(tǒng)的硬件結(jié)構(gòu)

  在構(gòu)成語音識別電路時,我們采用了ADSP2181的主從結(jié)構(gòu)設(shè)計方式,通過IDMA口由CPU裝載程序。語音識別系統(tǒng)的硬件結(jié)構(gòu)如圖2所示。

  

 

  在這種結(jié)構(gòu)中,PC機為主CPU,ADSP2181為從CPU,由PC機通過IDMA口將程序裝載到ADSP2181的內(nèi)部存儲器中。PC機總線通過CPLD譯碼,形成IRD,IWR,IAL,IS等控制信號,與ADSP2181的IDMA口相連。這樣,在ADSP2181全速運行時,主機可以查詢從機的運行狀態(tài),可以訪問到ADSP2181內(nèi)部所有的程序存儲器和數(shù)據(jù)存儲器。這對程序的編譯和調(diào)試,以及語音信號的實時處理帶來了極大的方便。

  3 語音識別的DSP實現(xiàn)技術(shù)

  3.1 浮點運算的定點實現(xiàn)

  在語音識別的算法中,有許多的浮點運算。用定點DSP來實現(xiàn)浮點運算是在編寫語音識別程序中需要首先解決的問題。這個問題可以通過數(shù)的定標方法來實現(xiàn)。數(shù)的定標就是決定小數(shù)點在定點數(shù)中的位置。Q表示法是一種常用的定標方法。其表示機制是:

  設(shè)定點數(shù)是J,浮點數(shù)是)/,則Q法表示的定點數(shù)與浮點數(shù)的轉(zhuǎn)換關(guān)系為:

  浮點數(shù))/轉(zhuǎn)換為定點數(shù)x:x= (int)y×2Q;

  定點數(shù)z轉(zhuǎn)換為浮點數(shù)y:y =(float)x×2-Q。[!--empirenews.page--]
 3.2 數(shù)據(jù)精度的處理

  用16b的定點DSP實現(xiàn)語音識別算法時,雖然程序的運行速度提高了,但是數(shù)據(jù)精度比較低。這可能由于中間過程的累計誤差而引起運算結(jié)果的不正確。為了提高數(shù)據(jù)的運算精度,在程序中采用了以下的處理方法:

  (1)擴展精度

  在精度要求比較高的地方,將計算的中間變量采用32b,甚至48b來表示。這樣,在指令條數(shù)增加不多的情況下卻使運算精度大大提高了。

  (2)采用偽浮點法來表示浮點數(shù)

  偽浮點法即用尾數(shù)+指數(shù)的方法來表示浮點數(shù)。這時,數(shù)據(jù)塊的尾數(shù)可以采用Q1.15數(shù)據(jù)格式,數(shù)據(jù)塊的指數(shù)相同。這種表示數(shù)據(jù)的方法有足夠大的數(shù)據(jù)范圍,可以完全滿足數(shù)據(jù)精度的要求,但是需要自己編寫一套指數(shù)和尾數(shù)運算庫,會額外增加程序的指令數(shù)和運算量,不利于實時實現(xiàn)。

  以上兩種方法,都可以提高運算精度,但在實際操作時,要根據(jù)系統(tǒng)的要求和算法的復(fù)雜度,來權(quán)衡考慮。

  3.3 變量的維護

  在高級語言中,有全局變量與局部變量存儲的區(qū)別,但在DSP程序中,所有聲明的變量在鏈接時都會分給數(shù)據(jù)空間。所以如果按照高級語言那樣定義局部變量,就會浪費大量的DSP存儲空間,這對數(shù)據(jù)空間較為緊張的定點DSP來說,顯然是不合理的。為了節(jié)省存儲空間,在編寫DSP程序時,最好維護好一張變量表。每進入一個DSP子模塊時,不要急于分配新的局部變量,應(yīng)優(yōu)先使用已分配但不用的變量。只有在不夠時才分配新的局部變量。

  3.4 循環(huán)嵌套的處理

  語音識別算法的實現(xiàn),有許多是在循環(huán)中實現(xiàn)的。對于循環(huán)的處理,需要注意以下幾個問題:

  (1)ADSP2100系列DSP芯片中,循環(huán)嵌套最多不能超過4重,否則就會發(fā)生堆棧溢出,導致程序不能正確執(zhí)行。但在語音識別的DSP程序中,包括中斷在內(nèi)的嵌套程序往往超過4重。這時不能使用DSP提供的do…unTIl…指令,只能自己設(shè)計出一些循環(huán)變量,自己維護這些變量。由于這時沒有使用DSP的循環(huán)堆棧,所以也不會導致堆棧溢出。另外,如果采用jump指令從循環(huán)指令中跳出,則必須維護好PC,LOOP和CNTR三個堆棧的指針。

  (2)盡量減少循環(huán)體內(nèi)的指令數(shù)。在多重循環(huán)的內(nèi)部,減少指令數(shù)有利于降低程序的執(zhí)行次數(shù)。這樣有利于減少程序的執(zhí)行時間、提高操作的實時性。

  3.5 采用模塊化的程序設(shè)計方法

  在語音識別算法的實現(xiàn)中,為了便于程序的設(shè)計和調(diào)試,采用了模塊化的程序設(shè)計方法。以語音識別的基本過程為依據(jù)進行模塊劃分,每個模塊再劃分為若干個子模塊,然后以模塊為單元進行編程和調(diào)試。在編寫程序之前,首先用高級語言對每個模塊進行算法仿真,在此基礎(chǔ)上再進行匯編程序的編寫。在調(diào)試時,可以采用高級語言與匯編語言對比的調(diào)試方式,這樣可以通過跟蹤高級語言與匯編語言的中間狀態(tài),來驗證匯編語言的正確性,并及時的發(fā)現(xiàn)和修改錯誤,縮短編程周期。另外,在程序的編寫過程中,應(yīng)在關(guān)鍵的部分加上必要的注釋與說明,以增強程序的可讀性。

  在總調(diào)時,需要在各模塊中設(shè)置好相應(yīng)的人口參數(shù)與出口參數(shù),維護好堆棧指針與中間變量等。

  3.6 利用C語言與匯編語言的混合編程

  現(xiàn)在,大多數(shù)的DSP芯片都支持匯編語言與C或C++語言的混合編程,ADSP2181也不例外。用C語言開發(fā)DSP程序具有縮短開發(fā)周期、降低程序復(fù)雜度的優(yōu)點,但是,程序的執(zhí)行效率卻不高,會增加額外的機器周期,不利于程序的實時實現(xiàn)。為此,在用C語言編寫語音識別算法時,我們采用了定點化處理技術(shù)。ADSP2181是16位定點處理器,定點化處理應(yīng)注意以下幾個問題:

  (1)ADSP2181支持小數(shù)和整數(shù)兩種運算方式,在計算時應(yīng)選擇小數(shù)方式,使計算結(jié)果的絕對值都小于1;

  (2)用雙字定點運算庫代替C語言的浮點庫,提高運算精度;

  (3)注意在每次乘加運算之后進行飽和操作,防止結(jié)果的上溢和下溢;

  (4)循環(huán)處理后的一組數(shù)據(jù)可能有不同的指數(shù),要進行歸一化處理,以便后續(xù)定點操作對指數(shù)和尾數(shù)部分分別處理。

  4 結(jié) 語

  用定點DSP芯片構(gòu)成的語音識別系統(tǒng)有著廣泛的應(yīng)用前景,在編寫語音識別算法時,對其進行定點化處理以及一些原則和方法對其他類似的算法也有著現(xiàn)實指導意義。在實際應(yīng)用中,應(yīng)注意根據(jù)DSP芯片的特點,對算法進行優(yōu)化,使得DSP芯片的性能得到充分的發(fā)揮。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉