當(dāng)前位置:首頁(yè) > 測(cè)試測(cè)量 > 測(cè)試測(cè)量
[導(dǎo)讀]語(yǔ)音處理是目前信息學(xué)領(lǐng)域的研究熱點(diǎn)和難點(diǎn),其任務(wù)是研究如何利用信號(hào)處理技術(shù)研究語(yǔ) 音信號(hào),使未來(lái)的計(jì)算機(jī)“能聽(tīng)會(huì)說(shuō)”。語(yǔ)音信號(hào)的處理是對(duì)語(yǔ)音信號(hào)進(jìn)行分析,只有通過(guò)分析得到的參數(shù)才能做進(jìn)一步的研

語(yǔ)音處理是目前信息學(xué)領(lǐng)域的研究熱點(diǎn)和難點(diǎn),其任務(wù)是研究如何利用信號(hào)處理技術(shù)研究語(yǔ) 音信號(hào),使未來(lái)的計(jì)算機(jī)“能聽(tīng)會(huì)說(shuō)”。語(yǔ)音信號(hào)的處理是對(duì)語(yǔ)音信號(hào)進(jìn)行分析,只有通過(guò)分析得到的參數(shù)才能做進(jìn)一步的研究。語(yǔ)音分析涉及大量復(fù)雜的數(shù)學(xué)運(yùn) 算,如果采用硬件方式實(shí)現(xiàn),從價(jià)格和靈活性上都不可取。如果通過(guò)計(jì)算機(jī)軟硬件結(jié)合的方法采用主流的編程方式實(shí)現(xiàn),則存在編程復(fù)雜,不易擴(kuò)展和界面不友好等 問(wèn)題。

虛擬儀器是全新概念的最新一代測(cè)量?jī)x器,自1987年誕生以來(lái),以前所未有的速度迅猛發(fā)展。虛擬儀器與計(jì)算機(jī)軟硬件技術(shù)的發(fā)展 同步,他利用計(jì)算機(jī)強(qiáng)大的計(jì)算能力和豐富的軟硬件資源來(lái)組織儀器系統(tǒng),從而實(shí)現(xiàn)實(shí)驗(yàn)儀器系統(tǒng)的部分乃至全部的功能,并最終實(shí)現(xiàn)從傳統(tǒng)儀器向計(jì)算機(jī)的過(guò)渡。 虛擬儀器的測(cè)量功能可以由用戶(hù)根據(jù)需要自行設(shè)計(jì)軟件來(lái)定義或擴(kuò)展,而非由廠家事先定義且固定不可變更。尤其是美國(guó)NI公司的圖形化虛擬儀器開(kāi)發(fā)平臺(tái) LabVIEW,不僅編程簡(jiǎn)單功能完備,而且有多種專(zhuān)用軟件包和豐富的各種板卡可供選擇,這就為開(kāi)發(fā)一個(gè)符合要求且界面友好的語(yǔ)音分析平臺(tái)提供了便利。

1工作原理

語(yǔ)音信號(hào)一般被看作一種短時(shí)平穩(wěn)的隨機(jī)信號(hào),主要是對(duì)他進(jìn)行時(shí)域、頻域和倒譜域上的信號(hào)分析。

語(yǔ)音信號(hào)的時(shí)域分析是對(duì)信號(hào)從統(tǒng)計(jì)的意義上進(jìn)行分析,得到短時(shí)平均能量、過(guò)零率、自相關(guān)函數(shù)以及幅差函數(shù)等信號(hào)參數(shù)。根據(jù)語(yǔ)音理論,氣流激勵(lì)聲道產(chǎn)生語(yǔ) 音,語(yǔ)音信號(hào)是氣流與聲道的卷積,因此可以對(duì)信號(hào)進(jìn)行同態(tài)分析,將信號(hào)轉(zhuǎn)換到倒譜域,從而把聲道和激勵(lì)氣流信息分離,獲得信號(hào)的倒譜參數(shù)。

線性預(yù)測(cè)編碼分析是現(xiàn)代語(yǔ)音信號(hào)處理技術(shù)中最核心的技術(shù)之一,他基于全極點(diǎn)模型,其中心思想是利用若干過(guò)去的語(yǔ)音抽樣來(lái)逼近當(dāng)前的語(yǔ)音抽樣,采用最小均 方誤差逼近的方法來(lái)估計(jì)模型的參數(shù)。矢量量化是一種最基本也是極其重要的信號(hào)壓縮算法,充分利用矢量中各分量間隱含的各種內(nèi)在關(guān)系,比標(biāo)量量化性能優(yōu)越, 在語(yǔ)音編碼、語(yǔ)音識(shí)別等方向的研究中扮演著重要角色。

語(yǔ)音識(shí)別通常是指利用計(jì)算機(jī)識(shí)別語(yǔ)音信號(hào)所表示的內(nèi)容,其目的是準(zhǔn)確地理解語(yǔ)音所蘊(yùn)含的含義。語(yǔ)音識(shí)別的研究緊密跟蹤識(shí)別領(lǐng)域的最新研究成果并基本與之保持同步。

語(yǔ)音信號(hào)分析,首先需要將語(yǔ)音信號(hào)采集到計(jì)算機(jī)并做預(yù)先處理,然后通過(guò)選擇實(shí)時(shí)或延遲的方式,實(shí)現(xiàn)上述各種類(lèi)型的參數(shù)分析,并將分析結(jié)果以圖形的方式輸出或保存,從而實(shí)現(xiàn)整個(gè)平臺(tái)的功能。

2系統(tǒng)構(gòu)成

語(yǔ)音分析平臺(tái)由軟、硬件2部分組成,硬件部分的任務(wù)是通過(guò)麥克風(fēng)和聲卡將語(yǔ)音信號(hào)轉(zhuǎn)換為電信號(hào),經(jīng)過(guò)A/D轉(zhuǎn)換,以數(shù)字信號(hào)的形式傳入計(jì)算機(jī),同時(shí)具備能將語(yǔ)音波形文件通過(guò)聲卡外接耳機(jī)或音箱回放。系統(tǒng)框圖如圖1所示。

2.1硬件部分

硬件包括3個(gè)部分:拾音及信號(hào)調(diào)理電路,A/D轉(zhuǎn)換電路,PC機(jī)接口電路。由于聲卡已經(jīng)成為計(jì)算機(jī)的標(biāo)準(zhǔn)配置(集成或插卡形式),故采用聲卡、話筒的組合實(shí)現(xiàn)這部分功能,不但使用簡(jiǎn)便而且省去大量硬件設(shè)計(jì)工作。

2.2軟件部分

LabVIEW是美國(guó)NI公司推出的一種通用虛擬儀器開(kāi)發(fā)軟件,他包含豐富的功能函數(shù)庫(kù)和完備的總線設(shè)備驅(qū)動(dòng)程序。LabVIEW的一大特色是其基于圖 形的編程方式是采用數(shù)據(jù)流(dat astream)而非傳統(tǒng)的文本方式的編程方法。這種編程方式強(qiáng)調(diào)信號(hào)處理的實(shí)際過(guò)程,有利于簡(jiǎn)化編程,縮短開(kāi)發(fā)時(shí)間和降低開(kāi)發(fā)難度。

LabVIEW的編程包括前面板設(shè)計(jì)和后臺(tái)設(shè)計(jì)。前面板對(duì)應(yīng)一臺(tái)儀器的面板,實(shí)現(xiàn)對(duì)儀表的控制和信號(hào)的表達(dá)功能。LabVIEW提供了一套豐富的控制模 板庫(kù),用戶(hù)通過(guò)這些模板來(lái)設(shè)計(jì)面板的內(nèi)容。后臺(tái)對(duì)應(yīng)一臺(tái)儀器的內(nèi)部工作部分,用于實(shí)現(xiàn)儀表對(duì)信號(hào)的采集處理等操作。對(duì)應(yīng)的LabVIEW提供了一套功能模 板庫(kù),用來(lái)幫助用戶(hù)實(shí)現(xiàn)程序改造、儀器控制數(shù)據(jù)分析等功能。主要的功能模塊如下:

采集與預(yù)處理完成語(yǔ)音信號(hào)的采集,然后對(duì)信號(hào)進(jìn)行消噪處理。

時(shí)域處理主要包括短時(shí)分析與預(yù)處理、短時(shí)能量、短時(shí)平均幅度和短時(shí)平均過(guò)零率、語(yǔ)音端點(diǎn)檢測(cè)、短時(shí)自相關(guān)函數(shù)、短時(shí)平均幅度差函數(shù)和基音周期估計(jì)等。

頻域處理主要包括基于短時(shí)傅里葉分析與重構(gòu)、復(fù)倒譜和倒譜分析、聯(lián)合時(shí)頻分析。

預(yù)測(cè)與量化主要包括語(yǔ)音信號(hào)預(yù)測(cè)編碼分析和矢量量化。

語(yǔ)音識(shí)別主要包括特征表示與提取、譜失真測(cè)度、模板匹配技術(shù)、隱馬爾可夫模型技術(shù)、孤立詞及連接詞識(shí)別、大詞匯量連續(xù)語(yǔ)音識(shí)別和說(shuō)話人識(shí)別。

與Matlab軟件接口通過(guò)LabVIEW提供的Script Node子VI連接主流算法仿真分析軟件Matlab,充分發(fā)揮后者強(qiáng)大的數(shù)據(jù)處理能力。盡管LabVIEW中提供了一些信息處理功能函數(shù),但是畢竟功能 有限,仍無(wú)法滿(mǎn)足用戶(hù)各種各樣的數(shù)值計(jì)算和分析的需求。而Matlab特別擅長(zhǎng)數(shù)值分析和處理,如果能夠在LabVIEW中調(diào)用他的話,不失為一種較好的 解決方法。

軟件在實(shí)現(xiàn)過(guò)程中,充分利用LabVIEW軟件本身所提供的豐富的應(yīng)用分析工具包如數(shù)字濾波器、頻域分析等工具模塊,避免大量的軟硬件開(kāi)發(fā)工作。

3結(jié)語(yǔ)

通過(guò)上述方法構(gòu)建的語(yǔ)音分析平臺(tái),界面豐富友好,操作使用方便,并且能不斷隨著虛擬儀器技術(shù)和計(jì)算機(jī)軟硬件技術(shù)的進(jìn)步而升級(jí)。特別重要的是用戶(hù)可以在該平臺(tái)上開(kāi)發(fā)驗(yàn)證新的語(yǔ)音信號(hào)分析處理算法。

參考文獻(xiàn)

[1]蔡蓮紅,黃德智,蔡銳.現(xiàn)代語(yǔ)音技術(shù)基礎(chǔ)與應(yīng)用[M].北京:清華大學(xué)出版社,2003.

[2]易克初,田斌,付強(qiáng).語(yǔ)音信號(hào)處理[M].北京:國(guó)防工業(yè)出版社,2000.

[3]劉君華,郭會(huì)軍.基于LabVIEW的虛擬儀器設(shè)計(jì)[M].北京:電子工業(yè)出版社,2002.
 

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車(chē)的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車(chē)技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車(chē)工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車(chē)。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車(chē) 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶(hù)希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱(chēng),數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱(chēng)"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉