當前位置:首頁 > 測試測量 > 測試測量
[導(dǎo)讀]本文用LabVIEW對聲音進行短時能量和平均幅度分析。

引言

    語音信號是人們進行溝通和交流的主要媒介。語音具有兩重屬性,一方面語音具有表義功能;另一方面語音畢竟是一種聲音,它是由人的頭腦中產(chǎn)生的意念通過一組神經(jīng)信號去控制發(fā)音器官,變成空氣的振動信號,然后由空氣傳遞到人的耳朵或受話器中的信號。語音的基本作用是進行信息交換,構(gòu)成語音通信。在語音通信系統(tǒng)中,語音信號的傳輸存儲和處理的方式是各種各樣的。大體上說話音處理的研究可以分為以下幾個方面:語音分析、語音增強、語音編碼、話音合成和語音識別與理解。單從記錄聲音的設(shè)備來看就有留聲機、錄音機到現(xiàn)在數(shù)字化的MP3播放器,這其中的記錄技術(shù)也一直在飛速的變化中。因此,在信息社會高度發(fā)達的今天,用數(shù)字方法進行語音的傳送、存儲、識別、增強就顯得尤為必要。

LabVIEW開發(fā)平臺

    LabVIEW是目前唯一的編譯型圖形化編程語言,使用“所見即所得”的可視化技術(shù)建立人機界面,用圖標表示功能模塊,用圖標之間的連線來表示各模塊間的數(shù)據(jù)傳遞。同時,LabVIEW繼承了高級編程語言的結(jié)構(gòu)化和模塊化編程的優(yōu)點,支持模塊化與層次化設(shè)計,這種結(jié)構(gòu)的設(shè)計增強了程序的可讀性,其界面非常直觀形象。

    虛擬儀器是以計算機作為儀器的硬件支撐,充分利用計算機的運算、存儲、調(diào)用、顯示及文件管理等功能,把傳統(tǒng)儀器的專業(yè)化功能軟件化,使之與計算機結(jié)合起來融為一體,這樣便構(gòu)成了一臺從外觀到功能都完全與傳統(tǒng)儀器相同,同時又充分享用了計算機資源的儀器系統(tǒng)。傳統(tǒng)儀器通常由信號采集、信號分析、信號輸出三部分組成;虛擬儀器同樣可以劃分為數(shù)據(jù)采集、數(shù)據(jù)分析處理、顯示結(jié)果三大功能模塊。

虛擬儀器的系統(tǒng)組成

    虛擬儀器系統(tǒng)是由計算機、硬件平臺和應(yīng)用軟件組成的。從構(gòu)成方式,則有以數(shù)據(jù)采集卡(DAQ)和信號調(diào)理電路組成的PC-DAQ測試系統(tǒng);以GPIB、VXI、串行總線和現(xiàn)場總線等標準總線儀器為硬件方式組成的GPIB系統(tǒng)、VXI系統(tǒng)、串行總線系統(tǒng)、現(xiàn)場總線系統(tǒng)等。目前通常采用的方法是在計算機上插入數(shù)據(jù)采集卡,用軟件在屏幕上生成儀器面板,用軟件進行信號分析處理等。這也正是本文設(shè)計的核心。我們采用PCI總線技術(shù)開發(fā)了虛擬儀器系統(tǒng)硬件平臺,其基于PCI總線的數(shù)據(jù)采集卡包括信號調(diào)理和數(shù)據(jù)采集兩部分,數(shù)據(jù)采集卡結(jié)合計算機數(shù)據(jù)處理軟件可以構(gòu)造各種虛擬儀器。圖1為虛擬儀器系統(tǒng)構(gòu)成框圖。

圖1  虛擬儀器系統(tǒng)構(gòu)成框圖

語音信號的時域處理方法

    數(shù)字語音處理的方法常常分為時域方法、頻域方法、同態(tài)方法、線性預(yù)測編碼方法以及其他各種方法等。時域方法涉及到語音信號的波形,利用時域方法來分析的語音信號特征參數(shù)包括語音的短時平均幅度和能量,短時平均過零率,短時自相關(guān)函數(shù)以及短時平均幅度差函數(shù)等。利用這些特征參數(shù)可以分析或處理語音,如清濁音分類,基音周期檢測等。限于篇幅,這里只對短時能量和短時平均幅度進行分析。語音信號的時域分析就是分析和提取語音信號的時域參數(shù),其特點如下。

⑴表示語音信號較直觀、物理意義明確;

⑵實現(xiàn)較簡單、運算量少;

⑶可以得到語音的重要參數(shù);

⑷使用示波器等通用設(shè)備可看到變化,使用方便。

    考慮到上述優(yōu)點,本文就語音信號的時域處理方法進行系統(tǒng)的分析。

● 短時能量分析

    語音信號是一種隨時間而變化的信號,是濁音激勵還是清音激勵,濁音的基音周期以及信號幅度等都隨時間而變化,此變化又是緩慢的,可以認為在一小段時間里,例如10~20ms內(nèi)語音信號近似不變。于是,可以把語音信號分成一些短段(或稱為分析幀)來進行處理。這些短段具有固定的特性,短段間經(jīng)常有一定的重疊組成一段語音。這種方法稱為“短時”處理方法。這種短時處理方法可以用式1來表示。


         (1)


    式中T[]表示對話音進行變換,此變換不一定是線性的,也可以是非線性的。把變換后的序列乘以窗函數(shù)。這個窗序列位于與抽樣標志n相一致的時間,窗函數(shù)的寬度是有限的,然后對乘積的所有非零值求和所得到的Qn,就是在n這個時刻的T[x(k)]的部分加權(quán)平均值。短時能量通常定義為:


         (2)


    這個表示式還可以表示成:


          (3)


    圖2為相應(yīng)的數(shù)學(xué)模型原理圖。

圖2  短時能量分析數(shù)學(xué)模型

    綜上所述,語音的短時能量表示取決于h(n)的選擇或w(n)的選擇,通常使用兩種窗,其中一種為矩形窗,其窗函數(shù)如式4所示。


       (4)


    實驗結(jié)果表明,En值明顯小于濁音段的能量。因此,根據(jù)短時能量函數(shù)可以大致區(qū)分濁音和清音。在高En信噪比的情況下,利用短時能量函數(shù)也可以區(qū)分有聲和無聲。

● 短時平均幅度

    由上式定義的短時能量函數(shù)由于需要計算,因此對于高電平信號,其值經(jīng)過平方后則更大,而對于低電平信號其值為小于1的值,經(jīng)過平方后則更小。以致短時能量E(n)對于信號電平值過于敏感。為了克服這個缺點,定義了一種短時平均幅度函數(shù),見式5。平均能量的數(shù)學(xué)模型如圖3所示。

圖3  平均能量分析數(shù)學(xué)模型


          (5)


    式中用信號的絕對值代替信號的平方值。Mn能較好地反映Mn清音范圍內(nèi)的幅度變化。在這一方面,Mn要比En好,Mn所能反映幅度變化的動態(tài)范圍也要比En好。所反映清音語音和濁音語音之間的電平差不如En那樣明顯。

    短時能量與短時平均幅度的主要用途如下。

(1)可以從語音中區(qū)分出濁音來,因為濁音的能量要比清音大的多;
(2)可以用來區(qū)分聲母與韻母的分界、無聲與有聲的分界、連字的分界等;
(3)作為一種語音段信息,用于語音識別。

LabVIEW軟件設(shè)計

    軟件設(shè)計主要分為信號采集流程和處理處理流程。硬件的波形信號采集流程如圖4所示,采集后對信號進行分析和處理的流程如圖5所示,即進行平均能量和短時能量分析。

圖4  波形采集流程

圖5  聲音能量分析流程圖

實驗結(jié)果

    實驗中,通過單線耳塞(耳塞一端要把線露出來,把信號接入)將電腦上正在播放的音樂作為輸入信號,接入PCI-6025E數(shù)據(jù)采集卡中,設(shè)置數(shù)據(jù)采集卡通道為0,選擇采樣點為50,采樣率為8000,得到的實驗結(jié)果如圖6所示。選擇電腦中隨機播放的音樂作為數(shù)據(jù)輸入,而沒有直接用函數(shù)信號發(fā)生器產(chǎn)生理想的正弦波波形,是因為理想的正弦波是周期規(guī)律性變化的,對于短時平均能量或者短時平均幅度,其效果并不會那么明顯,從而更容易對數(shù)據(jù)進行分析。由圖6可見,原始聲音波形為-0.02~0.02之間,在0~100s的時間內(nèi),平均幅度比短時能量的坡度更大、更高,它們集中在0~0.3之間,比原始聲音波形的幅度要大,而短時能量的最高點也是不到0.005的幅度,100s之后,短時能量和平均幅度的趨勢基本相同,趨于0。

圖6  實驗結(jié)果的數(shù)據(jù)和曲線

結(jié)束語

    本文用LabVIEW對聲音進行短時能量和平均幅度分析??梢杂脭?shù)據(jù)采集卡對輸入信號進行采集,將信號做為一種語音段信息,對語音進行識別,并可以從語音中區(qū)分出濁音來,還可以用來區(qū)分聲母與韻母的分界、無聲與有聲的分界、連字的分界等。用LabVIEW來對聲音進行處理,比C語言的編程更加簡單,且其界面美觀,處理結(jié)果也可以直接在前面板中進行描述。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉