當(dāng)前位置:首頁(yè) > 汽車電子 > 汽車電子
[導(dǎo)讀]隨著現(xiàn)代電子技術(shù)在汽車系統(tǒng)中的不斷應(yīng)用,越來(lái)越多的車載電器加入到車身電子行列中,使得汽車的各種性能都得到了極大的改善,但汽車駕駛室的開(kāi)關(guān)也越來(lái)越多, 這就為駕駛員行車中對(duì)車載電器的操作提出了更高的要求,

隨著現(xiàn)代電子技術(shù)在汽車系統(tǒng)中的不斷應(yīng)用,越來(lái)越多的車載電器加入到車身電子行列中,使得汽車的各種性能都得到了極大的改善,但汽車駕駛室的開(kāi)關(guān)也越來(lái)越多, 這就為駕駛員行車中對(duì)車載電器的操作提出了更高的要求,同時(shí)也給行車過(guò)程帶來(lái)了不安全的隱患。隨著語(yǔ)音識(shí)別算法的改進(jìn)和新一代Soc專用語(yǔ)音處理芯片的問(wèn)世,使用語(yǔ)音命令控制汽車電器的操作能夠部分用口代替手的功能,從而減輕駕駛員操作負(fù)擔(dān),提高行車安全系數(shù)?!?/p>

目前我國(guó)的車身電子語(yǔ)音控制主要集中在汽車導(dǎo)航系統(tǒng)的應(yīng)用上,沒(méi)有充分發(fā)揮語(yǔ)音識(shí)別技術(shù)在車身電子中的應(yīng)用價(jià)值。本文提出了一種的以專用語(yǔ)音處理芯片UniSpeech-SDA80D51為核心控制車載音響操作的設(shè)計(jì)方案,并在SL1102C1型車載音響上實(shí)現(xiàn)了對(duì)非特定人的語(yǔ)音識(shí)別與控制?! ?/p>

語(yǔ)音控制器硬件  

車載語(yǔ)音控制器系統(tǒng)由定向拾音器、語(yǔ)音識(shí)別模塊、控制模塊和音響模塊組成。系統(tǒng)的功能是:由拾音器采集駕駛員發(fā)出的語(yǔ)音命令,利用語(yǔ)音識(shí)別模塊將拾音器輸出的語(yǔ)音物理聲音信號(hào)轉(zhuǎn)變成語(yǔ)音數(shù)字信號(hào),并識(shí)別出語(yǔ)音命令對(duì)應(yīng)的漢字或詞語(yǔ),之后由控制模塊產(chǎn)生與之對(duì)應(yīng)的詞條編碼指令,通過(guò)系統(tǒng)I/O口線將控制命令傳達(dá)給音響,車載音響接收到控制指令產(chǎn)生動(dòng)作,響應(yīng)駕駛員的語(yǔ)音命令,比如快進(jìn)、快退或音量調(diào)節(jié)等。系統(tǒng)結(jié)構(gòu)及原理框圖如圖1 所示:

  

語(yǔ)音識(shí)別模塊主要由UniSpeech-SDA80D51芯片及外圍電路組成。本模塊主要實(shí)現(xiàn)對(duì)輸入的非特定人語(yǔ)音信號(hào)的識(shí)別和處理功能,輸出與語(yǔ)音命令對(duì)應(yīng)的詞條編碼。
  
SDA80D51是Infineon公司專為語(yǔ)音識(shí)別和語(yǔ)音處理應(yīng)用領(lǐng)域新推出的專用芯片,采用高集成度的Soc系統(tǒng)結(jié)構(gòu)以0.18μm半導(dǎo)體工藝制造,擁有8位高速增強(qiáng)型M8051核心(25MIPS)和16位定點(diǎn)DSP核心OAK(100MIPS)的雙核架構(gòu),片內(nèi)集成了直接雙訪問(wèn)快速SRAM、2路ADC和2路DAC(有效精度為12Bit)、多種通信接口和通用GPIO等設(shè)備,外部只需擴(kuò)展Flash存儲(chǔ)器等少量外圍電路即可構(gòu)成完整應(yīng)用系統(tǒng)?! ?/p>

控制模塊由MCU和模擬開(kāi)關(guān)電路構(gòu)成,本模塊主要完成對(duì)語(yǔ)音識(shí)別模塊輸出的識(shí)別結(jié)果--詞條編碼信號(hào)進(jìn)行邏輯分析和處理,通過(guò)模擬開(kāi)關(guān)電路產(chǎn)生對(duì)應(yīng)功能的控制信號(hào)輸出到音響,控制音響的操作。其中MCU選用美國(guó)ATMEL公司產(chǎn)品AT89S51,由于車載音響SL1102C1上的按鍵控制面板為電阻式分流鍵盤電路,采用電壓采樣識(shí)別模式,對(duì)不同鍵值進(jìn)行識(shí)別,綜合SDA80D51芯片輸出的I/O電壓特性,確定使用繼電器模擬SL1102C1控制面板按鍵的閉合和斷開(kāi)動(dòng)作。  

本設(shè)計(jì)是基于安徽森力公司的SL1102C1汽車音響。SL1102C1是專門為中檔轎車設(shè)計(jì)的汽車音響,具有MP3播放、收音機(jī)和顯示時(shí)間等功能,目前大量使用在江淮同悅轎車上。SL1102C1前板共有15個(gè)按鍵和一個(gè)用來(lái)調(diào)節(jié)音量的編碼開(kāi)關(guān)。分別為開(kāi)關(guān)機(jī)/靜音、音效設(shè)置、6個(gè)臺(tái)位、播放/暫停、隨機(jī)播放、重復(fù)播放、瀏覽播放、選擇下曲(快進(jìn))、選擇上曲(快退)、向下搜臺(tái)/上一曲、向上鎖臺(tái)/下一曲、模式轉(zhuǎn)換、電臺(tái)瀏覽/自動(dòng)存儲(chǔ)臺(tái)、波段切換、顯示時(shí)間/時(shí)間設(shè)置和復(fù)位等功能?! ?/p>

音響前板上的按鍵為電壓采樣識(shí)別方式,按鍵包含短按(延時(shí)小于0.2s)和長(zhǎng)按(延時(shí)大于1s)兩種動(dòng)作,控制模塊MCU(AT89S51)的輸出電壓為TTL電平,直接采用MCU信號(hào)驅(qū)動(dòng)音響按鍵動(dòng)作容易引起誤識(shí)別,造成系統(tǒng)誤操作,因此本文采用模擬開(kāi)關(guān)電路,很好地解決了上述問(wèn)題。當(dāng)AT89S51接收到語(yǔ)音模塊輸出的一個(gè)語(yǔ)音命令識(shí)別結(jié)果編碼信號(hào)后,立即進(jìn)行邏輯分析并輸出對(duì)應(yīng)的控制信號(hào)驅(qū)動(dòng)相應(yīng)繼電器吸合模擬按鍵動(dòng)作,按鍵的短按和長(zhǎng)按功能是通過(guò)軟件實(shí)現(xiàn)的?!?/p>

系統(tǒng)軟件設(shè)計(jì)  

系統(tǒng)的軟件包括:非特定人語(yǔ)音識(shí)別模塊和邏輯控制模塊?! ?/p>

非特定人語(yǔ)音識(shí)別模塊基于HMM 模型算法。該算法通過(guò)對(duì)大量語(yǔ)音數(shù)據(jù)進(jìn)行數(shù)據(jù)統(tǒng)計(jì),建立識(shí)別詞條的統(tǒng)計(jì)模型語(yǔ)音庫(kù),然后從待識(shí)別語(yǔ)音中提取特征,與模型庫(kù)進(jìn)行匹配,由比較匹配分?jǐn)?shù)得到識(shí)別結(jié)果,并通過(guò)SDA80D51的GPIO口輸出識(shí)別結(jié)果對(duì)應(yīng)的詞條編碼信號(hào)。語(yǔ)音識(shí)別模塊主要由信號(hào)預(yù)處理、特征參數(shù)提取、模型匹配和Viterbi算法部分組成?! ?/p>

信號(hào)預(yù)處理部分主要完成輸入語(yǔ)音信號(hào)的采樣、 模/數(shù)轉(zhuǎn)換功能。A/D變換由SDA80D51內(nèi)嵌12位A/D變換器實(shí)現(xiàn),采樣頻率固定為8 kHz.  

特征參數(shù)提取基于語(yǔ)音幀,采用分幀提取特片。先對(duì)語(yǔ)音信號(hào)進(jìn)行重疊分幀,前一幀和后一幀重疊一半(幀信號(hào)重疊是體現(xiàn)相鄰兩幀數(shù)據(jù)之間的相關(guān)性),幀長(zhǎng)為25ms,對(duì)每幀提取一次語(yǔ)音特片?! ?/p>

MFCC參數(shù)屬于感知頻域倒譜參數(shù),反映了語(yǔ)音信號(hào)短時(shí)幅度譜的特征。p維MFCC參數(shù)的提取過(guò)程如圖1所示?! ?/p>

其中:m是幀號(hào),N是單位幀內(nèi)的采樣點(diǎn)數(shù)。  

HMM是描述語(yǔ)音信號(hào)的一種概率統(tǒng)計(jì)模型,使用 MarKov鏈來(lái)模擬語(yǔ)音信號(hào)統(tǒng)計(jì)特性的變化,HMM模型是在Markov鏈的基礎(chǔ)上發(fā)展起來(lái)的?! ?/p>

Viterbi算法是一種幀同步動(dòng)態(tài)規(guī)整算法,在給定觀察值序列和模型時(shí),Viterbi算法給出了一個(gè)概率密度P(Q,O | λ)最大的狀態(tài)序列。  

控制模塊的主要功能是:在單片機(jī)查詢到語(yǔ)音模塊輸出的語(yǔ)音詞條信號(hào)后,查表獲得詞條編碼,根據(jù)編碼判斷對(duì)應(yīng)按鍵是長(zhǎng)按或短按,分別進(jìn)入相應(yīng)的子程序處理,長(zhǎng)按子程序延時(shí)1s,短按子程序延時(shí)0.2s.在子程序中,輸出語(yǔ)音命令所對(duì)應(yīng)的I/O控制信號(hào)驅(qū)動(dòng)繼電器吸合模擬按鍵或編碼開(kāi)關(guān)動(dòng)作,并及時(shí)復(fù)位I/O口。為了避免語(yǔ)音控制和手動(dòng)控制之間沖突,語(yǔ)音控制模塊可以完全兼容于手動(dòng)控制,在語(yǔ)音控制操作時(shí),同時(shí)可以進(jìn)行手動(dòng)控制。  

實(shí)驗(yàn)結(jié)果及結(jié)論  

本系統(tǒng)的樣機(jī)實(shí)驗(yàn)主要是測(cè)試非特定人的語(yǔ)音識(shí)別率和模擬開(kāi)關(guān)動(dòng)作的準(zhǔn)確率。由于汽車音響的語(yǔ)音詞條為2~4個(gè)字,語(yǔ)音識(shí)別率實(shí)驗(yàn)內(nèi)容為車載音響常用2字詞條指令18條、3字詞條指令12條、4字詞條指令10條,實(shí)驗(yàn)對(duì)象為6人4男、2女(普通話和方言),實(shí)驗(yàn)環(huán)境為噪聲干擾環(huán)境和相對(duì)安靜環(huán)境,樣機(jī)測(cè)試結(jié)果如表1所示?! ?/p>

由表1可知,系統(tǒng)的識(shí)別率與語(yǔ)音指令詞條字?jǐn)?shù)、麥克接收距離、說(shuō)話人方言及環(huán)境有關(guān)。4字詞識(shí)別率高于2字詞,相對(duì)安靜環(huán)境下識(shí)別率可以達(dá)到90%以上,男聲和女聲的識(shí)別率接近。有噪聲干擾環(huán)境中識(shí)別率下降。為了提高系統(tǒng)的識(shí)別率,系統(tǒng)樣機(jī)采用奧林巴斯 ME52定向麥克(在表中沒(méi)有反映),提高了麥克接收范圍,使系統(tǒng)總體的識(shí)別率上升到95%.  

在系統(tǒng)樣機(jī)控制電路實(shí)驗(yàn)中,模擬開(kāi)關(guān)動(dòng)作達(dá)到了較高的準(zhǔn)確率,測(cè)試結(jié)果為98%以上,只要控制程序運(yùn)行正常,各路繼電器就能按照程序安排執(zhí)行閉合和斷開(kāi)模擬手動(dòng)開(kāi)關(guān)操作?! ?/p>

實(shí)現(xiàn)汽車電器的語(yǔ)音控制是未來(lái)車載電器的發(fā)展趨勢(shì),越來(lái)越多的解決方案在不斷的被提出和驗(yàn)證。本文提出的設(shè)計(jì)是在SL1102C1型車載音響上使用SDA80D51芯片,實(shí)現(xiàn)了車載音響非特定人的語(yǔ)音識(shí)別與控制。由于該芯片集成度高,需要外圍模塊少,設(shè)計(jì)的硬件電路簡(jiǎn)單,便于調(diào)試檢測(cè)。該設(shè)計(jì)得到的樣機(jī),有較高的識(shí)別率、工作穩(wěn)定、可擴(kuò)展性強(qiáng),達(dá)到預(yù)期的設(shè)計(jì)目標(biāo),整個(gè)設(shè)計(jì)方案和實(shí)現(xiàn)方法是可行的。由于語(yǔ)音識(shí)別率隨著環(huán)境,說(shuō)話人不同而變化,雖然HMM在噪聲很少的環(huán)境下可以獲得很高的識(shí)別率,但當(dāng)測(cè)試語(yǔ)音或者環(huán)境中含有不同程度的噪聲污染時(shí),語(yǔ)音識(shí)別系統(tǒng)的性能會(huì)很快地下降。提高系統(tǒng)的抗噪性和魯棒性是語(yǔ)音識(shí)別系統(tǒng)走向?qū)嵱没年P(guān)鍵之一。

 

 

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉