當前位置：首頁 > 汽車電子 > 汽車電子技術(shù)文庫

語音助理搭配人工智能將是不可或缺的環(huán)節(jié)

時間：2020-08-20 16:03:01

關(guān)鍵字：人工智能語音辨識

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀] 在車聯(lián)網(wǎng)時代來臨的前夕，我們車上已經(jīng)有 GPS、行車記錄儀、藍牙喇叭等設(shè)備，營造更便利的駕駛環(huán)境。不過，在上路前免不了的一連串手動輸入或設(shè)定，卻又不是那么方便了，更遑論開車到一半時要進行變更。即

在車聯(lián)網(wǎng)時代來臨的前夕，我們車上已經(jīng)有 GPS、行車記錄儀、藍牙喇叭等設(shè)備，營造更便利的駕駛環(huán)境。不過，在上路前免不了的一連串手動輸入或設(shè)定，卻又不是那么方便了，更遑論開車到一半時要進行變更。即使是趁著等紅燈的空檔，只要還得伸手去屏幕上按來按去，就多少增加了行車風(fēng)險。于是，為了駕駛?cè)伺c乘客更舒適安全的的乘車體驗，語音助理搭配人工智能將是不可或缺的環(huán)節(jié)。

然而，這樣一來我們就得面對另一個難題，便是這些車用語音智能產(chǎn)品，如何能提供優(yōu)異的語音辨識品質(zhì)，提高辨識率，讓機器準確接收我們的指令呢？想像一下，你載著滿車朋友出游，在國道上高速行駛，大家快意談笑，夾雜引擎運轉(zhuǎn)與風(fēng)噪聲，可能還正好放著一首 Lana Del Rey 的《Burning Desire》，使你不自覺腳踩油門。這時車內(nèi)環(huán)境噪音絕對高于 70dB（分貝），而且還夾雜不同頻率的聲音。因此，讓產(chǎn)品偵測說話的人并接收正確指令，是相當令人頭痛的問題。

環(huán)境噪音對語音通訊品質(zhì)的影響

在語音辨識的流程中，可分為五道程序：包含語音輸入及語音訊號處理、語音特征擷取、以聲學(xué)模型（acousTIc model）進行語音單元辨識、以語言模型（language model）來組織語音單元、解碼及輸出等。

目前語音助理的市場上，Microsoft 耕耘最久，Apple、Google 相繼而起，以完善智能手機體驗為目標；近期火熱的 Amazon Echo，其語音助理 Alexa 則一開始就以獨立的聲控家用平臺為定位，建立自身生態(tài)系。以上這幾家語音助理開發(fā)商，基本上已經(jīng)掌握后面四道程序。不過，一旦來到車用領(lǐng)域，產(chǎn)品設(shè)備開發(fā)商則勢必要在語音輸入及語音訊號處理的程序上，投注更多心力。

車用語音智能產(chǎn)品在車內(nèi)環(huán)境中，與使用者的距離不出 0.5~1 米之內(nèi)。一般汽車引擎發(fā)動后且車窗緊閉的情況下，車內(nèi)噪音約 60dB 左右。假設(shè)使用者發(fā)出約 89dB 的聲音（即一般說話音量的平均值），此時嘴邊的訊噪比為 29dB，足以維持良好的通訊品質(zhì)。但你不會想要每次下指令還得把臉貼到汽車面板前，因此 0.5~1 米是產(chǎn)品接收語音訊號的合理距離。然而，當說話聲音傳到 0.5 米時會衰減至 65dB，此時訊噪比只剩 5dB；說話聲音到 1 米時則只剩 60dB，與噪音的音量相當，更不用說上述提到高速行駛的環(huán)境下，噪音都比發(fā)出指令的人聲還要大。

符合標準的車用通訊品質(zhì)

當面臨車聯(lián)網(wǎng)逐漸完善、語音應(yīng)用普及化，越來越多車廠要求內(nèi)建 Android Auto、Apple Carplay 等智能助理，而這些都需要按照 ITU-T P.1110/P.1100 語音標準來設(shè)計，對代工組裝或設(shè)計加工的車用電子系統(tǒng)廠來說，等于是踏入未知的領(lǐng)域，只能以現(xiàn)有產(chǎn)品不斷偵錯找出問題，相當耗費時間。因此像是貝爾聲學(xué)這種第三方語音測試實驗室，就會從麥克風(fēng)模組、連接線材等部分測試，首先幫廠商判斷選料是否正確。

貝爾聲學(xué)曾針對一款舊的車用麥克風(fēng)模組進行測試，該模組配兩顆 ECM 電容式類比麥克風(fēng)，一顆為全指向性，主要用來收環(huán)境音，作為背景噪音消除演算法的用途；另一顆為單指向性，收音方向指向駕駛，用來接收駕駛的語音訊號。依據(jù) ITU-T P.1110 測試方式，得出了以下數(shù)據(jù)：

從結(jié)果可以看到，麥克風(fēng)模組離標準建議值太遠，感度差了約 30dB，因此訊號必須放大 30dB，才能滿足標準建議值。然而，這意味著雜訊也會跟著放大，造成語音品質(zhì)跟辨識率低落。代表這款麥克風(fēng)一開始根本就不該出現(xiàn)在車用語音智能產(chǎn)品上。透過貝爾聲學(xué)的協(xié)助，能讓廠商快速找到癥結(jié)點，避免進行過多無意義的測試。

由于車子所處的環(huán)境噪音會隨著車速、路段、路況、空調(diào)、乘客及音響等各種因素不斷改變，而背景降噪演算法不易解決時時變動且突發(fā)性的聲音，所以車用語音智能產(chǎn)品可以著重在一些細節(jié)，幫助提升通訊品質(zhì)。例如采用兩顆以上的麥克風(fēng)陣列，以進行較佳的背景降噪演算法；采用訊噪比較高的麥克風(fēng)，最好是 SNR 58dB 以上。其次，把麥克風(fēng)置于離駕駛嘴巴最近的位置，如方向盤附近；但同時又要盡量縮短麥克風(fēng)線材至主機的距離，且加強線材隔絕性，以減少外來的雜訊。最后，則是加上回音消除（Echo cancellaTIon）、背景降噪（Background noise reducTIon）以及麥克風(fēng)自動增益（Mic auto gain control）等三種功能，幫助提升語音辨識率。

本站聲明：本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除。

換一批

延伸閱讀

[通信先鋒]

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

9月2日消息，不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司，隨著阿維塔和賽力斯的入局，華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字：阿維塔塞力斯華為

[美通社全球TMT]

Trianz與AWS達成戰(zhàn)略合作協(xié)議，徹底改變云采用和管理方式

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布，該公司與Amazon Web Services （AWS）簽訂了...

關(guān)鍵字： AWS AN BSP 數(shù)字化

[美通社全球TMT]

人工智能驅(qū)動工具SODA V將顛覆汽車市場，使汽車開發(fā)時間和成本降低90%

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V，這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具，可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字：汽車人工智能智能驅(qū)動 BSP

[美通社全球TMT]

從容應(yīng)對未知風(fēng)險----解密亞馬遜云科技的韌性之道

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行，同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險，如企業(yè)系統(tǒng)復(fù)雜性的增加，頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性，提升韌性，成...

關(guān)鍵字：亞馬遜解密控制平面 BSP

[通信先鋒]

中國游戲市場開始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

8月30日消息，據(jù)媒體報道，騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字：騰訊編碼器 CPU

[通信先鋒]

獨立自主！華為董事：致力打造不依賴西方的技術(shù)

8月28日消息，今天上午，2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行，華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字：華為 12nm EDA 半導(dǎo)體

[通信先鋒]

華為張平安：數(shù)字世界話語權(quán)最終由生態(tài)繁榮決定！

8月28日消息，在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上，華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱，數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字：華為 12nm 手機衛(wèi)星通信

[美通社全球TMT]

中國通信服務(wù)公布2024年中期業(yè)績

要點：有效應(yīng)對環(huán)境變化，經(jīng)營業(yè)績穩(wěn)中有升落實提質(zhì)增效舉措，毛利潤率延續(xù)升勢戰(zhàn)略布局成效顯著，戰(zhàn)新業(yè)務(wù)引領(lǐng)增長以科技創(chuàng)新為引領(lǐng)，提升企業(yè)核心競爭力堅持高質(zhì)量發(fā)展策略，塑強核心競爭優(yōu)勢...

關(guān)鍵字：通信 BSP 電信運營商數(shù)字經(jīng)濟

[美通社全球TMT]

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動產(chǎn)業(yè)鏈高速發(fā)展

北京2024年8月27日 /美通社/ -- 8月21日，由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字： VI 傳輸協(xié)議音頻 BSP

[美通社全球TMT]

軟通動力與長三角投資達成戰(zhàn)略合作共謀數(shù)字生態(tài)新發(fā)展

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上，軟通動力信息技術(shù)（集團）股份有限公司（以下簡稱"軟通動力"）與長三角投資（上海）有限...

關(guān)鍵字： BSP 信息技術(shù)

關(guān)閉

關(guān)閉

<menuitem id="w3mls"><i id="w3mls"></i></menuitem>

<rp id="w3mls"><acronym id="w3mls"></acronym></rp>