當(dāng)前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀]    語音助手能和人類進(jìn)行深度交談的背后,離不開自然語言處理(NLP)和自然語言生成(NLG)這兩種基礎(chǔ)技術(shù)。機(jī)器學(xué)習(xí)的這兩個(gè)分支使得語音助手能夠?qū)⑷祟愓Z言轉(zhuǎn)換為計(jì)算機(jī)命令,反之亦然。

   語音助手能和人類進(jìn)行深度交談的背后,離不開自然語言處理(NLP)和自然語言生成(NLG)這兩種基礎(chǔ)技術(shù)。機(jī)器學(xué)習(xí)的這兩個(gè)分支使得語音助手能夠?qū)⑷祟愓Z言轉(zhuǎn)換為計(jì)算機(jī)命令,反之亦然。

  什么是NLP?

  NLP指在計(jì)算機(jī)讀取語言時(shí)將文本轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)的過程。簡(jiǎn)而言之,NLP是計(jì)算機(jī)的閱讀語言??梢源致缘卣f,在NLP中,系統(tǒng)攝取人語,將其分解,分析,確定適當(dāng)?shù)牟僮?,并以人類理解的語言進(jìn)行響應(yīng)。NLP結(jié)合了計(jì)算機(jī)科學(xué)、人工智能和計(jì)算語言學(xué),涵蓋了以人類理解的方式解釋和生成人類語言的所有機(jī)制:語言過濾、情感分析、主題分類、位置檢測(cè)等。

  

  什么是NLG?

  自然語言處理由自然語言理解(NLU)和自然語言生成(NLG)構(gòu)成。NLG是計(jì)算機(jī)的“編寫語言”,它將結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為文本,以人類語言表達(dá)。即能夠根據(jù)一些關(guān)鍵信息及其在機(jī)器內(nèi)部的表達(dá)形式,經(jīng)過一個(gè)規(guī)劃過程,來自動(dòng)生成一段高質(zhì)量的自然語言文本。

 

  對(duì)于“AI語音識(shí)別”,每一個(gè)“語音識(shí)別”都是APP,這個(gè)APP里面內(nèi)置著我們常用字的“標(biāo)準(zhǔn)發(fā)音字庫“,同時(shí),為了讓軟件能否識(shí)別我們“不標(biāo)準(zhǔn)的發(fā)音”,軟件還需要AI編程語言對(duì)我們不標(biāo)準(zhǔn)的發(fā)音做評(píng)分,然后做比對(duì),最后選擇評(píng)分最高的那一個(gè)“標(biāo)準(zhǔn)發(fā)音”作為我們“不標(biāo)準(zhǔn)發(fā)音”的字庫!

  1.語音識(shí)別的基本原理

  語音識(shí)別系統(tǒng)本質(zhì)上是一種模式識(shí)別系統(tǒng),包括特征提取、模式匹配、參考模式庫等三個(gè)基本單元,它的基本結(jié)構(gòu)如下圖所示:

  

  語音識(shí)別系統(tǒng)構(gòu)建過程整體上包括兩大部分:訓(xùn)練和識(shí)別。訓(xùn)練通常是離線完成的,對(duì)預(yù)先收集好的海量語音、語言數(shù)據(jù)庫進(jìn)行信號(hào)處理和知識(shí)挖掘,獲取語音識(shí)別系統(tǒng)所需要的“聲學(xué)模型”和“語言模型”;而識(shí)別過程通常是在線完成的,對(duì)用戶實(shí)時(shí)的語音進(jìn)行自動(dòng)識(shí)別。自動(dòng)語音識(shí)別技術(shù)有三個(gè)基本原理:首先語音信號(hào)中的語言信息是按照短時(shí)幅度譜的時(shí)間變化模式來編碼;其次語音是可以閱讀的,即它的聲學(xué)信號(hào)可以在不考慮說話人試圖傳達(dá)的信息內(nèi)容的情況下用數(shù)十個(gè)具有區(qū)別性的、離散的符號(hào)來表示;第三語音交互是一個(gè)認(rèn)知過程,因而不能與語言的語法、語義和語用結(jié)構(gòu)割裂開來。

  2.工作原理

  第一步,把幀識(shí)別成狀態(tài)(難點(diǎn))。

  第二步,把狀態(tài)組合成音素。

  第三步,把音素組合成單詞。

  

  3.工作流程

  一般來說,一套完整的語音識(shí)別系統(tǒng)其工作過程分為7步:

  ①對(duì)語音信號(hào)進(jìn)行分析和處理,除去冗余信息。

 ?、谔崛∮绊懻Z音識(shí)別的關(guān)鍵信息和表達(dá)語言含義的特征信息。

 ?、劬o扣特征信息,用最小單元識(shí)別字詞。

 ?、馨凑詹煌Z言的各自語法,依照先后次序識(shí)別字詞。

 ?、莅亚昂笠馑籍?dāng)作輔助識(shí)別條件,有利于分析和識(shí)別。

 ?、薨凑照Z義分析,給關(guān)鍵信息劃分段落,取出所識(shí)別出的字詞并連接起來,同時(shí)根據(jù)語句意思調(diào)整句子構(gòu)成。

 ?、呓Y(jié)合語義,仔細(xì)分析上下文的相互聯(lián)系,對(duì)當(dāng)前正在處理的語句進(jìn)行適當(dāng)修正。

  預(yù)測(cè)智能語音助手的未來

  1.語境理解提供個(gè)性化回應(yīng):目前而言,市場(chǎng)上的智能助理大多缺乏語境理解。

  2.語音區(qū)分:語音助理或?qū)⑼ㄟ^區(qū)分語音,提供更多個(gè)性化體驗(yàn)。

  3.不僅是手機(jī):Amazon Alexa副總裁Steve Rabuchin表示:“我們希望客戶可以隨時(shí)隨地訪問Alexa,這意味著客戶可以通過語音遙控他們的汽車、冰箱、恒溫器、燈具以及家中內(nèi)外的各種設(shè)備?!?/p>

  4.搜索行為的變化:語音搜索一直是熱門話題。但語音的可見性將是巨大的挑戰(zhàn)。

  5.語音通知:在移動(dòng)應(yīng)用營(yíng)銷方面,語音智能也提出了新的挑戰(zhàn)-用戶參與度和維護(hù)度。

  6.信息安全問題:隨著語音支付越來越方便,更多用戶選擇語音支付。支持智能語音的智能家居設(shè)備等也涉及大量用戶隱私和用戶習(xí)慣,其安全性也成為用戶關(guān)注的焦點(diǎn)。

  語音助手

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉