智能語音助手的原理_預(yù)測(cè)智能語音助手的未來
語音助手能和人類進(jìn)行深度交談的背后,離不開自然語言處理(NLP)和自然語言生成(NLG)這兩種基礎(chǔ)技術(shù)。機(jī)器學(xué)習(xí)的這兩個(gè)分支使得語音助手能夠?qū)⑷祟愓Z言轉(zhuǎn)換為計(jì)算機(jī)命令,反之亦然。
什么是NLP?NLP指在計(jì)算機(jī)讀取語言時(shí)將文本轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)的過程。簡(jiǎn)而言之,NLP是計(jì)算機(jī)的閱讀語言??梢源致缘卣f,在NLP中,系統(tǒng)攝取人語,將其分解,分析,確定適當(dāng)?shù)牟僮?,并以人類理解的語言進(jìn)行響應(yīng)。NLP結(jié)合了計(jì)算機(jī)科學(xué)、人工智能和計(jì)算語言學(xué),涵蓋了以人類理解的方式解釋和生成人類語言的所有機(jī)制:語言過濾、情感分析、主題分類、位置檢測(cè)等。
什么是NLG?
自然語言處理由自然語言理解(NLU)和自然語言生成(NLG)構(gòu)成。NLG是計(jì)算機(jī)的“編寫語言”,它將結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為文本,以人類語言表達(dá)。即能夠根據(jù)一些關(guān)鍵信息及其在機(jī)器內(nèi)部的表達(dá)形式,經(jīng)過一個(gè)規(guī)劃過程,來自動(dòng)生成一段高質(zhì)量的自然語言文本。
對(duì)于“AI語音識(shí)別”,每一個(gè)“語音識(shí)別”都是APP,這個(gè)APP里面內(nèi)置著我們常用字的“標(biāo)準(zhǔn)發(fā)音字庫“,同時(shí),為了讓軟件能否識(shí)別我們“不標(biāo)準(zhǔn)的發(fā)音”,軟件還需要AI編程語言對(duì)我們不標(biāo)準(zhǔn)的發(fā)音做評(píng)分,然后做比對(duì),最后選擇評(píng)分最高的那一個(gè)“標(biāo)準(zhǔn)發(fā)音”作為我們“不標(biāo)準(zhǔn)發(fā)音”的字庫!
1.語音識(shí)別的基本原理語音識(shí)別系統(tǒng)本質(zhì)上是一種模式識(shí)別系統(tǒng),包括特征提取、模式匹配、參考模式庫等三個(gè)基本單元,它的基本結(jié)構(gòu)如下圖所示:
語音識(shí)別系統(tǒng)構(gòu)建過程整體上包括兩大部分:訓(xùn)練和識(shí)別。訓(xùn)練通常是離線完成的,對(duì)預(yù)先收集好的海量語音、語言數(shù)據(jù)庫進(jìn)行信號(hào)處理和知識(shí)挖掘,獲取語音識(shí)別系統(tǒng)所需要的“聲學(xué)模型”和“語言模型”;而識(shí)別過程通常是在線完成的,對(duì)用戶實(shí)時(shí)的語音進(jìn)行自動(dòng)識(shí)別。自動(dòng)語音識(shí)別技術(shù)有三個(gè)基本原理:首先語音信號(hào)中的語言信息是按照短時(shí)幅度譜的時(shí)間變化模式來編碼;其次語音是可以閱讀的,即它的聲學(xué)信號(hào)可以在不考慮說話人試圖傳達(dá)的信息內(nèi)容的情況下用數(shù)十個(gè)具有區(qū)別性的、離散的符號(hào)來表示;第三語音交互是一個(gè)認(rèn)知過程,因而不能與語言的語法、語義和語用結(jié)構(gòu)割裂開來。
2.工作原理第一步,把幀識(shí)別成狀態(tài)(難點(diǎn))。
第二步,把狀態(tài)組合成音素。
第三步,把音素組合成單詞。
3.工作流程
一般來說,一套完整的語音識(shí)別系統(tǒng)其工作過程分為7步:
①對(duì)語音信號(hào)進(jìn)行分析和處理,除去冗余信息。
?、谔崛∮绊懻Z音識(shí)別的關(guān)鍵信息和表達(dá)語言含義的特征信息。
?、劬o扣特征信息,用最小單元識(shí)別字詞。
?、馨凑詹煌Z言的各自語法,依照先后次序識(shí)別字詞。
?、莅亚昂笠馑籍?dāng)作輔助識(shí)別條件,有利于分析和識(shí)別。
?、薨凑照Z義分析,給關(guān)鍵信息劃分段落,取出所識(shí)別出的字詞并連接起來,同時(shí)根據(jù)語句意思調(diào)整句子構(gòu)成。
?、呓Y(jié)合語義,仔細(xì)分析上下文的相互聯(lián)系,對(duì)當(dāng)前正在處理的語句進(jìn)行適當(dāng)修正。
預(yù)測(cè)智能語音助手的未來1.語境理解提供個(gè)性化回應(yīng):目前而言,市場(chǎng)上的智能助理大多缺乏語境理解。
2.語音區(qū)分:語音助理或?qū)⑼ㄟ^區(qū)分語音,提供更多個(gè)性化體驗(yàn)。
3.不僅是手機(jī):Amazon Alexa副總裁Steve Rabuchin表示:“我們希望客戶可以隨時(shí)隨地訪問Alexa,這意味著客戶可以通過語音遙控他們的汽車、冰箱、恒溫器、燈具以及家中內(nèi)外的各種設(shè)備?!?/p>
4.搜索行為的變化:語音搜索一直是熱門話題。但語音的可見性將是巨大的挑戰(zhàn)。
5.語音通知:在移動(dòng)應(yīng)用營(yíng)銷方面,語音智能也提出了新的挑戰(zhàn)-用戶參與度和維護(hù)度。
6.信息安全問題:隨著語音支付越來越方便,更多用戶選擇語音支付。支持智能語音的智能家居設(shè)備等也涉及大量用戶隱私和用戶習(xí)慣,其安全性也成為用戶關(guān)注的焦點(diǎn)。
語音助手