語(yǔ)音識(shí)別芯片的原理_語(yǔ)音識(shí)別芯片有哪些

時(shí)間：2020-05-22 10:51:02

關(guān)鍵字：語(yǔ)音識(shí)別芯片語(yǔ)音信號(hào) 人工智能

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 　　語(yǔ)音識(shí)別芯片的原理　　語(yǔ)音識(shí)別芯片也叫語(yǔ)音識(shí)別IC，與傳統(tǒng)的語(yǔ)音芯片相比，語(yǔ)音識(shí)別芯片最大的特點(diǎn)就是能夠語(yǔ)音識(shí)別，它能讓機(jī)器聽(tīng)懂人類(lèi)的語(yǔ)音，并且可以根據(jù)命令執(zhí)行各種動(dòng)作，如眨眼睛、

　　語(yǔ)音識(shí)別芯片的原理

　　語(yǔ)音識(shí)別芯片也叫語(yǔ)音識(shí)別IC，與傳統(tǒng)的語(yǔ)音芯片相比，語(yǔ)音識(shí)別芯片最大的特點(diǎn)就是能夠語(yǔ)音識(shí)別，它能讓機(jī)器聽(tīng)懂人類(lèi)的語(yǔ)音，并且可以根據(jù)命令執(zhí)行各種動(dòng)作，如眨眼睛、動(dòng)嘴巴（智能娃娃）。除此之外，語(yǔ)音識(shí)別芯片還具有高品質(zhì)、高壓縮率錄音放音功能，可實(shí)現(xiàn)人機(jī)對(duì)話。

　　語(yǔ)音識(shí)別芯片所涉及的技術(shù)包括：信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理和聽(tīng)覺(jué)機(jī)理、人工智能等等。

　　嵌入式語(yǔ)音識(shí)別系統(tǒng)都采用了模式匹配的原理。錄入的語(yǔ)音信號(hào)首先經(jīng)過(guò)預(yù)處理，包括語(yǔ)音信號(hào)的采樣、反混疊濾波、語(yǔ)音增強(qiáng)，接下來(lái)是特征提取，用以從語(yǔ)音信號(hào)波形中提取一組或幾組能夠描述語(yǔ)音信號(hào)特征的參數(shù)。特征提取之后的數(shù)據(jù)一般分為兩個(gè)步驟，第一步是系統(tǒng) “學(xué)習(xí)”或“訓(xùn)練”階段，這一階段的任務(wù)是構(gòu)建參考模式庫(kù)，詞表中每個(gè)詞對(duì)應(yīng)一個(gè)參考模式，它由這個(gè)詞重復(fù)發(fā)音多遍，再經(jīng)特征提取和某種訓(xùn)練中得到。第二是“識(shí)別”或“測(cè)試”階段，按照一定的準(zhǔn)則求取待測(cè)語(yǔ)音特征參數(shù)和語(yǔ)音信息與模式庫(kù)中相應(yīng)模板之間的失真測(cè)度，最匹配的就是識(shí)別結(jié)果。

　　語(yǔ)音識(shí)別芯片有哪些

　　按照使用者的限制而言，語(yǔ)音識(shí)別芯片可以分為特定人語(yǔ)音識(shí)別芯片和非特定人語(yǔ)音識(shí)別芯片。

　　特定人語(yǔ)音識(shí)別：

　　特定人語(yǔ)音識(shí)別芯片是針對(duì)指定人的語(yǔ)音識(shí)別，其他人的話不識(shí)別，須先把使用者的語(yǔ)音參考樣本存入當(dāng)成比對(duì)的資料庫(kù)，即特定人語(yǔ)音識(shí)別在使用前必須要進(jìn)行語(yǔ)音訓(xùn)練，一般按照機(jī)器提示訓(xùn)練 2 遍語(yǔ)音詞條即可使用。

　　非特定人語(yǔ)音識(shí)別：

　　非特定人語(yǔ)音識(shí)別是不用針對(duì)指定的人的識(shí)別技術(shù)，不分年齡、性別，只要說(shuō)相同語(yǔ)言就可以，應(yīng)用模式是在產(chǎn)品定型前按照確定的十幾個(gè)語(yǔ)音交互詞條，采集 200 人左右的聲音樣本，經(jīng)過(guò)PC 算法處理得到交互詞條的語(yǔ)音模型和特征數(shù)據(jù)庫(kù)，然后燒錄到芯片上。應(yīng)用這種芯片的機(jī)器（智能娃娃、電子寵物、兒童電腦）就具有交互功能了。

　　非特定人語(yǔ)音識(shí)別應(yīng)用有的是基于音素的算法，這種模式下不需要采集很多人的聲音樣本就可以做交互識(shí)別，但是缺點(diǎn)是識(shí)別率不高，識(shí)別性能不穩(wěn)定。

　　按照說(shuō)話方式的連續(xù)性，語(yǔ)音識(shí)別芯片又可分為非連續(xù)語(yǔ)音識(shí)別和連續(xù)語(yǔ)音識(shí)別。

　　非連續(xù)語(yǔ)音識(shí)別：

　　對(duì)于非連續(xù)語(yǔ)音來(lái)說(shuō)，識(shí)別所說(shuō)的每一個(gè)字必須分開(kāi)辨認(rèn)，要求說(shuō)完每個(gè)字后都要停頓。

　　連續(xù)語(yǔ)音識(shí)別：

　　連續(xù)語(yǔ)音識(shí)別可以一般自然流利的說(shuō)話方式來(lái)進(jìn)行人性化的語(yǔ)音識(shí)別，但由于關(guān)系到相連音的問(wèn)題，很難達(dá)到好的辨認(rèn)效果。