君林科技：聲紋識(shí)別前景無(wú)限，重點(diǎn)問題亟需解決

時(shí)間：2020-07-27 17:24:01

關(guān)鍵字：聲紋識(shí)別智能系統(tǒng)

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 近年來(lái)，隨著AI的市場(chǎng)需求日益增加、技術(shù)革新以及重大政策利好，人工智能已逐漸普及。根據(jù)各方面的數(shù)據(jù)和報(bào)告顯示，智能家居產(chǎn)品銷量與日俱增，智能音箱產(chǎn)品的銷量更是驚人，僅某品牌的智能音箱月銷售量就有

近年來(lái)，隨著AI的市場(chǎng)需求日益增加、技術(shù)革新以及重大政策利好，人工智能已逐漸普及。根據(jù)各方面的數(shù)據(jù)和報(bào)告顯示，智能家居產(chǎn)品銷量與日俱增，智能音箱產(chǎn)品的銷量更是驚人，僅某品牌的智能音箱月銷售量就有數(shù)百萬(wàn)臺(tái)。而人工智能在金融和安防等領(lǐng)域的應(yīng)用同樣越來(lái)越廣泛，這些新興力量打破了傳統(tǒng)行業(yè)壁壘，不斷獲得發(fā)展。

這些發(fā)展勢(shì)頭迅猛的人工智能有一個(gè)共通點(diǎn)，就是非常需要以聲紋識(shí)別作為技術(shù)補(bǔ)充。有了聲紋識(shí)別，能使彌補(bǔ)這些人工智能的固有缺陷;有了聲紋識(shí)別，能提高這些人工智能的性能，使之更為人性化，從而更好地為人類服務(wù)。

以智能家居為例，盡管通過(guò)語(yǔ)音控制，它可以為我們的生活提供很多幫助和便利。我們只要說(shuō)出指令，就可以操縱智能音箱、智能多媒體、智能車載系統(tǒng)等家居生活的必需品。不過(guò)，在具體操縱的過(guò)程中，人們?nèi)匀粫?huì)碰到一些令人頭疼的問題。

如果聲音環(huán)境比較嘈雜或者混亂，語(yǔ)音識(shí)別系統(tǒng)就很難正確識(shí)別出用戶發(fā)出的命令。而當(dāng)多個(gè)人同時(shí)發(fā)出指令或同時(shí)發(fā)出類似指令的聲音的時(shí)候，也會(huì)給系統(tǒng)造成混亂，系統(tǒng)很難識(shí)別出應(yīng)該聽取誰(shuí)的指令。

類似這種問題，最好的解決辦法就是加入聲紋識(shí)別技術(shù)。通過(guò)聲紋識(shí)別技術(shù)，可以對(duì)人聲進(jìn)行更準(zhǔn)確地定位和捕捉，同時(shí)進(jìn)行降噪處理，從而讓智能家居系統(tǒng)準(zhǔn)確地識(shí)別出發(fā)出指令的用戶。

而在銀行金融領(lǐng)域，現(xiàn)行的智能系統(tǒng)主要是運(yùn)用于進(jìn)行遠(yuǎn)程身份認(rèn)證。對(duì)于銀行借貸、社保資金領(lǐng)取等個(gè)人金融項(xiàng)目的操作來(lái)說(shuō)，安全性和便利性都是十分重要的。因此，銀行等金融行業(yè)為民眾提供了一種遠(yuǎn)程身份認(rèn)證的操作，可以獨(dú)自在家完成認(rèn)證和資金領(lǐng)取。即便距離再遠(yuǎn)，也不會(huì)耽誤事。但目前主流的身份驗(yàn)證方式是通過(guò)手機(jī)短信驗(yàn)證碼驗(yàn)證，這種驗(yàn)證方式的安全性極低，手機(jī)一旦丟失或被盜，金融賬戶的損失隨時(shí)會(huì)很嚴(yán)重。

因此，出于對(duì)安全性和便捷性的雙重需求，將聲紋識(shí)別作為金融行業(yè)身份驗(yàn)證的補(bǔ)充手段是十分有必要的。在遠(yuǎn)程場(chǎng)合下的金融驗(yàn)證，有了聲音來(lái)防偽，大大提升了安全性。而用戶只需說(shuō)出指定話語(yǔ)即可完成驗(yàn)證，操作方式也并不復(fù)雜。

聲紋識(shí)別在安防領(lǐng)域的作用就更為突出。沒有聲紋識(shí)別的安防系統(tǒng)，智能程度越高，其實(shí)就越危險(xiǎn)。試想一下，當(dāng)說(shuō)話人的身份不受限制的時(shí)候，大到我們的住宅、公司，小到我們的房間、電腦、私人空間，都可以輕易被入侵。入侵者只要像我們一樣，對(duì)系統(tǒng)發(fā)出指令，就可以突破安防。

當(dāng)然，有了聲紋識(shí)別的安防系統(tǒng)，就不必?fù)?dān)心這些問題。因?yàn)槊總€(gè)人的聲音本質(zhì)上都是不同的，是很難被模仿或復(fù)制的。即便別有用心的人想通過(guò)模仿我們的聲音來(lái)入侵安防系統(tǒng)，也不能得逞。

所以說(shuō)，借助聲紋識(shí)別，各個(gè)行業(yè)的智能系統(tǒng)都可以進(jìn)一步提升性能，并且，更好地為用戶服務(wù)。不管是從眾多人聲中準(zhǔn)確辨認(rèn)用戶，還是確認(rèn)說(shuō)話人的身份，聲紋識(shí)別對(duì)這些智能系統(tǒng)來(lái)說(shuō)都是不可或缺的。

雖然聲紋識(shí)別在各行各業(yè)當(dāng)中體現(xiàn)出巨大的價(jià)值，但在實(shí)操階段，聲紋識(shí)別仍面臨著很多困難。其中最顯著的就是聲紋采集的困難和方言、情緒化對(duì)聲紋識(shí)別的影響問題。

聲紋識(shí)別的首要步驟和關(guān)鍵前提就是進(jìn)行聲紋采集，只有收集到足夠豐富的聲紋信息，建立起完善的數(shù)據(jù)庫(kù)，聲紋識(shí)別才能夠具備準(zhǔn)確性和可操作性。而且，采集到豐富而多樣化的聲紋信息還有利于機(jī)器和系統(tǒng)進(jìn)行深度學(xué)習(xí)，畢竟智能識(shí)別系統(tǒng)是通過(guò)大量的數(shù)據(jù)來(lái)進(jìn)行訓(xùn)練和學(xué)習(xí)的。但目前聲紋信息的把控權(quán)牢牢掌握在公安和政府部門手中，這就給企業(yè)的聲紋采集工作帶來(lái)極大的困難。他們需要通過(guò)多個(gè)渠道進(jìn)行大量的前期工作，采集到足夠的聲紋信息，才能建立恰當(dāng)?shù)穆暭y識(shí)別系統(tǒng)。

另外，人類的方言、口音差異，以及不同狀態(tài)下的聲音狀況不同，都會(huì)對(duì)聲紋識(shí)別造成一定的影響。如果聲紋識(shí)別系統(tǒng)只能夠識(shí)別標(biāo)準(zhǔn)的普通話，那說(shuō)方言和口音重的人的身份可能就很難被識(shí)別出來(lái)。同樣的道理，說(shuō)話人的情緒有高漲或低落的時(shí)候，在不同的狀態(tài)下，聲音也會(huì)有微小的差異，這些差異同樣會(huì)導(dǎo)致聲紋識(shí)別發(fā)生錯(cuò)誤。因此，如何在動(dòng)態(tài)識(shí)別中準(zhǔn)確判斷出聲音的本質(zhì)特征對(duì)于聲紋識(shí)別來(lái)說(shuō)是非常重要，也是非常困難的。

盡管，聲紋識(shí)別在各個(gè)領(lǐng)域都占有舉足輕重的地位，應(yīng)用也日益廣泛，但具體應(yīng)用仍然存在著很多困難。這些困難和問題是聲紋識(shí)別發(fā)展道路上絕對(duì)不能夠忽視的，需要我們用多種技術(shù)手段去盡快調(diào)整和解決。

北京君林科技股份有限公司，專業(yè)的電聲企業(yè)，打造人工智能時(shí)代的金耳朵。面向全球，提供最領(lǐng)先的音頻領(lǐng)域解決方案和專業(yè)服務(wù)，基于聲學(xué)推動(dòng)人工智能技術(shù)產(chǎn)品落地。

公司以打造人工智能領(lǐng)域的音頻硬件平臺(tái)及系統(tǒng)平臺(tái)，使君林技術(shù)成為人工智能音頻領(lǐng)域不可或缺的環(huán)節(jié)為發(fā)展目標(biāo)。并以此為基礎(chǔ)，全面覆蓋聲學(xué)技術(shù)-固件算法-智能硬件-系統(tǒng)驅(qū)動(dòng)-云服務(wù)-大數(shù)據(jù)-Ai技術(shù)等技術(shù)鏈。

君林科技擁有一整套完整的聲音處理系統(tǒng)解決方案。用戶可以使用已有或者定制的音頻數(shù)據(jù)采集方案，通過(guò)君林科技聲紋REST API上傳至云端，由人工智能算法進(jìn)行建模，識(shí)別與認(rèn)證，有效得為企業(yè)創(chuàng)造最大價(jià)值。