聲紋識別是怎樣的一情況
聲紋識別,生物識別技術(shù)的一種,也稱為說話人識別,是一種通過聲音判別說話人身份的技術(shù)。所謂聲紋(Voiceprint),是用電聲學(xué)儀器顯示的攜帶言語信息的聲波頻譜。人類語言的產(chǎn)生是人體語言中樞與發(fā)音器官之間一個復(fù)雜的生理物理過程,人在講話時使用的發(fā)聲器官--舌、牙齒、喉頭、肺、鼻腔在尺寸和形態(tài)方面每個人的差異很大,所以任何兩個人的聲紋圖譜都有差異。每個人的語音聲學(xué)特征既有相對穩(wěn)定性,又有變異性,不是一成不變的。這種變異可來自生理、病理、心理、模擬、偽裝,也與環(huán)境干擾有關(guān)。盡管如此,由于每個人的發(fā)音器官都不盡相同,因此在一般情況下,人們?nèi)阅軈^(qū)別不同的人的聲音或判斷是否是同一人的聲音。
人們?yōu)楹慰粗芈暭y識別?
人工智能主要有三個研究方向:視覺識別、智能語音、自然語言處理NLP。其中,在語音識別領(lǐng)域,聲紋識別屬于相對藍(lán)海市場,解決的主要是“我是我”的問題,多應(yīng)用在安全驗(yàn)證場景。在語音轉(zhuǎn)文字賽道,各家的效果可能趨于0.1%、0.2%的差距,為了避免同質(zhì)化競爭,許多公司選擇從“聲紋識別”切入。
聲紋識別相對于其他生物識別的優(yōu)勢主要體現(xiàn)在以下幾點(diǎn): 一是非接觸式識別,相對于指紋識別而言,它更加便捷;二是降低侵犯隱私風(fēng)險,相對于人臉識別而言,社會大眾對于聲紋識別的抵觸大大降低,隨便采集到的一段話便可以進(jìn)行聲紋識別;三是獲取語音的識別成本低,相對于人臉識別、指紋識別等,聲紋識別只要求麥克風(fēng)便可以進(jìn)行采集。
公安、金融領(lǐng)域更青睞聲紋識別技術(shù)
聲紋識別技術(shù)有兩類,即說話人辨認(rèn)和說話人確認(rèn)。不同的任務(wù)和應(yīng)用會使用不同的聲紋識別技術(shù)。如縮小刑偵范圍時可能需要辨認(rèn)技術(shù),而銀行交易時則需要確認(rèn)技術(shù)。
2018年10月9日,中國人民銀行正式對外發(fā)布《移動金融基于聲紋識別的安全應(yīng)用技術(shù)規(guī)范》金融行業(yè)標(biāo)準(zhǔn),這意味著聲紋識別技術(shù)得到金融監(jiān)管部門的認(rèn)可。這也為聲紋識別技術(shù)進(jìn)入移動金融領(lǐng)域解決了標(biāo)準(zhǔn)難題。
同語音識別技術(shù)相比較,聲紋識別的應(yīng)用領(lǐng)域則更加專業(yè)與細(xì)分。不止金融領(lǐng)域,公安、司法等領(lǐng)域都需要利用聲紋鑒定人員身份。而在我國,早在上世紀(jì)80年代末就已由中國刑警學(xué)院文檢系和公安部物證鑒定中心先后引進(jìn)相關(guān)儀器設(shè)備并分別建立了聲紋鑒定實(shí)驗(yàn)室,并進(jìn)一步成立了聲紋鑒定研究課題組,開展了聲紋鑒定技術(shù)的研究工作。到現(xiàn)在,在全國各地公安機(jī)關(guān)的多年共同努力下,針對漢語這一語種獨(dú)有的特點(diǎn)與規(guī)律,已然總結(jié)出一套科學(xué)的鑒定與甄別方法,聲紋識別已成為公共安全領(lǐng)域鑒定人員身份的主要手段之一。
結(jié)語
從近幾年情形可以看出,相比于指紋識別、人臉識別等生物識別技術(shù),聲紋識別是“低調(diào)”的,但市場需求的確存在,且市場熱度也有上升趨勢。
同時,聲紋識別技術(shù)目前已經(jīng)發(fā)展較為成熟,識別準(zhǔn)確率也相對較高,應(yīng)用范圍較為廣泛、識別技術(shù)水平相對成熟,因其經(jīng)濟(jì)性、可操作性等優(yōu)勢,在將來會在更多的領(lǐng)域中、獲得更為廣泛的應(yīng)用。聲紋識別或是未來提升安防解決方案的重要手段,將快速實(shí)現(xiàn)商業(yè)化部署,前景十分廣闊。