當(dāng)前位置:首頁 > 模擬 > 模擬技術(shù)
[導(dǎo)讀]2014年公安部便首次針對(duì)聲紋識(shí)別的應(yīng)用技術(shù)要求和安全等級(jí)制定標(biāo)準(zhǔn),在2019年確定了關(guān)于聲紋數(shù)據(jù)庫建設(shè)、信息采集指引的細(xì)化內(nèi)容。繼指紋、面部、虹膜之后,聲紋作為象征我們個(gè)人ID的一部分,也陸續(xù)開啟了商用大潮。

2014年公安部便首次針對(duì)聲紋識(shí)別的應(yīng)用技術(shù)要求和安全等級(jí)制定標(biāo)準(zhǔn),在2019年確定了關(guān)于聲紋數(shù)據(jù)庫建設(shè)、信息采集指引的細(xì)化內(nèi)容。繼指紋、面部、虹膜之后,聲紋作為象征我們個(gè)人ID的一部分,也陸續(xù)開啟了商用大潮。

聲紋識(shí)別技術(shù)能夠在金融場(chǎng)景落地,與行業(yè)的積極擁抱并出臺(tái)相關(guān)標(biāo)準(zhǔn)有關(guān)——2018年中國人民銀行發(fā)布聲紋識(shí)別相關(guān)行業(yè)標(biāo)準(zhǔn),2019年聲紋識(shí)別系統(tǒng)成為唯一一個(gè)入選金融科技產(chǎn)品認(rèn)證目錄的生物識(shí)別技術(shù)。

近日,中國工商銀行開始把聲紋識(shí)別技術(shù)應(yīng)用于信用卡反欺詐場(chǎng)景,在其位于北京、湖北、四川、山西的四家分行正式上線,在同業(yè)中率先開啟了風(fēng)險(xiǎn)管控的新模式。

聲紋識(shí)別從單純技術(shù)本身來說,在20世紀(jì)便有了相關(guān)研究和落地的探索,近年來,部分比較成熟的方案開始被境內(nèi)外一些銀行系統(tǒng)采用,那是聲紋識(shí)別技術(shù)應(yīng)用落地的初級(jí)階段。

真正走向成熟,核心還是依托于21世紀(jì)AI技術(shù)取得的突破。尤其是年初數(shù)月的疫情背景下,市場(chǎng)對(duì)這種非接觸且高準(zhǔn)確度的技術(shù)應(yīng)用需求突然放大甚至與日俱增。

據(jù)前瞻產(chǎn)業(yè)研究院分析,當(dāng)下全球生物識(shí)別產(chǎn)業(yè)規(guī)模龐大,僅語音生物識(shí)別(即聲紋識(shí)別)這一細(xì)分方向的市場(chǎng)規(guī)模2020年有望超過1400億元人民幣(約200億美元),占整個(gè)生物識(shí)別市場(chǎng)的22.4%。

聲揚(yáng)科技CTO陳東鵬向21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示,未來隨著5G、大數(shù)據(jù)、云計(jì)算等新技術(shù)發(fā)展愈發(fā)成熟、語音的入口更普及,可利用的語音數(shù)據(jù)會(huì)越來越多。聲紋識(shí)別技術(shù)有望在金融、公安、智能硬件、IoT等領(lǐng)域中發(fā)揮越來越重要的作用。

逐層技術(shù)演進(jìn)

提到聲紋,很容易被理解為容易被模仿的聲線,其實(shí)二者不能等同。

有行業(yè)人士向記者分析道,聲紋很難被偽裝,因?yàn)槠渥R(shí)別的內(nèi)容主要包括聲帶振動(dòng)頻率、聲道等特征組成的語音模型,能被偽裝的只在于口頭禪等行為特征。

“每個(gè)人說話時(shí)的音調(diào)、音色等習(xí)慣幾乎獨(dú)一無二,這些信息通過電聲學(xué)儀器測(cè)量并分析,就構(gòu)成了不同的聲波頻譜,所以用聲紋來認(rèn)證身份具有唯一性和穩(wěn)定性?!彼m(xù)稱。

清華大學(xué)人工智能研究院聽覺智能研究中心發(fā)布的一份聲紋識(shí)別技術(shù)白皮書顯示,目前市場(chǎng)上主流的生物識(shí)別方案包括掌紋、虹膜、視網(wǎng)膜、人臉、聲紋等。從易仿冒程度來看,虹膜和視網(wǎng)膜是極難的,聲紋被評(píng)定為難,其余則均為一般。

基于這些背景,關(guān)于聲紋的研究其實(shí)早已有之,只是隨著底層技術(shù)的迭代,應(yīng)用過程能夠更加無感,同時(shí)達(dá)到較高準(zhǔn)確度。

陳東鵬向21世紀(jì)經(jīng)濟(jì)報(bào)道記者分析道,早期的聲紋識(shí)別技術(shù),為了節(jié)省時(shí)間并提升用戶體驗(yàn),會(huì)要求用戶念一段固定的文本,此后每次驗(yàn)證都是朗讀同一段文本。

這被稱為固定文本的認(rèn)證方式?!暗珪?huì)造成兩個(gè)問題,第一是用戶體驗(yàn)不好,每次都被要求生硬地念一段文本,無法做到與用戶在自然交流中無感地完成身份認(rèn)證;第二是容易被錄音攻擊,因?yàn)槊看卫首x的都是同一段內(nèi)容,犯罪分子有可能通過提前偷錄他人的聲音,然后通過錄音回放攻擊系統(tǒng)?!彼M(jìn)一步表示,這導(dǎo)致初期的技術(shù)落地會(huì)存在較大風(fēng)險(xiǎn)。

大約在2000年開始,聲紋識(shí)別技術(shù)進(jìn)入相對(duì)成熟期,在此期間誕生了一批老牌語音廠商,科大訊飛就在其中。

前述行業(yè)人士向記者指出,這一階段的聲紋識(shí)別技術(shù)要點(diǎn)在于,將錄入的聲音壓縮成固定的矢量進(jìn)行匹配,準(zhǔn)確率已經(jīng)能夠達(dá)到約95%的水平,不足之處在于容易因外部干擾而影響結(jié)果,因此還沒到適合商用的標(biāo)準(zhǔn)。

從2015年開始,隨著AI技術(shù)的深化,不少以該項(xiàng)技術(shù)為背景的創(chuàng)業(yè)公司專門投身聲紋識(shí)別領(lǐng)域,不僅如此,在這兩年來,BAT等巨頭也相繼在這一領(lǐng)域入局。

“如今聲紋識(shí)別技術(shù)的進(jìn)步,得益于深度學(xué)習(xí)技術(shù)的成熟,以及傳感器、麥克風(fēng)、通信信道(如5G、4G VoLTE高清通話)等技術(shù)的進(jìn)步?!标悥|鵬介紹道,目前聲揚(yáng)科技的聲紋識(shí)別技術(shù)可以保證在高噪聲環(huán)境下聲紋識(shí)別的魯棒性、在很短時(shí)間內(nèi)完成語音認(rèn)證,也無需設(shè)置固定交流內(nèi)容。

應(yīng)用場(chǎng)景擴(kuò)圍

雖然當(dāng)前已經(jīng)可以在較好體驗(yàn)的情況下落地商用,但聲紋識(shí)別技術(shù)還有更長(zhǎng)遠(yuǎn)的路要走。

業(yè)內(nèi)認(rèn)為,當(dāng)前階段的聲紋識(shí)別技術(shù)已經(jīng)能夠滿足部分行業(yè)特定場(chǎng)景的應(yīng)用需求,當(dāng)然從商用門檻的成熟,到未來體驗(yàn)的成熟,依然有很大提升空間。對(duì)諸多生物識(shí)別技術(shù)來說都是如此。即便是目前已經(jīng)十分普及到手機(jī)端的屏下指紋識(shí)別技術(shù),歷經(jīng)多年商用迭代,也依然可以在識(shí)別時(shí)間、精準(zhǔn)度、模組大小等方面繼續(xù)優(yōu)化。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉