當(dāng)前位置:首頁(yè) > 智能硬件 > 人工智能AI
[導(dǎo)讀]   李繁是科大訊飛云平臺(tái)事業(yè)部人臉聲紋技術(shù)主管,作為研發(fā)負(fù)責(zé)人參與構(gòu)建了面向十億級(jí)互聯(lián)網(wǎng)用戶提供語(yǔ)音交互服務(wù)能力的“訊飛開(kāi)放平臺(tái)”,負(fù)責(zé)平臺(tái)身份驗(yàn)證業(yè)務(wù)線技術(shù)孵化與能力輸

  李繁是科大訊飛云平臺(tái)事業(yè)部人臉聲紋技術(shù)主管,作為研發(fā)負(fù)責(zé)人參與構(gòu)建了面向十億級(jí)互聯(lián)網(wǎng)用戶提供語(yǔ)音交互服務(wù)能力的“訊飛開(kāi)放平臺(tái)”,負(fù)責(zé)平臺(tái)身份驗(yàn)證業(yè)務(wù)線技術(shù)孵化與能力輸出。以下筆者整理的李繁近期在一公開(kāi)課上分享的內(nèi)容:

  大家晚上好,我是科大訊飛的李繁??拼笥嶏w在語(yǔ)音技術(shù)方面的基礎(chǔ)研究時(shí)間超過(guò)了16年,目前正構(gòu)建人工智能生態(tài)圈,擁有專門(mén)面向互聯(lián)網(wǎng)開(kāi)放的人工智能開(kāi)放平臺(tái),輸出各項(xiàng)核心的前沿技術(shù)。

  目前,生物特征識(shí)別技術(shù)已經(jīng)逐步在金融領(lǐng)域推廣使用。上一期鈦客們分享了人臉識(shí)別技術(shù)(鈦坦白干貨)和虹膜識(shí)別(鈦坦白干貨)在金融領(lǐng)域的應(yīng)用,也對(duì)這些生物特征為何能應(yīng)用金融領(lǐng)域的特性做了說(shuō)明。今天我主要從技術(shù)解決方案角度來(lái)說(shuō)明,多生物特征融合認(rèn)證系統(tǒng)一個(gè)基于人臉識(shí)別技術(shù)與聲紋識(shí)別技術(shù)為接入點(diǎn),可同時(shí)對(duì)多種生物特征進(jìn)行融合認(rèn)證的身份驗(yàn)證解決方案。

  

  早前,國(guó)際生物特征組織分別從干擾用戶程度,獨(dú)立性,費(fèi)用代價(jià),易用性這四個(gè)層面對(duì)市場(chǎng)上在用的生物特征進(jìn)行了系統(tǒng)的統(tǒng)計(jì)分析,分析包括掌紋識(shí)別,簽名識(shí)別,指紋識(shí)別,語(yǔ)音識(shí)別,虹膜識(shí)別,視網(wǎng)膜識(shí)別,臉部識(shí)別以及溫譜識(shí)別。提出,理想的生物特征系統(tǒng)需要具備高獨(dú)特性,高易用性,對(duì)用戶干擾程度低且費(fèi)用代價(jià)低的特性。從這里可以看出,在人類認(rèn)知范圍內(nèi)的聲紋識(shí)別、人臉識(shí)別技術(shù)和簽名識(shí)別技術(shù)以及人類認(rèn)知范圍外的指紋識(shí)別,虹膜識(shí)別,和掌紋識(shí)別,為何能在各自的領(lǐng)域中發(fā)揮著重要的作用。

  聲紋識(shí)別技術(shù)和人臉識(shí)別技術(shù)能夠被用作便捷的身份認(rèn)證形式,與其擁有的特點(diǎn)是分不開(kāi)的,首先這些生物特征與生俱來(lái)的,具備唯一性,不易被復(fù)制。其次,這些特征都是易采集且采集隱蔽性較強(qiáng),無(wú)需新增硬件成本還能夠被遠(yuǎn)程操作。

  

  以聲紋技術(shù)來(lái)說(shuō),聲紋是根據(jù)語(yǔ)音波形中反映說(shuō)話人心理和行為特征的語(yǔ)音參數(shù),自動(dòng)識(shí)別說(shuō)話人身份,每個(gè)人無(wú)論別人說(shuō)話模仿的多么相似,他都具有獨(dú)一無(wú)二的聲紋。這是由每個(gè)人的發(fā)聲器官在成長(zhǎng)過(guò)程中形成的,這個(gè)唯一性能夠唯一確定一個(gè)用戶的身份。

  訊飛是國(guó)內(nèi)最早開(kāi)始研究聲紋識(shí)別技術(shù)且最早達(dá)到實(shí)用級(jí)別的廠商,在提出多生物特征融合認(rèn)證解決方案之前,就已經(jīng)為公共安全部門(mén)和金融機(jī)構(gòu)提供了相關(guān)技術(shù)支持。作為身份驗(yàn)證的一種方式,自然說(shuō)話中即可確定身份,接受度較高。

  聲紋識(shí)別模式目前對(duì)外支持了聲紋自由說(shuō)、動(dòng)態(tài)數(shù)字密碼、開(kāi)放文本密碼、固定文本密碼。如下圖,各種識(shí)別模式均有其對(duì)應(yīng)的應(yīng)用場(chǎng)景。動(dòng)態(tài)數(shù)字密碼因其使用便捷性,已成為金融支付中最為廣泛的聲紋識(shí)別模式。

  

  在這個(gè)領(lǐng)域中聲紋識(shí)別主要用途分為兩種,與人臉識(shí)別相似,一是聲紋確認(rèn),即1:1比對(duì),二是聲紋鑒別,即1:N比對(duì)。聲紋確認(rèn)直接使用待校驗(yàn)人的聲紋模型數(shù)據(jù)與注冊(cè)時(shí)的聲紋模型數(shù)據(jù)比對(duì),得出一個(gè)相似度得分,而聲紋鑒別在一組模型中找出與待校驗(yàn)人相似度最高的聲紋發(fā)音者,當(dāng)然這個(gè)相似度得分能否作為判斷是本人的依據(jù),需要應(yīng)用根據(jù)其容忍度進(jìn)行來(lái)設(shè)置。

  下面來(lái)說(shuō)一下聲紋識(shí)別技術(shù)的效果衡量標(biāo)準(zhǔn)(這個(gè)效果衡量標(biāo)準(zhǔn)的實(shí)質(zhì)就是安全性與易用性間的權(quán)衡):

  錯(cuò)誤接受率(False Accept Rate),指非本人被錯(cuò)誤的認(rèn)為是本人的次數(shù)占聲紋冒人操作次數(shù)的比值;

  錯(cuò)誤拒絕率(False Reject Rate),指本人被錯(cuò)誤的認(rèn)為是非本人的次數(shù)占聲紋確認(rèn)操作次數(shù)的比值;

  相等錯(cuò)誤率(Equal Error Rate),指FA等于FR時(shí)的百分比。是衡量聲紋驗(yàn)證效果的重要依據(jù)。

  至此,想必大家對(duì)聲紋識(shí)別技術(shù)以及人臉識(shí)別技術(shù)都有了一個(gè)基本的認(rèn)識(shí)。

  可能有人會(huì)問(wèn),現(xiàn)在的人臉識(shí)別作為一種支付認(rèn)證手段已經(jīng)在市場(chǎng)上推廣使用了,而且普遍反饋效果很好,為什么還要去做這個(gè)多生物特征融合?以人臉識(shí)別技術(shù)來(lái)說(shuō),在最新的deepID2算法下,人臉的分辯能力能夠達(dá)到99.47%,但是在實(shí)際的應(yīng)用中還面臨著各種挑戰(zhàn),比如說(shuō)大家都能感受到的一個(gè)比較大的挑戰(zhàn)就是,我們旁邊的這些韓國(guó)小姐;當(dāng)然,聲紋識(shí)別技術(shù)同樣也有應(yīng)用上的挑戰(zhàn),比如說(shuō)聲紋易變形,易受身體狀況、年齡、情緒等方面的影響,實(shí)際使用中會(huì)受到錄音設(shè)備的影響。所以說(shuō),作為單一的生物特征認(rèn)證有一定的不穩(wěn)定性和局限性。

  為應(yīng)對(duì)支付領(lǐng)域的高安全性需求同時(shí)解決單一生物特征的不穩(wěn)定性和局限性,提出了多生物特征融合認(rèn)證解決方案,多生物特征融合的核心基礎(chǔ)就是特征間的獨(dú)立性和互補(bǔ)性,從不同維度對(duì)兩種生物特征進(jìn)行融合計(jì)算,能夠最大限度的利用兩種生物特征的優(yōu)點(diǎn),同時(shí)能夠從一定程度上降低誤識(shí)率,比如說(shuō)剛才提到聲紋變形或錄音設(shè)備的影響。

  多生物特征融合認(rèn)證解決方案是一整套的互聯(lián)網(wǎng)解決方案,關(guān)鍵特性包括:

  1、 統(tǒng)一接入方式,云服務(wù)持續(xù)優(yōu)化升級(jí),對(duì)于后續(xù)新開(kāi)放的生物特征能夠靈活接入,集成應(yīng)用可以根據(jù)需要靈活選擇新切入的生物特征。

  2、 自定義安全閾值,結(jié)合應(yīng)用場(chǎng)景設(shè)置安全級(jí)別,對(duì)于支付認(rèn)證這種安全要求較高的領(lǐng)域中可以設(shè)置當(dāng)所有生物特征都必須全部匹配時(shí)才認(rèn)為確認(rèn)無(wú)誤,而在對(duì)安全性要求不高的領(lǐng)域中,比如打卡系統(tǒng),可以設(shè)置當(dāng)任意一種生物特征的匹配度符合標(biāo)準(zhǔn)都予以通過(guò)。采用這種方式能在保障校驗(yàn)準(zhǔn)確度的同時(shí)有效的提高通過(guò)率。

  3、 閉環(huán)的安全校驗(yàn),能夠?yàn)閼?yīng)用提供閉環(huán)的安全校驗(yàn)交互,避免特征交互過(guò)程中被篡改或者偽造,同時(shí)特征的傳輸通道采用多層加密的方式。

  多生物特征融合認(rèn)證解決方案在支付領(lǐng)域里面的應(yīng)用,下面為大家舉幾個(gè)例子,

  1、2015年8月,科大訊飛聯(lián)合中國(guó)銀聯(lián)和徽商銀行發(fā)布了 “聲紋+人臉”融合認(rèn)證個(gè)人轉(zhuǎn)帳應(yīng)用,是第一款采用多生物特征融合技術(shù)在移動(dòng)支付領(lǐng)域的產(chǎn)品,能夠有效防范圖片或者視頻回放的欺詐風(fēng)險(xiǎn)。在綁定銀行卡環(huán)節(jié)中,還應(yīng)用了自動(dòng)識(shí)別身份證和銀行卡的功能,顯著簡(jiǎn)化了用戶的操作。

  2、2016年的2月,徽商銀行正式發(fā)布帶有人臉聲紋識(shí)別功能的手機(jī)銀行版本,用戶在使用手機(jī)銀行的時(shí),可用“人臉+識(shí)別”替代手動(dòng)輸入密碼。

  3、目前正在對(duì)接的多家證券公司,都希望這個(gè)方案能夠用于遠(yuǎn)程開(kāi)戶和安全支付,用戶不必再通過(guò)繁雜的人工校驗(yàn)審核,也不用擔(dān)心因?qū)徍诉^(guò)程的復(fù)雜而錯(cuò)失一個(gè)投資良機(jī),對(duì)于使用者和企業(yè)來(lái)說(shuō)都是比較高效的一個(gè)應(yīng)用方式。

  除了在金融支付領(lǐng)域,在其他領(lǐng)域也在使用這種多生物特征融合認(rèn)證的解決方案,比如,科大訊飛目前在用的身份認(rèn)證考勤,全國(guó)各地的分公司只要在指定的地點(diǎn)進(jìn)行通過(guò)app進(jìn)行“人臉+聲紋”打卡即可。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉