科大訊飛李繁:多生物特征融合認(rèn)證能極大降低誤識(shí)率
李繁是科大訊飛云平臺(tái)事業(yè)部人臉聲紋技術(shù)主管,作為研發(fā)負(fù)責(zé)人參與構(gòu)建了面向十億級(jí)互聯(lián)網(wǎng)用戶提供語(yǔ)音交互服務(wù)能力的“訊飛開(kāi)放平臺(tái)”,負(fù)責(zé)平臺(tái)身份驗(yàn)證業(yè)務(wù)線技術(shù)孵化與能力輸出。以下筆者整理的李繁近期在一公開(kāi)課上分享的內(nèi)容:
大家晚上好,我是科大訊飛的李繁??拼笥嶏w在語(yǔ)音技術(shù)方面的基礎(chǔ)研究時(shí)間超過(guò)了16年,目前正構(gòu)建人工智能生態(tài)圈,擁有專門(mén)面向互聯(lián)網(wǎng)開(kāi)放的人工智能開(kāi)放平臺(tái),輸出各項(xiàng)核心的前沿技術(shù)。
目前,生物特征識(shí)別技術(shù)已經(jīng)逐步在金融領(lǐng)域推廣使用。上一期鈦客們分享了人臉識(shí)別技術(shù)(鈦坦白干貨)和虹膜識(shí)別(鈦坦白干貨)在金融領(lǐng)域的應(yīng)用,也對(duì)這些生物特征為何能應(yīng)用金融領(lǐng)域的特性做了說(shuō)明。今天我主要從技術(shù)解決方案角度來(lái)說(shuō)明,多生物特征融合認(rèn)證系統(tǒng)一個(gè)基于人臉識(shí)別技術(shù)與聲紋識(shí)別技術(shù)為接入點(diǎn),可同時(shí)對(duì)多種生物特征進(jìn)行融合認(rèn)證的身份驗(yàn)證解決方案。
早前,國(guó)際生物特征組織分別從干擾用戶程度,獨(dú)立性,費(fèi)用代價(jià),易用性這四個(gè)層面對(duì)市場(chǎng)上在用的生物特征進(jìn)行了系統(tǒng)的統(tǒng)計(jì)分析,分析包括掌紋識(shí)別,簽名識(shí)別,指紋識(shí)別,語(yǔ)音識(shí)別,虹膜識(shí)別,視網(wǎng)膜識(shí)別,臉部識(shí)別以及溫譜識(shí)別。提出,理想的生物特征系統(tǒng)需要具備高獨(dú)特性,高易用性,對(duì)用戶干擾程度低且費(fèi)用代價(jià)低的特性。從這里可以看出,在人類認(rèn)知范圍內(nèi)的聲紋識(shí)別、人臉識(shí)別技術(shù)和簽名識(shí)別技術(shù)以及人類認(rèn)知范圍外的指紋識(shí)別,虹膜識(shí)別,和掌紋識(shí)別,為何能在各自的領(lǐng)域中發(fā)揮著重要的作用。
聲紋識(shí)別技術(shù)和人臉識(shí)別技術(shù)能夠被用作便捷的身份認(rèn)證形式,與其擁有的特點(diǎn)是分不開(kāi)的,首先這些生物特征與生俱來(lái)的,具備唯一性,不易被復(fù)制。其次,這些特征都是易采集且采集隱蔽性較強(qiáng),無(wú)需新增硬件成本還能夠被遠(yuǎn)程操作。
以聲紋技術(shù)來(lái)說(shuō),聲紋是根據(jù)語(yǔ)音波形中反映說(shuō)話人心理和行為特征的語(yǔ)音參數(shù),自動(dòng)識(shí)別說(shuō)話人身份,每個(gè)人無(wú)論別人說(shuō)話模仿的多么相似,他都具有獨(dú)一無(wú)二的聲紋。這是由每個(gè)人的發(fā)聲器官在成長(zhǎng)過(guò)程中形成的,這個(gè)唯一性能夠唯一確定一個(gè)用戶的身份。
訊飛是國(guó)內(nèi)最早開(kāi)始研究聲紋識(shí)別技術(shù)且最早達(dá)到實(shí)用級(jí)別的廠商,在提出多生物特征融合認(rèn)證解決方案之前,就已經(jīng)為公共安全部門(mén)和金融機(jī)構(gòu)提供了相關(guān)技術(shù)支持。作為身份驗(yàn)證的一種方式,自然說(shuō)話中即可確定身份,接受度較高。
聲紋識(shí)別模式目前對(duì)外支持了聲紋自由說(shuō)、動(dòng)態(tài)數(shù)字密碼、開(kāi)放文本密碼、固定文本密碼。如下圖,各種識(shí)別模式均有其對(duì)應(yīng)的應(yīng)用場(chǎng)景。動(dòng)態(tài)數(shù)字密碼因其使用便捷性,已成為金融支付中最為廣泛的聲紋識(shí)別模式。
在這個(gè)領(lǐng)域中聲紋識(shí)別主要用途分為兩種,與人臉識(shí)別相似,一是聲紋確認(rèn),即1:1比對(duì),二是聲紋鑒別,即1:N比對(duì)。聲紋確認(rèn)直接使用待校驗(yàn)人的聲紋模型數(shù)據(jù)與注冊(cè)時(shí)的聲紋模型數(shù)據(jù)比對(duì),得出一個(gè)相似度得分,而聲紋鑒別在一組模型中找出與待校驗(yàn)人相似度最高的聲紋發(fā)音者,當(dāng)然這個(gè)相似度得分能否作為判斷是本人的依據(jù),需要應(yīng)用根據(jù)其容忍度進(jìn)行來(lái)設(shè)置。
下面來(lái)說(shuō)一下聲紋識(shí)別技術(shù)的效果衡量標(biāo)準(zhǔn)(這個(gè)效果衡量標(biāo)準(zhǔn)的實(shí)質(zhì)就是安全性與易用性間的權(quán)衡):
錯(cuò)誤接受率(False Accept Rate),指非本人被錯(cuò)誤的認(rèn)為是本人的次數(shù)占聲紋冒人操作次數(shù)的比值;
錯(cuò)誤拒絕率(False Reject Rate),指本人被錯(cuò)誤的認(rèn)為是非本人的次數(shù)占聲紋確認(rèn)操作次數(shù)的比值;
相等錯(cuò)誤率(Equal Error Rate),指FA等于FR時(shí)的百分比。是衡量聲紋驗(yàn)證效果的重要依據(jù)。
至此,想必大家對(duì)聲紋識(shí)別技術(shù)以及人臉識(shí)別技術(shù)都有了一個(gè)基本的認(rèn)識(shí)。
可能有人會(huì)問(wèn),現(xiàn)在的人臉識(shí)別作為一種支付認(rèn)證手段已經(jīng)在市場(chǎng)上推廣使用了,而且普遍反饋效果很好,為什么還要去做這個(gè)多生物特征融合?以人臉識(shí)別技術(shù)來(lái)說(shuō),在最新的deepID2算法下,人臉的分辯能力能夠達(dá)到99.47%,但是在實(shí)際的應(yīng)用中還面臨著各種挑戰(zhàn),比如說(shuō)大家都能感受到的一個(gè)比較大的挑戰(zhàn)就是,我們旁邊的這些韓國(guó)小姐;當(dāng)然,聲紋識(shí)別技術(shù)同樣也有應(yīng)用上的挑戰(zhàn),比如說(shuō)聲紋易變形,易受身體狀況、年齡、情緒等方面的影響,實(shí)際使用中會(huì)受到錄音設(shè)備的影響。所以說(shuō),作為單一的生物特征認(rèn)證有一定的不穩(wěn)定性和局限性。
為應(yīng)對(duì)支付領(lǐng)域的高安全性需求同時(shí)解決單一生物特征的不穩(wěn)定性和局限性,提出了多生物特征融合認(rèn)證解決方案,多生物特征融合的核心基礎(chǔ)就是特征間的獨(dú)立性和互補(bǔ)性,從不同維度對(duì)兩種生物特征進(jìn)行融合計(jì)算,能夠最大限度的利用兩種生物特征的優(yōu)點(diǎn),同時(shí)能夠從一定程度上降低誤識(shí)率,比如說(shuō)剛才提到聲紋變形或錄音設(shè)備的影響。
多生物特征融合認(rèn)證解決方案是一整套的互聯(lián)網(wǎng)解決方案,關(guān)鍵特性包括:
1、 統(tǒng)一接入方式,云服務(wù)持續(xù)優(yōu)化升級(jí),對(duì)于后續(xù)新開(kāi)放的生物特征能夠靈活接入,集成應(yīng)用可以根據(jù)需要靈活選擇新切入的生物特征。
2、 自定義安全閾值,結(jié)合應(yīng)用場(chǎng)景設(shè)置安全級(jí)別,對(duì)于支付認(rèn)證這種安全要求較高的領(lǐng)域中可以設(shè)置當(dāng)所有生物特征都必須全部匹配時(shí)才認(rèn)為確認(rèn)無(wú)誤,而在對(duì)安全性要求不高的領(lǐng)域中,比如打卡系統(tǒng),可以設(shè)置當(dāng)任意一種生物特征的匹配度符合標(biāo)準(zhǔn)都予以通過(guò)。采用這種方式能在保障校驗(yàn)準(zhǔn)確度的同時(shí)有效的提高通過(guò)率。
3、 閉環(huán)的安全校驗(yàn),能夠?yàn)閼?yīng)用提供閉環(huán)的安全校驗(yàn)交互,避免特征交互過(guò)程中被篡改或者偽造,同時(shí)特征的傳輸通道采用多層加密的方式。
多生物特征融合認(rèn)證解決方案在支付領(lǐng)域里面的應(yīng)用,下面為大家舉幾個(gè)例子,
1、2015年8月,科大訊飛聯(lián)合中國(guó)銀聯(lián)和徽商銀行發(fā)布了 “聲紋+人臉”融合認(rèn)證個(gè)人轉(zhuǎn)帳應(yīng)用,是第一款采用多生物特征融合技術(shù)在移動(dòng)支付領(lǐng)域的產(chǎn)品,能夠有效防范圖片或者視頻回放的欺詐風(fēng)險(xiǎn)。在綁定銀行卡環(huán)節(jié)中,還應(yīng)用了自動(dòng)識(shí)別身份證和銀行卡的功能,顯著簡(jiǎn)化了用戶的操作。
2、2016年的2月,徽商銀行正式發(fā)布帶有人臉聲紋識(shí)別功能的手機(jī)銀行版本,用戶在使用手機(jī)銀行的時(shí),可用“人臉+識(shí)別”替代手動(dòng)輸入密碼。
3、目前正在對(duì)接的多家證券公司,都希望這個(gè)方案能夠用于遠(yuǎn)程開(kāi)戶和安全支付,用戶不必再通過(guò)繁雜的人工校驗(yàn)審核,也不用擔(dān)心因?qū)徍诉^(guò)程的復(fù)雜而錯(cuò)失一個(gè)投資良機(jī),對(duì)于使用者和企業(yè)來(lái)說(shuō)都是比較高效的一個(gè)應(yīng)用方式。
除了在金融支付領(lǐng)域,在其他領(lǐng)域也在使用這種多生物特征融合認(rèn)證的解決方案,比如,科大訊飛目前在用的身份認(rèn)證考勤,全國(guó)各地的分公司只要在指定的地點(diǎn)進(jìn)行通過(guò)app進(jìn)行“人臉+聲紋”打卡即可。