準(zhǔn)確率達(dá)97%,戴口罩人臉識別還得看三維技術(shù)?
對于三維人臉識別公司來說,戴口罩這件事不太一樣。最近,在一家人臉識別方案公司發(fā)生一件怪現(xiàn)象,有戴著口罩的員工在刷人臉識別門禁(并不具備戴口罩識別功能)時,居然可以識別開門。這到底是門禁產(chǎn)品自我進(jìn)化?還是此人天生異相?歡迎收看今天的走進(jìn)……人臉識別。
“模擬戴口罩”
由于新型冠狀病毒肺炎疫情的持續(xù)蔓延,出門戴口罩已經(jīng)成了人們近期的習(xí)慣,而帶有人臉識別功能的設(shè)備如手機、門禁等,突然翻臉不認(rèn)人,尤其在人群密集場所,門可以不開,這口罩萬萬不能摘。
當(dāng)然許多AI公司并不是吃素的,春節(jié)期間加班加點,就是為了讓人臉識別設(shè)備重新認(rèn)識你。在《口罩封印不了人臉識別》一文中,筆者整理并采訪了一些業(yè)內(nèi)公司,但都有一個共同點,都是二維人臉識別。
對于三維人臉識別公司來說,戴口罩這件事不太一樣。戴上口罩讓設(shè)備六親不認(rèn)的主要原因是人臉關(guān)鍵點檢測的精度受影響,人像信息減少,導(dǎo)致學(xué)習(xí)到的特征判別性隨之較少。二維識別叫“紋理信息丟失”,三維叫“形狀信息帶有噪聲”。
該怎么做呢?
“二維人臉識別的通常的做法是,根據(jù)二維圖片上的人臉關(guān)鍵點,將二維的口罩貼圖和二維圖片中的人臉做一個對齊,然后根據(jù)口罩的mask圖來完成填加口罩操作?!钡谋R深視【1】對TechSugar解釋道:“三維識別先重建三維人臉模型,再將口罩的三維模板模型與三維人臉模型做非剛性對齊,從而完成模擬加口罩的操作?!?/span>
簡而言之,戴口罩人臉識別對于算法工程師來說,第一件事也是戴口罩。畢竟很難在短時間內(nèi)采集得到數(shù)十萬的戴口罩?jǐn)?shù)據(jù)。
從技術(shù)上來講,數(shù)據(jù)端,通過各種途徑生成大量二維、三維遮擋數(shù)據(jù),用于優(yōu)化網(wǎng)絡(luò);算法端則是增大眼睛部分特征,通過局部特征與全局特征相結(jié)合的方式,提升模型在遮擋情況下的識別率。
三維的優(yōu)勢在哪里?
對于戴口罩人臉識別這件事,先要看清一個產(chǎn)品的話術(shù),“戴口罩識別”與“戴口罩身份識別”有著本質(zhì)上的區(qū)別,前者只需檢測有無戴口罩。
而后者在需要識別的底庫變得非常巨大時,又是另一番景象。
“底庫變得特別大的時候,局部遮擋的二維人臉識別準(zhǔn)確率就會極具下降,而加入深度信息的三維人臉識別,一般會有20%-30%的準(zhǔn)確率提升。”的盧深視公共安全事業(yè)部總經(jīng)理兼戰(zhàn)略產(chǎn)品部總經(jīng)理陶忠琦在提及二維與三維人臉識別準(zhǔn)確率差異時如此說道。
在測試級中,的盧深視的三維戴口罩人臉身份識別的準(zhǔn)確率可以達(dá)到97%,標(biāo)準(zhǔn)底庫可做到三萬人,加上輕網(wǎng)絡(luò)模型支持達(dá)到十萬人級別,重網(wǎng)絡(luò)可達(dá)到百萬級以上。接下來的盧深視將會對方案算法做魯棒性的提升。
據(jù)介紹,其采用基于人臉全局特征及局部特征相結(jié)合的方法,同時充分利用人臉未遮擋部位的三維幾何信息進(jìn)行三維人臉識別研究,相對于普通的二維人臉識別能夠有效應(yīng)對戴口罩等遮擋場景的人臉識別。
成立于2015年的的盧深視,在2014年就開始籌備團(tuán)隊建立工作,也是在那時,公司開始采集三維數(shù)據(jù)。目前,的盧深視在某邊疆省份落地3000多套3D設(shè)備,并建立了省級規(guī)模的人像數(shù)據(jù)庫,持續(xù)使用將近5年,采集得到的實戰(zhàn)數(shù)據(jù)千億級別,累計ID近3000萬,里邊涉及多民族及對應(yīng)服飾頭飾的識別,有過部分遮擋面部識別的技術(shù)積累。
的盧深視三維技術(shù)與蘋果Face ID同源,在談及結(jié)構(gòu)光與ToF區(qū)別時,陶忠琦稱:“由于投射器的原因,目前ToF的數(shù)據(jù)精度并不能滿足人臉識別,可用作活體檢測,更適合于低成本門禁,代替用A4紙就能攻破的二維識別。而在近距離人臉識別上,結(jié)構(gòu)光還是最理想的路線?!?/span>
技術(shù)之外
“目前整個供應(yīng)鏈都處于緊張狀態(tài),不涉及測溫模塊還好,根據(jù)我們供應(yīng)鏈的口徑,三月初可以拿到貨。” 在技術(shù)較量之外,陶忠琦這句話表明當(dāng)前的挑戰(zhàn)還有供應(yīng)鏈問題。
對于的盧深視來說,此次戴口罩人臉身份識別方案并不是賺錢項目,不過隨著人們整體疫情防范意識的提升,未來是否有機會也說不準(zhǔn)。
“疫情過后,一定會有一次全面性的復(fù)盤,可能會推動整個產(chǎn)業(yè)需求的發(fā)展,在產(chǎn)業(yè)推動的過程中,成本也會降低?!?陶忠琦提到了產(chǎn)業(yè)鏈中關(guān)鍵的兩個字——成本:“去年,三維識別單是相機這一塊,成本就下降了50%,主要是靠人臉識別來驅(qū)動整個產(chǎn)業(yè)鏈的成熟?!?/span>
成本下降的背后并不是某個產(chǎn)品變便宜了,而是隨著需求的增大,讓器件變得便宜,這也是所有電子產(chǎn)品的趨勢。
對于三維識別來說,在人臉支付上存在很大潛力。此外,“三維識別還會在側(cè)臉識別、醫(yī)美領(lǐng)域、車機系統(tǒng)、智慧屏幕等未來場景有一席之地。” 陶忠琦暢想三維識別未來時表示:“但二維和三維一定是并存的狀態(tài),并不是誰替代誰?!?/span>
那么本文開頭所提到的案列到底是怎么回事?顯然這是三維人臉識別的優(yōu)勢所在,如果你沒被遮擋的部分被識別的信息量達(dá)到設(shè)備的閾值,就可以被識別。換言之,三維人臉識別下,臉部信息更豐富者更有優(yōu)勢。如果用數(shù)學(xué)極限法來看,只要你臉足夠大,戴帽子+戴口罩也難不倒三維人臉識別。
【1】備注:的盧深視是一家專注三維機器視覺和人工智能領(lǐng)域的高新技術(shù)企業(yè),成立于2015年8月,總部位于北京,在杭州、合肥兩地設(shè)有研發(fā)中心,在結(jié)構(gòu)光深度感知、三維實時高精度重建、三維跟蹤識別及感知等技術(shù)方向上,處于國際領(lǐng)先地位。