2017年蘋果新品手機iPhone X采用Face ID人臉識別解鎖,此前小米Note3、Vivo V7+也推出具備人臉識別功能的智能手機。這標志著人臉識別技術加速邁入消費級領域。
手機設備以外的眾多領域也同樣在發(fā)生重大變革。武漢火車站宣布全面刷臉進站;百度宣布與首都國際機場簽署戰(zhàn)略合作協(xié)議打造刷臉登機的智慧機場;支付寶宣布商用刷臉支付;杭州大量賓館免身份證,刷臉即可入?。痪〇|蘇寧開啟刷臉支付;農(nóng)業(yè)銀行總行在自動取款機試點“刷臉取款”,目前已下發(fā)通知要求全國推廣刷臉取款,將為全國24064家分支機構、30089臺柜員機、10萬個ATM機安裝人臉識別系統(tǒng);招商銀行也已于近期在全國重點城市的ATM取款機系統(tǒng)上線了“刷臉取款”選項,用戶可不帶銀行卡、身份證,不用輸入銀行賬戶,靠“刷臉”就能取款。由此可見,人臉識別技術加速滲透進入安防、銀行、支付等眾多領域,并且已經(jīng)從政府級別應用、商業(yè)級別應用開始進入到消費級別的爆發(fā)時期,驗證了人臉識別技術巨大的市場需求與廣闊的應用前景。
據(jù)Yole數(shù)據(jù)顯示,全球人臉識別市場規(guī)模預計將從2017年的40.5億美元增長至2022年的77.6億美元,這期間的復合年增長率可達13.9%。推動市場增長的主要因素包括:iPhone X帶動更多智能手機集成3D人臉識別,公共場所日益增長的監(jiān)控需求,以及政府部門等各個產(chǎn)業(yè)對人臉識別技術的應用增長。
人臉識別技術的優(yōu)勢人臉識別的工程應用始于20世紀60年代,經(jīng)過50多年的發(fā)展,人臉識別技術已經(jīng)取得了重大突破,很多經(jīng)典算法和人臉庫相繼出現(xiàn)。目前人臉識別系統(tǒng)最高的正確率可以達到99.5%,而人眼在同等條件下識別的正確率僅為97.52%,人臉識別的準確率已經(jīng)做到了比肉眼更精準。
人臉識別大致分為兩種應用模式四步流程。兩種模式包括1:1比對和1: N識別,1:1是比對兩個人臉的相似度,只需要確定是否授權人;1:N是識別對象是否在人臉數(shù)據(jù)庫中。四部流程依次是人臉檢測、活體檢測、人臉特征提取和人臉匹配識別。
與其他生物特征識別技術相比,人臉識別技術在實用性方面具有獨到的技術優(yōu)勢,主要體現(xiàn)在以下方面:
1、非接觸:人臉圖像的采集不同于指紋、掌紋需要接觸指掌紋專用采集設備,指掌紋的采集除了對設備有一定的磨損外,也不衛(wèi)生,容易引起被采集者的反感,而人臉圖像采集的設備是攝像頭,無須接觸。
2、非侵擾:人臉照片的采集可使用攝像頭自動拍照,無須工作人員干預,也無 須被采集者配合,只需以正常狀態(tài)經(jīng)過攝像頭前即可。
3、友好:人臉是一個人出生之后暴露在外的生物特征,因此它的隱私性并不像指掌紋、虹膜那樣強,因此人臉的采集并不像指掌紋采集那樣難以讓人接受。
4、直觀:我們判斷一個人是誰,通過看這個人的臉就是最直觀的方式,不像指掌紋、虹膜等需要相關領域專家才可以判別。
5、快速:從攝像頭監(jiān)控區(qū)域進行人臉的采集是非常快速的,因為它的非干預性和非接觸性,讓人臉采集的時間大大縮短。
6、簡便:人臉采集前端設備——攝像頭隨處可見,它不是專用設備,因此簡單易操作。
7、可擴展性好:它的采集端完全可以采用現(xiàn)有視頻監(jiān)控系統(tǒng)的攝像設備,后端應用的擴展性決定了人臉識別可以應用在出入控制、黑名單監(jiān)控、人臉照片搜索等多領域。
深度學習和3D視覺助推人臉識別發(fā)展
長久以來,技術創(chuàng)新不足、應用推廣有限、價格成本高企是制約人臉識別發(fā)展的三大因素。研究人臉識別算法優(yōu)化、輕量化的團隊較少,算法的優(yōu)化尚未完成,在功耗小的情況下保持一定的速度和精度是人臉識別應用發(fā)展的難點。因此最近幾年人臉識別雖然被廣泛應用到出入境通關、機場安檢等政府部門中,但一直沒能真正進入到更廣泛的商業(yè)化應用領域中。
第一,在技術層面上,人臉識別的精準度和核心算法的原始創(chuàng)新不足、技術標準 制定還不完善,快速準確完成人臉識別需要解決很多技術上的難點:
自身生理變化。在人臉比對的過程中,如果自身與數(shù)據(jù)庫里面存儲的人臉發(fā)生了較大的生理變化,例如經(jīng)歷剃須、換發(fā)型、戴眼鏡遮擋等變化。即使外貌并沒有發(fā)生太多變化,人通過臉部的變化產(chǎn)生很多表情,都有可能會引起 比對失敗。
外部環(huán)境影響。人臉受到很多外部因素的影響:在不同的角度進行拍攝,人臉的視覺圖像相差很大;容易受到光照條件影響,比如白天和黑夜、室內(nèi)和室外的光照存在較大差異。
除了這兩種情況,還有人為的整容行為、雙胞胎等極端情況存在。如何規(guī)避這些外因對于人臉識別速度和識別效果的影響,一直都是科研的重點研究方向。
人臉識別技術難點
第二,應用方面上,人臉識別基本局限在公安部門出入境管理等政府部門中,未能滲透到大規(guī)模商業(yè)級別應用和個人消費級別當中。在應用層面上,盡管在實驗室等科研條件下,許多人臉識別技術的精準度已經(jīng)達到99%、甚至99.5%以上的水平,但是這些技術和方案很難落地到實際應用層面上。人臉識別技術落地的過程中,需要考慮到不同的場景運用。在實際落地過程中,指紋識別等其他生物識別由于技術成熟,不易受到外界因素影響,早已經(jīng)運用到考勤認證、智能手機賬號登錄中,可替代物的成熟發(fā)展也制約了人臉識別產(chǎn)業(yè)化的進程。
第三,價格方面,市場競爭不足和技術不成熟導致價格處于高位。由于技術不成熟,人臉識別技術并未應用到商業(yè)場景和消費級領域,大部分被運用到政府和公安部門,且采用系統(tǒng)集成的方式交付,一套系統(tǒng)的成本和價格非常高昂。
但近幾年來,這一情形開始轉向,三大問題正在逐漸得到解決。
技術方面,深度學習算法的成熟,使得人臉的準確率得到大幅提升。以深度學習算法為基礎的計算機技術的進步,為人臉識別提供了強大的計算和分析工具。反過來,巨量的生物特征數(shù)據(jù)也為機器訓練提供了豐富的素材,“大數(shù)據(jù)成為人工智能的燃料”。人臉識別方面,F(xiàn)ace++團隊創(chuàng)造了世界上最高的人臉識別正確率,曾在人臉檢測FDDB評測、人臉關鍵點定位300-W評測和人臉識別LFW評測上,接連拿下了三項世界第一。
應用方面,目前,生物識別的應用場景已經(jīng)極大地拓寬。銀行在客戶身份核驗場景下應用生物識別,覆蓋了弱實名電子賬戶開戶、結算賬戶開戶和存取款等不同風險層級的場景。第三方支付和手機銀行等移動支付應用開始使用生物識別方案。公安部門在視頻監(jiān)控和多類場所的人員進出管理中大力引入人臉識別技術。在政策推動下,人臉識別也已入駐社保、教育、醫(yī)療系統(tǒng)。近幾年,國內(nèi)智能手機消費劇增,手機用戶的移動支付習慣逐漸養(yǎng)成,智能家居漸受青睞,三方面?zhèn)€人消費需求的增長推動手機端的消費級人臉識別開始爆發(fā)。
價格方面,人臉識別設備近兩年不斷下降。近年來,技術的進步和算法的改善讓人臉識別技術邁上一個新的臺階,在國家政府推動和政策支持下,我國人臉識別技術和應用都取得了非常大的進步。
目前3D感應有3種主流方案:結構光,飛行時間(TOF)以及雙目測距:
結構光(Structured Light):結構光投射特定的光信息到物體表面后,由攝像 頭采集,這些光斑打在物體上后,因為與攝像頭距離不同,被攝像頭捕捉到的位臵也不盡相同。根據(jù)物體造成的光信號的變化來計算物體的位臵 和深度等信息,進而復原整個三維空間。蘋果iPhone X人臉識別技術即是采用了3D結構光技術。
飛行時間TOF(TIme Of Flight):通過專有傳感器,捕捉近紅外光從發(fā)射到接。
收的飛行時間,判斷物體距離。TOF的硬件實現(xiàn)方式和結構光類似,區(qū)別只是在于算法上,結構光采用編碼過的光信息進行投射,而TOF直接計算光往返各像素點的相位差。此技術被微軟用在了第二代的Kinct上。
雙目測距(Stereo System):原理類似人的雙眼,在自然光下通過兩個攝像頭抓取圖像,通過三角形原理來計算并獲得深度信息,目前的雙攝像頭就是雙目測距的典型應用。在移動設備上的應用較少,多用在戶外機器人。
由于雙目測距技術受限條件較多,不能在黑夜中使用,所以商用的3D深度視覺包括飛行時間和結構光兩種技術。
受益于三大技術難點的逐步解決,國內(nèi)人臉識別產(chǎn)業(yè)正迎來前所未有的發(fā)展機會,其應用范圍和市場規(guī)模有望實現(xiàn)快速擴張。近紅外人臉識別與可見光技術的結合、3D結構光、深度攝像頭的發(fā)展都給人臉識別技術帶來了技術革新。深度學習算法的突破則大大促進了人工智能和人臉識別技術的發(fā)展,提高了識別的效率和精確度。
消費級應用即將爆發(fā),人臉識別場景日趨多元
刷臉時代來臨,人臉識別市場廣闊,盈利模式多變,消費級領域產(chǎn)業(yè)化將爆發(fā)。
互聯(lián)網(wǎng)+:人臉識別技術在互聯(lián)網(wǎng)領域得到了廣泛應用。商湯科技通過深度學習算法,在新浪微博“面孔專輯”功能實現(xiàn)人臉檢測并且分類;曠視為美圖旗下的美圖秀秀App、美顏相機、美顏手機等一系列軟硬件產(chǎn)品提供了人臉識別技術支持。其中美圖秀秀和美顏相機App通過曠視(Face++)的人臉檢測和關鍵點檢測技術,可以在圖像中精準定位人臉和五官位置,從而進行人像美白、五官美化等處理,快速完成精準修容。
新零售&支付:人臉識別技術也被應用在新零售領域,推動著無人零售的發(fā)展與實現(xiàn)。2017年9月KFC與螞蟻金服合作在其第一家升級店K PRO采用人臉識別系統(tǒng)等技術,消費者微笑就可通過人臉識別系統(tǒng)完成支付。店內(nèi)沒有設臵點餐臺和收銀員,消費者到店點餐不僅可以通過設臵在門口的自助點餐機點餐,也能通過手機掃描餐桌上的二維碼自助點餐、支付。在未來,人臉識別技術還可用于客流統(tǒng)計、消費者心理和行為分析。通過客流統(tǒng)計數(shù)據(jù),分析不同區(qū)域、通道的客流和顧客滯留時間,與銷售業(yè)績報表結合,可以分析顧客購買行為,顧客性別年齡組成。
智能手機:人臉檢測和分類技術早已經(jīng)被運用到智能手機應用中,例如OPPO、小米等手機中,應用了商湯的人臉聚類功能,云端存儲照片將被自動分類,避免了手動分類 照片的繁瑣操作,優(yōu)化了用戶體驗。
2017年蘋果、小米、Vivo等智能手機廠商不約而同地在新上線的新機型中搭配人 臉解鎖功能。除了可以應用到解鎖功能,蘋果FaceID人臉識別還可以取代以往TouchID指紋識別的功能,包括身份驗證、支付等。在安全性方面,根據(jù)蘋果官方消息,被相同指紋破解Touch ID的概率是五萬分之一,而遭遇相同的面部能破解Face ID的概率則是一百萬分之一,安全性提升20倍。眾多手機廠商在人臉識別的布局,有望引爆人臉識別消費級領域的爆發(fā)。
總而言之,除了政府、安防、公安、金融之外,互聯(lián)網(wǎng) 、消費電子、汽車電子、 零售、醫(yī)療、教育等諸多領域都 在逐步引入人臉識別,人臉識別正在逐步滲透進消費級領域方方面面。
人臉識別群雄逐鹿,巨頭和創(chuàng)業(yè)公司誰能問鼎?
目前從事人臉識別技術的公司包含三類:工業(yè)巨頭、互聯(lián)網(wǎng)巨頭和創(chuàng)業(yè)公司,都已相繼開始布局。Google、Facebook、百度等互聯(lián)網(wǎng)巨頭都在人臉識別產(chǎn)業(yè)鏈不同領域布局,傳統(tǒng)垂直領域廠商如蘋果、???、大華、華為都在研發(fā)技術鞏固自身原有業(yè)務。巨頭發(fā)展的方式為外延和內(nèi)生并行,例如Facebook收購Face.com,蘋果收購PrimeSense。同時也可以看到有曠視、商湯、依圖、云從等創(chuàng)業(yè)公司已經(jīng)發(fā)展壯大成獨角獸。
從終端廠商來看,蘋果、三星、華為、Facebook、谷歌的多項專利顯示,各大終端巨頭都在紛紛布局人臉識別技術。各家科技巨頭主要是采用自研為主,并購為輔的發(fā)展戰(zhàn)略。外延并購的例如蘋果、Facebook等。蘋果在人臉識別的應用專注于手機端,先后收購PolarRose,PrimeSense,PercepTIo,F(xiàn)aceshift,EmoTIent,Turi等人臉識別相關技術公司;Facebook 2012年收購了以色列臉部識別公司Face.com。以下表格總結了國外巨頭公司 近幾年在人臉識別領域及其上下游發(fā)生的外延并購。
近幾年在人臉識別領域及其上下游發(fā)生的外延并購
自研技術方面,谷歌在2012年獲得人臉識別解鎖手機的專利;蘋果獲得相應專利的時間為2015年。在國內(nèi)市場,BAT也在人工智能領域奮力競爭。資本方面,把深度學習算法運用到人臉識別上目前走在最前列的是百度等互聯(lián)網(wǎng)公司。同時,很多創(chuàng)業(yè)型企業(yè)技術也不弱,比如商湯科技(Sense TIme)、曠視科技、依圖科技、云從科技四家獨角獸公司。這些公司無論是從技術上還是從應用能力上都 相對成熟,獲得了資本市場的高度重視。下面對比四家人臉識別獨角獸公司的技術和應用場景。
四家獨角獸公司核心客戶
人臉識別在眾多領域遍地開花已經(jīng)是大勢所趨,四家獨角獸公司在應用方面的布局也有所側重,他們各自憑借先進的技術,在各自擅長的領域進行深度布局,積累了豐富的客戶資源。商湯科技側重在金融、安防、移動互聯(lián)網(wǎng)和手機領域;依圖科技側重在金融、安防、醫(yī)療和交通領域;曠視科技側重在金融、安防、零售、出行等領域;云從科技側重在金融、安防、酒店,以及其他創(chuàng)新領域。
盈利模式從傳統(tǒng)的硬件銷售、軟件按量或按時收費 (SaaS模式/PaaS模式)、軟件技術支持、軟硬件一體化解決方案再到未來可能會 實現(xiàn)的大數(shù)據(jù)變現(xiàn),變現(xiàn)模式多樣。當一個企業(yè)能夠在某個場景中沉淀大量優(yōu)質數(shù)據(jù),并且有足夠的能力挖掘這些數(shù)據(jù)的價值,就擁有了數(shù)據(jù)變現(xiàn)的能力。Google搜索引擎就是其中的例子。圖像和視頻比文字的數(shù)據(jù)量更為龐大,未來擁有數(shù)據(jù)源的公司在數(shù)據(jù)變現(xiàn)方面會有良好的商業(yè)前景。人工智能數(shù)據(jù)源也將會是爭奪熱點。