人臉值多少錢?人臉識別灰色產(chǎn)業(yè)鏈
如今,數(shù)十家初創(chuàng)企業(yè)和科技巨頭正在向酒店、零售店、甚至學(xué)校和夏令營銷售人臉識別服務(wù)。這一業(yè)務(wù)的興盛歸功于新算法,現(xiàn)在的算法在辨認(rèn)人臉方面比五年前的更精確。
為了改進(jìn)這些算法,公司會對它們進(jìn)行數(shù)十億張人臉辨認(rèn)的訓(xùn)練,而這個(gè)訓(xùn)練通常不需要征得任何人的同意。你的臉很有可能就是這些公司使用的“培訓(xùn)樣本”之一,或者說是公司客戶數(shù)據(jù)庫的一部分。
目前,面部識別軟件的使用幾乎不受法律限制,這就意味著人們可能無法阻止公司以這種方式使用他們的面部信息。
2018年,乘客們匆匆走過華盛頓特區(qū)附近的捷威機(jī)場時(shí),被一架攝像機(jī)捕捉了下來。
實(shí)際上,捷威機(jī)場和乘客都不是真實(shí)存在的;這僅僅是NIST展示如何實(shí)操收集人臉的一套裝置。這些人臉將在NIST舉辦的競賽上使用,該競賽邀請全球各地的公司來測試他們的面部識別軟件。
在這次演習(xí)中,志愿者們允許負(fù)責(zé)機(jī)構(gòu)使用他們的面部信息。這是早期進(jìn)行面部識別方式—;—;研究人員煞費(fèi)苦心地爭取人們的同意,將收集的人臉納入他們的數(shù)據(jù)庫當(dāng)中。
如今,公司已經(jīng)成為人臉識別領(lǐng)域的佼佼者,他們?nèi)绻J(rèn)為向海量被識別者征求同意是一件麻煩事,他們可能就不會再多此一舉了。
包括Kairos在內(nèi)的行業(yè)領(lǐng)軍企業(yè)正在人臉識別軟件市場展開競爭。他們的客戶群體涉及執(zhí)法人員、零售商、甚至高中學(xué)生。
MRFR的數(shù)據(jù)顯示,這個(gè)市場的規(guī)模每年增長20%,預(yù)計(jì)到2022年將達(dá)到每年90億美元的規(guī)模。
在制作最佳軟件的這場角逐中,獲勝者將是那些算法能夠高精度地識別面部,不會產(chǎn)生誤報(bào)的公司。與人工智能的其他領(lǐng)域一樣,創(chuàng)建最佳面部識別算法意味著要收集大量面部數(shù)據(jù)來完成訓(xùn)練。
雖然公司可以使用政府和大學(xué)編制的數(shù)據(jù)集合,如耶魯大學(xué)的人臉數(shù)據(jù)庫,但這些數(shù)據(jù)集相對較小,包含的人臉不超過幾千張。
這些官方數(shù)據(jù)集還有其他限制,其中許多缺乏種族多樣性,或者無法辨認(rèn)出改變現(xiàn)實(shí)人臉的條件,比如陰影、帽子或妝容。
為了建立能夠在實(shí)戰(zhàn)中辨認(rèn)出個(gè)體面部的識別技術(shù),公司需要更多的圖像來做實(shí)驗(yàn)。
面部識別軟件公司FaceFirst位于加利福尼亞,他們公司幫助零售商辨別犯罪分子,防止他們進(jìn)入商店。
公司的首席執(zhí)行官Peter Trepp說道,“數(shù)百張不夠,數(shù)千張還不夠。你需要數(shù)百萬張圖片。如果你沒有將戴眼鏡的人或有色人種收錄進(jìn)數(shù)據(jù)庫,你將得不到準(zhǔn)確的結(jié)果?!?/p>
故事要從一個(gè)APP說起
軟件公司從那些途徑可以獲得數(shù)百萬張圖像來訓(xùn)練軟件呢?
其中之一便是警局的圖片數(shù)據(jù)庫。軟件公司可以在州政府機(jī)構(gòu)公開獲得這些數(shù)據(jù)庫,也可以從私人公司進(jìn)行購買。Vigilant Solutions公司就提供1500萬張面孔,可以用來“解決”人臉識別軟件訓(xùn)練的難題。
然而,一些初創(chuàng)公司已經(jīng)找到了更好的面孔來源:個(gè)人相冊應(yīng)用。
這些應(yīng)用程序可以編輯存儲在個(gè)人手機(jī)上的照片,而且通常都包含同一個(gè)人的擺出多種姿勢和身處不同情境圖像,這可是豐富的訓(xùn)練數(shù)據(jù)源。
Ever AI的首席執(zhí)行官Doug Aley說道:“我們有同一個(gè)人身處數(shù)千種不同的場景的圖象。即便是戴著帽子站在陰影中,你也能準(zhǔn)確地辨認(rèn)出來?!?/p>
Ever AI是舊金山一家面部識別初創(chuàng)公司,于2012年以EverRoll為名成立,公司的應(yīng)用程序幫助用戶管理日益膨脹的照片收藏。
目前,Ever AI已經(jīng)從Khosla Ventures以及其他硅谷風(fēng)險(xiǎn)投資公司籌集了2900萬美元,參加了NIST最近舉行的面部識別競賽,并在比賽的“Mugshots”類別中排名第二。在“Faces in the Wild”類別中排名第三。
Aley認(rèn)為,自己公司龐大的照片數(shù)據(jù)庫取得了成功,Ever AI數(shù)據(jù)庫的圖片數(shù)量估計(jì)達(dá)到130億張。
早期,Ever AI僅僅是一個(gè)照片應(yīng)用程序,當(dāng)時(shí),這家公司激進(jìn)的營銷舉措引發(fā)了爭議,導(dǎo)致Apple在2016年暫時(shí)從App Store暫時(shí)下架了EverRoll。
最讓人記憶深刻的大概是,該應(yīng)用程序誘使用戶向所有手機(jī)聯(lián)系人發(fā)送促銷鏈接。用戶還指責(zé)該應(yīng)用程序竊取了他們的信息。
2015年,德克薩斯州的Greg Miller在Facebook上吐槽:“EverRoll程序安裝后的第一件事就是收集你手機(jī)里的電話號碼,并立即給所有人發(fā)消息。然后,你所有的照片就會被放到云端?!?/p>
四年后,Miller驚愕地發(fā)現(xiàn),EverRoll仍然保存著他的照片,只不過現(xiàn)在它已成為面部識別公司。
“我當(dāng)時(shí)并沒有意識到這個(gè)問題,我一點(diǎn)也不同意他們的做法?!盡iller告訴《財(cái)富》,“一直被追蹤才是關(guān)鍵所在,我感覺毫無隱私可言,真是細(xì)思極恐?!?/p>
Ever AI首席執(zhí)行官Aley聲稱,該公司不會共享個(gè)人的識別信息,只會使用這些照片來訓(xùn)練公司的面部識別軟件。他還補(bǔ)充說,自己的公司類似于社交媒體,人們可以選擇退出。
Aley否認(rèn)Ever AI從一開始就打算成為一家面部識別公司,并表示公司現(xiàn)在關(guān)閉照片應(yīng)用程序是一項(xiàng)商業(yè)決定。
目前,Ever AI的客戶將該公司的人臉識別產(chǎn)品用于一系列活動,包括企業(yè)ID管理,零售,電信和執(zhí)法。
EverRoll并不是唯一提供用戶照片的公司,另一個(gè)例子是Orbeus。這家位于舊金山的公司,于2016年被亞馬遜悄然收購,曾經(jīng)是PhotoTime的組織者。
Orbeus的老員工透露,該公司的人工智能技術(shù)以及擁有的大量照片,使其成為一個(gè)誘人的收購目標(biāo)。這位拒絕透露身份的員工表示:“亞馬遜當(dāng)時(shí)正在尋找這種公司?!?/p>
今天,PhotoTime應(yīng)用程序已不復(fù)存在,盡管亞馬遜繼續(xù)銷售另一款名為Rekognition的Orbeus產(chǎn)品。這個(gè)產(chǎn)品是執(zhí)法機(jī)構(gòu)和其他組織使用的一種面部識別軟件。
亞馬遜拒絕提供將Orbeus收集的照片用于訓(xùn)練軟件的詳細(xì)信息,僅表明公司從各種來源獲取AI項(xiàng)目的數(shù)據(jù)。亞馬遜還補(bǔ)充說,它沒有使用客戶的照片服務(wù)來訓(xùn)練其算法。
另一家使用用戶照片來訓(xùn)練面部識別算法的公司是Real Networks。這家公司總部位于西雅圖,曾因其20世紀(jì)90年代的在線視頻播放器而聞名。
如今,這家公司專注于可以識別學(xué)校兒童面孔的軟件。與此同時(shí),它開發(fā)了一款針對家庭的智能手機(jī)應(yīng)用程序,名叫RealTimes。
然而,一位評論家表示這只是公司為獲取面部信息而找的借口。
所有這些都引發(fā)了一些問題:公司應(yīng)采取什么措施來保護(hù)他們收集的面部數(shù)據(jù)?政府是否要加大監(jiān)管力度?
隨著面部識別傳播到更多社會領(lǐng)域,解決這些問題將變得迫在眉睫。
橫跨教育和零售領(lǐng)域
面部識別軟件并不是新鮮事物,該技術(shù)早在20世紀(jì)80年代就已出現(xiàn)。當(dāng)時(shí)美國數(shù)學(xué)家將人臉定義為一系列數(shù)值,并使用概率模型來找到匹配目標(biāo)。
但在過去的幾年里,情況發(fā)生了變化。NIST的Grother說:“面部識別正在經(jīng)歷一場革命。”
他補(bǔ)充說:“基礎(chǔ)技術(shù)已發(fā)生變化。舊技術(shù)已經(jīng)被新一代算法取代,新技術(shù)非常高效?!?/p>
面部識別的這場革命得益于兩個(gè)因素,而這些因素正在讓人工智能領(lǐng)域變得更加廣泛。
第一個(gè)是新興的深度學(xué)習(xí)科學(xué),這是一種類似于人類大腦的模式識別系統(tǒng)。第二個(gè)是前所未有的大量數(shù)據(jù),可以借助云計(jì)算實(shí)現(xiàn)低成本存儲和解析。
不出所料,第一批充分利用這些新技術(shù)的公司是Google和Facebook。
2014年,F(xiàn)acebook推出了一個(gè)名為DeepFace的程序,該程序能夠辨別兩張面孔是否屬于同一個(gè)人,準(zhǔn)確率高達(dá)97.25% 。這個(gè)比率與人類在同一測試中得分相同。
一年后,Google憑借FaceNet計(jì)劃獲得了100%的準(zhǔn)確率。
如今,像微軟這樣的公司和其他科技巨頭都是面部識別的領(lǐng)軍者,這在很大程度上取決于他們可以訪問大型面部數(shù)據(jù)庫。
不過,越來越多的初創(chuàng)公司也在發(fā)布高精度分?jǐn)?shù),因?yàn)樗麄円谌找姘l(fā)展的面部識別市場中尋求利基。
市場研究公司PitchBook表示,硅谷一直在向該領(lǐng)域進(jìn)軍。該公司的數(shù)據(jù)顯示,人臉識別市場在過去三年的平均投資額為7870萬美元。
在硅谷,這并不是一個(gè)令人心儀的數(shù)字,但它反映了風(fēng)險(xiǎn)資本家的一個(gè)重要賭注,也就是說,至少有少數(shù)面部識別創(chuàng)業(yè)公司會發(fā)展成大企業(yè)。
面部識別公司的商業(yè)模式仍在不斷擴(kuò)大
Crunchbase的數(shù)據(jù)顯示,Ever AI和FaceFirst等創(chuàng)業(yè)公司的年收入在200萬美元到800萬美元的區(qū)間浮動,收益相對較小。與此同時(shí),亞馬遜和其他科技巨頭尚未透露他們的收入中有多少來自面部識別。
多年來,面部識別最狂熱的付費(fèi)客戶一直是執(zhí)法機(jī)構(gòu)。然而,最近,包括沃爾瑪在內(nèi),越來越多的商業(yè)組織使用這種軟件來識別和了解他們的客戶。
情況確實(shí)如此,F(xiàn)aceFirst向包括商店和藥店在內(nèi)的數(shù)百家零售商銷售面部識別軟件。
該公司的首席執(zhí)行官Trepp表示,他的大部分客戶都使用這項(xiàng)技術(shù)來辨認(rèn)進(jìn)入他們商店的罪犯,但越來越多的零售商也在測試其他項(xiàng)目,例如識別VIP客戶或識別員工。
據(jù)報(bào)道,亞馬遜這家零售巨頭除了向警察局出售產(chǎn)品外,還與酒店合作,幫助酒店加快辦理入住手續(xù)。
然而,亞馬遜的這些舉措并非沒有爭議。
去年7月,美國公民自由聯(lián)盟(ACLU)對亞馬遜的軟件進(jìn)行了測試,將每一位國會議員的臉與收錄重罪罪犯的數(shù)據(jù)庫進(jìn)行比對,結(jié)果該測試導(dǎo)致了28個(gè)誤報(bào),其中大多數(shù)為有色國會議員。
作為回應(yīng),ACLU呼吁禁止執(zhí)法部門使用面部識別技術(shù)。
亞馬遜的員工也向公司施壓,要求其證明向警察部門、美國移民和海關(guān)執(zhí)法部門出售軟件的正當(dāng)性。
一些國會議員,包括眾議員Rep. Jerrold Nadler和參議員Sen. Ron Wyden已經(jīng)要求政府問責(zé)局調(diào)查面部識別軟件的使用。
企業(yè)領(lǐng)導(dǎo)者也對該技術(shù)的應(yīng)用感到不安,其中包括微軟總裁 Brad Smith,他在去年12月呼吁政府進(jìn)行監(jiān)管。
不過,盡管人們的擔(dān)憂不斷加劇,但隨著企業(yè)找到新的、新穎的應(yīng)用來銷售面部識別技術(shù),它的應(yīng)用正在擴(kuò)大。
化妝以及燈光都不會影響人臉識別
家庭照片應(yīng)用程序的開發(fā)商Real Networks正在向全國各地的K-12學(xué)校免費(fèi)提供面部識別軟件。該公司表示,現(xiàn)在有數(shù)百所學(xué)校正在使用它。
在接受《連線》雜志采訪時(shí),該公司首席執(zhí)行官Rob Glaser表示,他發(fā)起這一倡議的初衷是為了解決有關(guān)學(xué)校安全和槍支管控的爭論,而非黨派之爭。
Real Networks并不是唯一專注于兒童面部識別產(chǎn)品的公司。
德克薩斯州一家名為Waldo的公司正在向數(shù)百所學(xué)校、兒童體育聯(lián)盟和夏令營提供面部識別技術(shù)。實(shí)際上,這項(xiàng)技術(shù)需要使用Waldo的軟件來掃描攝像機(jī)或官方攝影師拍攝的圖像,然后將孩子的臉與父母提供的圖像進(jìn)行匹配。那些不想?yún)⒓拥募议L可以選擇退出。
該服務(wù)目前在美國30多個(gè)州開展。Waldo和FaceFirst的發(fā)展表明,企業(yè)正在將人臉識別平?;?。
不久前,人臉識別還只是科幻小說中的內(nèi)容,現(xiàn)在,這項(xiàng)技術(shù)已經(jīng)擴(kuò)散到美國經(jīng)濟(jì)的更多領(lǐng)域。
你的面部信息該何去何從
盡管人們對人臉識別的擔(dān)憂主要集中在政府機(jī)構(gòu)的使用上,但私人公司甚至個(gè)人對人臉識別的使用卻帶來了更為明顯的隱私風(fēng)險(xiǎn)。
越來越多的公司開始銷售面部識別技術(shù),我們的面孔也會在越來越多地出現(xiàn)在數(shù)據(jù)庫中,這種軟件可能會受到偷窺者和跟蹤者的歡迎。
商人和房東也可以用它來識別不速之客,并悄悄地停止提供住房或服務(wù)。
黑客入侵的風(fēng)險(xiǎn)也同樣存在
網(wǎng)絡(luò)安全公司Gemini Advisors的Andrei Barysevich說,他看到印度國家生物識別數(shù)據(jù)庫的個(gè)人資料被盜,在“黑暗網(wǎng)絡(luò)”網(wǎng)站上出售。
目前,他還沒有看到出售的美國人臉數(shù)據(jù)庫,但他補(bǔ)充說:“這只是時(shí)間問題?!睆木频昊蛄闶凵淌种型等☆櫩兔娌啃畔ⅲ赡軙椭缸锓肿訉?shí)施欺詐或身份盜竊。
由于該技術(shù)幾乎沒有政府監(jiān)管,因此限制其濫用的最佳希望可能在于軟件制造商本身。
在接受《財(cái)富》采訪時(shí),面部識別初創(chuàng)公司的首席執(zhí)行官們都表示,他們非常關(guān)注隱私風(fēng)險(xiǎn)。包括FaceFirst首席執(zhí)行官在內(nèi)的一些人士指出,人臉識別系統(tǒng)的廣泛應(yīng)用值得警惕。
Waldo的首席執(zhí)行官Rice還擔(dān)心,立法人員制定使用面部技術(shù)的規(guī)則可能弊大于利。他說:“把嬰兒和洗澡水一起潑出去,制定一系列瘋狂的規(guī)定,這將是一種諷刺?!?/p>
與此同時(shí),一些制作人臉識別軟件的公司正在使用新技術(shù),這可能會減少訓(xùn)練算法對大量人臉的需求。
邁阿密面部識別初創(chuàng)公司Kairos就是這樣一個(gè)例子。
據(jù)Kairos首席安全官Stephen Moore稱,公司正致力于“合成”面孔數(shù)據(jù),以復(fù)制各種面部表情和光照條件。他說,這些“人造臉”意味著公司不用依靠太多真實(shí)人臉也能制造人臉識別軟件產(chǎn)品。
對購買軟件的客戶進(jìn)行監(jiān)管、提高數(shù)據(jù)的安全性以及合成訓(xùn)練樣本,這些措施都可以讓我們的擔(dān)憂有所減輕。
FaceFirst的Trepp認(rèn)為,隨著我們越來越熟悉這項(xiàng)技術(shù),對它的焦慮也會減弱。他甚至認(rèn)為,2002年的科幻電影《少數(shù)派報(bào)告》中的面部識別場景將變得很常見。
ACLU以及其他組織則不那么樂觀。
盡管這項(xiàng)技術(shù)引起的爭議越來越大,但目前幾乎沒有任何法律來限制面部信息的使用,除了伊利諾斯州、德克薩斯州和華盛頓州。
在這三個(gè)地方使用人臉信息需要征求同意。雖然這些法律尚未真正經(jīng)過測試,但在伊利諾伊州,人們可以通過訴訟來強(qiáng)制執(zhí)行該權(quán)利。
2017年,F(xiàn)acebook和Google進(jìn)行了一次不成功的游說活動,試圖說服伊利諾伊州立法者淡化法律。
其他州也在考慮自己的生物識別法。然而在聯(lián)邦一級,立法者迄今為止很少關(guān)注此事。
但情況很快就會有所轉(zhuǎn)變。
參議員Brian Schatz和Roy Blount已提出了一項(xiàng)法案,要求軟件公司獲得許可之后才能在公共場所使用面部識別,或是與第三方共享面部數(shù)據(jù)。