在談論“人臉識別”的時候,我們指的是什么?
當下,絕大多數互聯網用戶的數據正在被搜集,但基本上是識別型編碼,比如瀏覽器 cookies 或者電郵地址。代表我們在線身份的一切最終都可以轉化為一堆數字和字母,這里面幾乎所有的信息都可以被改變,就好像你隨時可以申請一個新的社保號碼一樣。而臉部數據則完全不同,臉部識別數據和公眾用戶的其他生物數據一樣,改變成本非常高,有時候甚至是不可能的。從某種意義上說,臉部數據是一種我們所有人無法逃脫的“數據鏈路”。
臉部識別技術有許多種。第一種是最初級的,也被稱之為臉部探測,通產用在手機攝像頭上,在拍照時對臉部自動對焦。第二種是臉部分類 (facial characterization),分辨臉部肌理,但是能夠判斷的信息也很有限。其他的臉部識別技術則有著更復雜的使用場景。比如一些軟件使用臉部識別技術進行用戶身份核實,在攝像頭捕捉到確認畫面時激活電腦或是手機。最令公眾產生警覺的,是用來探測未知用戶身份的臉部識別功能——也就是將數據庫中的人臉數據和身份數據匹配。
這并非危言聳聽:去年夏天,Facebook 的人工智能團隊宣布,其人臉識別軟件產品達到了近人類等級的精確度標準。就在上周,Facebook 展示了一項更先進的成果:通過使用另一套不同的算法,通過分析目標的發(fā)型、身姿和體態(tài),在沒有出現臉部圖像的情況下,也能達到 83% 的識別準確率。
這種臉部識別的應用場景才是人們最擔心的,這一點我們在下文討論。
臉部識別的應用場景分兩種:一個是在線上,虛擬世界,比如電腦通過你上傳的用戶圖像識別你的身份;另一個是線下,真實世界,比如系統(tǒng)通過你在街上被監(jiān)視器拍到照片來識別你的身份。隱私專家們之間達成的共識是,目前企業(yè)界在線上使用臉部識別技術的能力大大超越了在線下使用這項技術的水平。比如上文提到 Facebook 的新技術,就專門用于在線圖片的分析,能夠在 97.25% 的識別中準確判斷不同照片中是否出現的是一個人,而人類在同樣的測試中正確率也只有 97.5%。線下方面,盡管科技公司們聲稱臉部識別技術也有成功案例,但實際情況卻并非如此。
不過這種線上和線下的界限并不是很明顯。2014 年來自卡耐基梅隆大學的一位教授通過試驗發(fā)現,對校園內的行人進行拍照并且比對 Facebook 用戶頭像,有三分之一的人能夠被臉部識別技術探測出來。不僅如此,他還成功地使用算法對這部分人群的興趣甚至社保號碼進行了預測。換句話說,在線下,已經有人實現了 33% 的臉部識別準確率。
分歧:用戶是否需要事先對臉部識別進行授權?
2014 年,美國商務部組織了一次會議,邀請各方代表探討如何監(jiān)管臉部識別技術,出席會議的有美國政府負責制定科技政策的部門,還有來自消費者隱私保護組織和科技產業(yè)的代表。雖然這個會議仍舊在舉辦,但需要指出的是,消費者保護組織已經不在了。美國消費者聯盟和用戶隱私保護團體 EFF 今年六月宣布退出,他們表示,科技行業(yè)的公司和說客們,堅決不承認用戶需要事先對臉部識別軟件進行授權的權利,所以繼續(xù)參加此次會議,已經毫無意義。
“假設現在有一個人在大街上走,與這個人沒有關系的一個組織,如果想要識別他的身份,難道不應該首先獲取他的同意嗎?”喬治城大學隱私和科技中心 (Georgetown Center on Privacy and Technology) 執(zhí)行總監(jiān)阿瓦羅 (Alvaro Bedoya) 一針見血地指出。阿瓦羅是本次會議中消費者隱私保護一方的意見領袖,他提出的問題也是消費者保護團體退出會議的根本原因。他還表示,科技行業(yè)不愿意承認用戶要對技術行為進行事先授權。
政府機構發(fā)言人對筆者表示,對于會議分崩離析“很失望”。代表科技行業(yè)參會的某科技公司高管則表示,他認為在許多情況下用戶授權是不需要的。
就目前的實際情況來看,科技公司之間對于用戶是否應該在被臉部識別之前對系統(tǒng)進行授權這一點,也存在分歧。Facebook 的新 App 應用需要用戶額外操作,才能避免被掃描進入臉部數據,這意味著其默認是允許的。而微軟公司則向筆者表示,他們在對用戶進行臉部掃描之前,會要求用戶給出授權許可。而 Google 表示在消費者照片產品上完全不使用臉部識別技術,而是做“臉部數據簇” (face clustering),也就是在手機或電腦的本地將類似的臉部圖像進行分組。用戶也可以關掉這一功能。2013 年該公司迫于壓力禁止在 Google Glass 上發(fā)布臉部識別 App 應用。
誰會擁有我們的“臉”?
從公開報道來看,消費者隱私保護組織和科技行業(yè)代表的分歧,是用戶授權。那么臉部識別軟件的政府監(jiān)管,將如何進行?在臉部識別技術準確率非常之高的情況下,究竟是誰在掌握著我們的臉部數據?
那么政府又在其中扮演著怎樣的角色?目前美國政府的臉部識別數據庫已經有 5200 萬條數據,占全美人口的三分之一。盡管這個數字已經很龐大,但是仍舊落后于公司收集的用戶臉部數據。
用戶隱私保護團體 EFF 在退出大會的聲明中,提出了商業(yè)資源和政府資源的合作問題:“幾年前,在一次信息自由法案 (FOIA) 主張的調閱中,我們發(fā)現美國聯邦機構對社交媒體公司 (如 Facebook) 發(fā)布的搜查令包括用戶上傳的所有圖片,也包括用戶被標簽的其他人上傳的圖片。未來我們將會看到政府機構試圖獲取用戶臉部識別數據的情況。”