交大教授訓練機器通過面部識別罪犯準確率達到86%以上

時間：2020-08-19 08:30:02

關(guān)鍵字：人工智能人臉識別

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀] 　　上海交通大學的武筱林教授和他的博士生張熙近期完成了一項研究，他們發(fā)現(xiàn)，通過學習，機器可以通過照片分辨出誰是罪犯，誰是守法公民，識別準確率在86%以上。　　這篇論文題為《基于面部圖像

　　上海交通大學的武筱林教授和他的博士生張熙近期完成了一項研究，他們發(fā)現(xiàn)，通過學習，機器可以通過照片分辨出誰是罪犯，誰是守法公民，識別準確率在86%以上。

　　這篇論文題為《基于面部圖像的自動犯罪概率推斷》(Automated Inference on Criminality using Face Images)，目前上傳在預(yù)印本網(wǎng)站arXiv上。他們運用計算機視覺和機器學習技術(shù)檢測1856張中國成年男子面部照片，其中將近一半是已經(jīng)定罪的罪犯。實驗結(jié)果顯示，通過機器學習，分類器可以以較高概率區(qū)分罪犯與非罪犯這兩個群體的照片。特別是在內(nèi)眼角間距、上唇曲率和鼻唇角角度這三個測度上，罪犯和非罪犯存在較為顯著的差距。平均來講，罪犯的內(nèi)眼角間距要比普通人短5.6%，上唇曲率大23.4%，鼻唇角角度小19.6%。同時，他們發(fā)現(xiàn)罪犯間的面部特征差異要比非罪犯大。

　　從古至今，從西方到東方，我們都能看到類似于“相由心生”的說法。但不論是相士或是從事相應(yīng)研究的心理學家，都始終擺脫不了“迷信”或“歧視”的帽子。武筱林和張熙出于好奇，試圖利用數(shù)據(jù)分析推翻這門古老的“偽科學”，但研究出來的結(jié)果令他們大吃一驚。更令他們始料未及的是，文章一經(jīng)公開，就招來了漫天爭議。

　　武筱林11月30日告訴澎湃新聞，他收到了很多郵件，雖然絕大部分是國際上的研究者來信索取數(shù)據(jù)和實驗細節(jié)，進行學術(shù)層面的交流，但也有不少不友好的評論，甚至指責他的研究是對社會“不負責任”。

　　武筱林

　　“我們的運氣也不好，文章剛出來的時候正好是特朗普當選前后。有來自美國的郵件說，‘美國現(xiàn)在已經(jīng)一團糟了，你們就別添亂了’。 ”也有人直接建議武筱林撤稿。對于被貼上“歧視”的標簽，武筱林有些惱火，他強調(diào)，他個人的價值觀絕對是反歧視的，而他做這個研究的原本目的是證偽。

　　此外，他也收到了一些令人哭笑不得的評論，比如有的網(wǎng)友想讓他把這個東西交給紀檢委使用。

　　武筱林告訴澎湃新聞，他目前還是打算專心把這個工作進一步做得更嚴謹、更充分，這項研究的成熟程度離應(yīng)用還很遙遠，他們目前也沒有任何走向應(yīng)用的打算。

　　“從另一個角度講，我們的研究也可能為反歧視提供依據(jù)”。但他也坦言，人工智能研究應(yīng)如何劃定價值倫理的禁區(qū)，是個很嚴肅的問題，光憑他個人難以回答。

　　“現(xiàn)在世界范圍里都存在這樣的爭論，人工智能已經(jīng)發(fā)展到這一步了。”

　　那么，武筱林和張熙的這項研究，到底是怎么進行的呢? 　　通過學習，機器辨認出罪犯照片的準確率在86%以上

　　實驗選取了1856張中國18到55歲男性的照片，面部無毛發(fā)遮擋、無傷疤或其他標記，并將它們歸為罪犯組和非罪犯組。非罪犯組包含1126張用“網(wǎng)頁蜘蛛”從互聯(lián)網(wǎng)上抓取的照片，人群來自社會各行各業(yè)：服務(wù)員、建筑工人、司機、醫(yī)生、律師、教授等。罪犯組共730張照片，其中330張來自公安部或省級公安廳的通緝令，400張由一所與實驗組達成保密協(xié)議的公安局提供。在這730名罪犯中，235名涉及暴力犯罪，包括謀殺、強奸、人身侵犯、綁架和搶劫，其余則犯下了偷竊、欺詐、貪污等非暴力罪行。所有照片都被調(diào)整為80cmX80cm大小，并對亮度和灰比都進行了控制，盡量避免對結(jié)果造成影響。

　　研究使用的照片樣本。a組為罪犯，b組為非罪犯。

　　實驗用4種分類器(邏輯回歸，KNN,SVM,CNN)對樣本進行檢測，發(fā)現(xiàn)它們都能較成功地對罪犯和非罪犯組進行分類，準確率在86%以上。

　　4種分類器的準確率。

　　武筱林和張熙進一步發(fā)現(xiàn)，罪犯和非罪犯在面部特征方面最顯著的差別在內(nèi)眼角間距、上唇曲率和鼻唇角角度這三個測度上。平均來講，罪犯的內(nèi)眼角間距要比普通人短5.6%，上唇曲率大23.4%，鼻唇角角度小19.6%。

　　圖b標注了存在差異性的3個特征點。表4為罪犯組和非罪犯組在3個特征點上的平均值和偏離值。

　　最后，他們發(fā)現(xiàn)計算機模擬出來的罪犯和非罪犯的“平均臉”比較相似，但罪犯間的面部特征差異要比非罪犯大。也就是，非罪犯群體間彼此長得更為相似，變化幅度更小。

　　圖c為模擬出來的罪犯“平均臉”。圖d為非罪犯“平均臉”。

　　“顱相學”、“天生犯罪人”：沉睡2個世紀的研究

　　許多研究者一看到武筱林的研究成果，就立馬聯(lián)想到了西方18、19世紀一度盛行的“顱相學”和“天生犯罪人”理論。

　　1870年，意大利監(jiān)獄醫(yī)生龍勃羅梭打開了意大利著名土匪頭子維萊拉尸體的頭顱，發(fā)現(xiàn)其頭顱枕骨部位有一個明顯的凹陷處，它的位置如同低等動物一樣。這一發(fā)現(xiàn)觸發(fā)了他的靈感，他由此提出“天生犯罪人”理論，認為犯罪人在體格方面異于非犯罪人，并認為犯罪人是一種返祖現(xiàn)象，具有許多低級原始人的特性。同時，他認為犯罪具有遺傳性。

　　龍勃羅梭的理論帶有很大的歧視性色彩，一經(jīng)發(fā)表就遭到各方抨擊。此外，由于龍勃羅梭的研究缺乏數(shù)據(jù)支持，也一直被當作偽科學對待。

　　龍勃羅梭《犯罪人論》。

　　此后，反歧視的價值倫理在西方社會得到了進一步發(fā)展，關(guān)于外表和犯罪性的研究也逐漸沉寂。直到2011年，美國康奈爾大學的一個心理學研究團隊發(fā)現(xiàn)人們僅通過觀察一個人的照片判斷他是不是罪犯的成功率相當高。

　　“我也認真讀過2011年他們的研究”，武筱林說道，“但他們采取的是傳統(tǒng)心理學的試驗方法。MIT Technology Review說，我們是在這個研究方向走出了新的一步，用數(shù)據(jù)說話。”

　　原本打算證偽，第一反應(yīng)很吃驚

　　關(guān)于“顱相學”和“天生犯罪人”理論，武筱林坦言，“不管是從主流科學界的觀點，還是從我個人的價值觀、個人的直覺，我一開始都覺得這是不靠譜的。”而他認為，像康奈爾大學的心理學家們那樣采用傳統(tǒng)實驗方法，以人為試驗者，不可避免帶有主觀偏見，也會出現(xiàn)生理上的疲勞，因此他想到運用計算機進行數(shù)據(jù)分析，在定量層面上進行證偽。

　　但出來這樣的結(jié)果，武筱林感到很吃驚。他們早在一年前就取得了結(jié)果，但遲遲不肯發(fā)表，而是反復(fù)交叉驗證，但始終沒有推翻原始的結(jié)論。

　　比如，在他們11月21日上傳的第二版論文里，他們就作了一些修改。由于有人提出，罪犯的照片是由警察提供的，而警察使用的照相機可能在信號上與其它相機不同，他們故意在照片的光學信號上加了很多噪音，以淹沒不同相機信號上的差異。但之前的結(jié)論依然成立，分類器仍有75%以上的準確率。此外，他們特地重新核實了犯罪者照片的拍攝情況，證實都是普通證件照片，而非被捕后拍攝的。

　　“所有算法出來的結(jié)果都相當一致，從技術(shù)層面來講可靠性很高。”

　　“我是來敦促你撤稿的”

　　外表與犯罪性的關(guān)聯(lián)研究似乎是個潘多拉魔盒，在沉睡了200多年后打開，一樣會遭受紛至沓來的批評。

　　此前，武筱林也曾向媒體展示了幾封他收到的措辭強硬的郵件。

　　一名留學在外的上海交大校友寫到，“我建議你撤銷這篇論文，并且上傳一封公告，為不恰當?shù)难芯糠椒ㄖ虑浮?rdquo;理由是“這篇論文充滿了極度的歧視和強烈的誤導(dǎo)。我們?nèi)斯ぶ悄茴I(lǐng)域的研究者不應(yīng)當濫用技術(shù)，去做一些違反倫理的事情”。

　　這名來信者還特別強調(diào)：“這篇論文給上海交大的聲譽帶來了很糟糕的影響。這對那些申請美國高校的上海交大學子來說，將會是一場災(zāi)難。”

　　另一封信則來自美國康奈爾大學的科研同行：“我是來敦促你撤稿的，因為這是一項可恥的工作。我們無法選擇自己的唇部弧度、眼間距和所謂的鼻唇角角度。但犯罪者的問題在于行為，而不是長相。”

　　外網(wǎng)上也有一些不友好的聲音。Hacker News的一位用戶說道，“我看摘要的時候還以為這是在開玩笑，讀下去竟然是篇認真的論文。不過這種研究需要犯罪學、心理學和機器學習方面的專家，而不是隨便兩個懂Keras的人。”

　　有些數(shù)據(jù)隱私方面的專家也指出，“從這么小的數(shù)據(jù)樣本里得到這么普遍性的結(jié)論，會給廣大無辜群眾帶來大麻煩的。”

　　國際隱私保護組織的Richard Tynan博士認為，“作為一個個體，你不可能知道機器是怎么給你下定論的。在小數(shù)據(jù)集上，算法、人工智能和機器學習可能會建立起專斷荒唐的相關(guān)性。這不是機器的錯，把復(fù)雜系統(tǒng)運用在不合適的地方是很危險的。”

　　“我們的研究也可以是反相貌歧視的依據(jù)”

　　對于被貼上各種不友好的標簽，武筱林感到有些惱火。他講道，“我個人價值觀其實是反歧視的。比如有些招工廣告公開要求容貌姣好，我是非常反對的。”

　　同時，他強調(diào)在科學上相關(guān)和因果是兩回事。“罪犯趨向有這些臉部特征，也只能說兩者之間有相關(guān)性，并沒有說明里面存在因果關(guān)系。不是說長得一樣就是犯罪，不是說天生一張犯罪臉。”

　　“我們只是發(fā)現(xiàn)了統(tǒng)計上容貌和有些社會行為之間存在相關(guān)性。我們不關(guān)心也不可能去討論里面的因果邏輯——也許有，也許沒有——但我們不是這方面的專家，沒有這方面的知識、訓練、經(jīng)驗去做這個事情。”

　　從因果上來講，也可能有這樣一種解釋：因為有些人長得異樣，可能受到歧視和排擠，更容易走上犯罪道路。“所以我們的研究也可以是反相貌歧視的依據(jù)”。

　　“核物理學家該為原子彈造成的傷害負責嗎?”

　　但當澎湃新聞問及該如何看待社會倫理價值和科研之間的關(guān)系時，武筱林坦言這個問題很嚴肅也很復(fù)雜，他個人也難以回答。

　　“為了人類社會更高的利益，是不是科學家要自律一點，而不是說求知求真者無罪，這個爭議在世界范圍內(nèi)已經(jīng)開始了，人工智能已經(jīng)到這一步了。是不是就會有一些禁區(qū)，研究者不能去碰它，坦白講我不知道。”

　　“核物理學家該為原子彈造成的傷害負責嗎?”這是武筱林拋回給澎湃新聞的疑問。

　　目前，武筱林不想受到一些非理性的討論的干擾。他還在緊張地完善這個實驗，因為批評者主要指出他們的樣本量不夠。“我們用的是深度學習，深度學習現(xiàn)在也很時髦，比如谷歌(微博)的阿爾法GO，它需要大量的樣本數(shù)據(jù)。由于隱私問題，我們的數(shù)據(jù)還是不夠大，盡管在已經(jīng)發(fā)表的文章里已經(jīng)算很大了，但對深度學習來講還是不夠的。”

　　在經(jīng)過完善后，他們計劃將文章投到計算機視覺領(lǐng)域的頂級國際會議上去，并投向《自然》、《科學》這樣的頂級學術(shù)期刊。但現(xiàn)在武筱林也在擔心，公眾輿論是否會影響到學術(shù)界對他們研究成果的接受程度。

　　他期待能有更多在學術(shù)上理性交流的聲音，哪怕是用數(shù)據(jù)推翻他們的結(jié)論。武筱林透露，這個領(lǐng)域有很大的拓展空間，目前有一些國際上的同行在做類似的題目，這也是他們提前將文章放上arXiv的原因，以保護優(yōu)先權(quán)。

　　“大眾積極的關(guān)注對我們的方向是好事，但不能誤判誤讀。我們的研究沒有得到任何私人或者司法部門的支持，也沒有任何的商業(yè)目的。”