亞馬遜人臉識(shí)別技術(shù)被質(zhì)疑有種族歧視
與IBM和微軟的同類服務(wù)相比,亞馬遜的面部分析軟件在區(qū)分某些種族的性別時(shí)準(zhǔn)確率較低。這是麻省理工學(xué)院研究人員在近日發(fā)表的一項(xiàng)新研究中得出的結(jié)論,該研究發(fā)現(xiàn),在特定情況下,亞馬遜的人臉識(shí)別技術(shù)Rekognition無法精準(zhǔn)地確定女性和膚色較深面部的性別。
據(jù)外媒新聞。該項(xiàng)研究的聯(lián)合作者稱,在2018年進(jìn)行的實(shí)驗(yàn)中,Rekognition錯(cuò)誤地將19%的女性圖像識(shí)別為男性,將31%的深膚色女性圖像識(shí)別為男性。相比之下,微軟在識(shí)別深色皮膚人群性別時(shí),將女性錯(cuò)認(rèn)為男性的比例只有1.5%。
▲圖自亞馬遜
亞馬遜對(duì)這項(xiàng)研究提出質(zhì)疑。它表示,Rekognition升級(jí)版的內(nèi)測(cè)結(jié)果顯示,該技術(shù)對(duì)于識(shí)別性別的正確率不存在人種差異。此外,亞馬遜認(rèn)為這篇論文沒有清楚地說明在實(shí)驗(yàn)中使用的置信度閾值,即Rekognition的判斷被認(rèn)為是正確而必須達(dá)到的最低精確度。
在向VentureBeat提供的一份聲明中,AWS的深度學(xué)習(xí)和人工智能總經(jīng)理Matt Wood博士區(qū)分了這兩種情況:面部分析指的是在視頻或圖像中辨認(rèn)出臉部,并確定其一般屬性;而面部識(shí)別是將單個(gè)人臉與其它視像中的人臉相匹配。他說,根據(jù)“面部分析”的結(jié)果來判斷“面部識(shí)別”的準(zhǔn)確性是“不可行的”,而且他認(rèn)為這篇論文所談?wù)摰暮?ldquo;客戶如何使用Rekognition”是兩回事。
Wood博士說:“使用最新版本的Rekognition,從議會(huì)網(wǎng)站和Megaface人臉數(shù)據(jù)庫(kù)下載百萬張圖像數(shù)據(jù),我們發(fā)現(xiàn),置信度閾值設(shè)置為0.99時(shí),誤報(bào)數(shù)為零。我們通過錄入和反饋來不斷改進(jìn)這項(xiàng)技術(shù),且支持創(chuàng)建第三方評(píng)估、數(shù)據(jù)集、衡量基準(zhǔn)。”
這是亞馬遜第二次因?yàn)镽ekognition產(chǎn)生的偏見而陷于爭(zhēng)議中。
在今年夏天美國(guó)公民自由聯(lián)盟的測(cè)試中,Rekognition在把25000張罪犯照片與國(guó)會(huì)議員的官方照片進(jìn)行比較時(shí),錯(cuò)誤地將28名國(guó)會(huì)代表視為罪犯,而38%的錯(cuò)誤匹配都是有色人種。
這個(gè)事件并非唯一。
2012年的一項(xiàng)研究表明,來自供應(yīng)商Cognitec的面部算法,在非洲裔美國(guó)人上的錯(cuò)誤比白種人高5%至10%,研究人員在2011年時(shí)發(fā)現(xiàn),在中國(guó),日本和韓國(guó)開發(fā)的面部識(shí)別模型難以區(qū)分白人面孔和那些東亞人。2018年2月,麻省理工學(xué)院媒體實(shí)驗(yàn)室的研究人員發(fā)現(xiàn),微軟,IBM和中國(guó)公司Megvii的面部識(shí)別錯(cuò)誤地識(shí)別了高達(dá)7%的淺膚色女性,高達(dá)12%的深色皮膚男性和高達(dá)35%的深色皮膚女性。
弗吉尼亞大學(xué)的研究人員進(jìn)行的一項(xiàng)獨(dú)立研究發(fā)現(xiàn),兩個(gè)著名的研究圖像集ImSitu和COCO,后者由Facebook,微軟和創(chuàng)業(yè)公司MightyAI共同發(fā)起。在他們對(duì)體育,烹飪的描述中表現(xiàn)出性別偏見,和其他活動(dòng)。(例如,購(gòu)物的圖像與女性有關(guān),而教練則與男性有關(guān)。)
也許最臭名昭著的是,2015年,一位軟件工程師報(bào)告說,Google Photos的圖像分類算法將非裔美國(guó)人視為“大猩猩”。
但是也有令人鼓舞的進(jìn)步跡象。
6月,微軟與人工智能(AI)專家合作,修改并擴(kuò)展了用于訓(xùn)練Face API的數(shù)據(jù)集,這是一個(gè)Microsoft Azure API,提供用于檢測(cè),識(shí)別和分析圖像中人臉的算法。通過膚色,性別和年齡的新數(shù)據(jù),它能夠?qū)⑵つw較深的男性和女性的錯(cuò)誤率分別降低20倍和9倍。
亞馬遜表示,它正在通過AWS機(jī)器學(xué)習(xí)研究基金為研究項(xiàng)目和員工提供資金,不斷致力于提高Rekognition的準(zhǔn)確性,最近一次是通過2018年11月的重大更新。它表示對(duì)建立面部分析和面部識(shí)別的標(biāo)準(zhǔn)化測(cè)試以及與監(jiān)管機(jī)構(gòu)合作指導(dǎo)其使用非常感興趣。
Wood博士補(bǔ)充說:“我們?yōu)檫@一領(lǐng)域的學(xué)術(shù)研究提供了資金,也對(duì)自己的團(tuán)隊(duì)進(jìn)行了大量投資,而且努力還將繼續(xù)。我們致力于改善面部識(shí)別、面部分析,強(qiáng)調(diào)解釋結(jié)果時(shí)有很高的可信度,也會(huì)重點(diǎn)關(guān)注人工審查的作用、標(biāo)準(zhǔn)化測(cè)試等方面。我們感謝為改善這些技術(shù)做出貢獻(xiàn)的客戶和學(xué)者。"
麻省理工學(xué)院的研究結(jié)果計(jì)劃于下周在夏威夷檀香山的“人工智能、倫理和社會(huì)促進(jìn)會(huì)議”上公布。