亞馬遜圖像識別技術(shù)無法可靠地辨別女性和深膚色人群
近日麻省理工學(xué)院(MIT)研究人員發(fā)表一項新研究中得出的結(jié)論,該研究發(fā)現(xiàn),在特定情況下,Rekognition(亞馬遜圖像識別技術(shù))無法可靠地辨別女性和深膚色人群。RekogniTIon錯誤地將19%的女性圖像識別為男性,將31%的深膚色女性圖像識別為男性。相比之下,微軟在識別深色皮膚人群性別時,將女性錯認(rèn)為男性的比例只有1.5%。
與IBM、微軟的同類技術(shù)相比,亞馬遜的人臉分析軟件分辨某些人種性別的正確率較低。這是麻省理工學(xué)院(MIT)研究人員在近日發(fā)表的一項新研究中得出的結(jié)論,該研究發(fā)現(xiàn),在特定情況下,RekogniTIon(亞馬遜圖像識別技術(shù))無法可靠地辨別女性和深膚色人群。
該項研究的合著者稱,在2018年進(jìn)行的實驗中,RekogniTIon錯誤地將19%的女性圖像識別為男性,將31%的深膚色女性圖像識別為男性。相比之下,微軟在識別深色皮膚人群性別時,將女性錯認(rèn)為男性的比例只有1.5%。
亞馬遜對這項研究提出質(zhì)疑。它表示,RekogniTIon升級版的內(nèi)測結(jié)果顯示,該技術(shù)對于識別性別的正確率不存在人種差異。此外,亞馬遜認(rèn)為這篇論文沒有清楚地說明在實驗中使用的置信度閾值,即Rekognition的判斷被認(rèn)為是正確而必須達(dá)到的最低精確度。
在給外媒的一份聲明中,亞馬遜云服務(wù)平臺深度學(xué)習(xí)和人工智能總經(jīng)理馬特·伍德博士(Matt Wood)對面部分析和面部識別這兩個概念進(jìn)行了區(qū)分:面部分析指的是在視頻或圖像中辨認(rèn)出臉部,并確定其一般屬性;而面部識別是將單個人臉與其它視像中的人臉相匹配。他說,根據(jù)“面部分析”的結(jié)果來判斷“面部識別”的準(zhǔn)確性是“不可行的”,而且他認(rèn)為這篇論文所談?wù)摰暮汀翱蛻羧绾问褂肦ekognition”是兩回事。
伍德博士說:“使用最新版本的Rekognition,從議會網(wǎng)站和Megaface人臉數(shù)據(jù)庫下載百萬張圖像數(shù)據(jù),我們發(fā)現(xiàn),置信度閾值設(shè)置為0.99時,誤報數(shù)為零。我們通過錄入和反饋來不斷改進(jìn)這項技術(shù),且支持創(chuàng)建第三方評估、數(shù)據(jù)集、衡量基準(zhǔn)?!?/p>
這是亞馬遜第二次被質(zhì)疑Rekognition存在偏見。
上一次在今年夏天,美國公民自由聯(lián)盟(American Civil Liberties Union)對Rekognition進(jìn)行了一項測試(亞馬遜質(zhì)疑該測試的準(zhǔn)確性):把25000張罪犯面部照片和國會議員的官方照片進(jìn)行比較。結(jié)果Rekognition將28名議員誤判成罪犯,其中有色人種的錯判率占到38%。
無獨有偶。
2012年的一項研究顯示,Coigntec(德國從事生物特征識別技術(shù)的公司)的人臉識別程序在識別非裔美國人和白種人時存在差距,前者比后者的錯判率高出5%到10%。2011年的一項研究顯示,中日韓開發(fā)的人臉識別模型難以區(qū)分白種人和東亞人。今年2月,麻省理工媒體實驗室進(jìn)行的研究表明,微軟、IBM和北京曠視科技(Megvii)通過人臉識別性別的錯誤率如下:7%的淺色皮膚女性和12%的深色皮膚男性被認(rèn)錯,而深色皮膚女性的錯判率甚至高達(dá)35%。
弗吉尼亞大學(xué)(University of Virginia)進(jìn)行的另一項研究顯示,ImSitu和COCO(兩個知名的圖像數(shù)據(jù)集)在描述體育、烹飪和其它活動時表現(xiàn)出性別偏見(其中COCO由Facebook、微軟和初創(chuàng)公司MightyAI共同贊助)。例如,購物圖片傾向于與女性相關(guān)聯(lián),而教練圖片則與男性相關(guān)聯(lián)。
也許最糟糕的一個例子是:2015年一位軟件工程師報告稱,谷歌照片的圖像分類算法將非裔美國人識別成“大猩猩”。
但是人臉識別技術(shù)的某些進(jìn)展也是令人鼓舞的。
今年6月,微軟與人工智能公平方面的專家合作,修訂并擴(kuò)展了用于培訓(xùn)Face API的數(shù)據(jù)集,F(xiàn)ace API是微軟的一套算法程序,用于檢測、識別和分析圖像中的人臉。隨著新數(shù)據(jù)包含膚色、性別和年齡等信息,算法程序?qū)ι钅w色的男性和女性的錯判率分別降低了20倍和9倍。
亞馬遜表示它一直在努力提高Rekognition識別的準(zhǔn)確性,最近一次重要技術(shù)升級在去年11月進(jìn)行。
伍德博士補(bǔ)充說:“我們?yōu)檫@一領(lǐng)域的學(xué)術(shù)研究提供了資金,也對自己的團(tuán)隊進(jìn)行了大量投資,而且努力還將繼續(xù)。我們致力于改善面部識別、面部分析,強(qiáng)調(diào)解釋結(jié)果時有很高的可信度,也會重點關(guān)注人工審查的作用、標(biāo)準(zhǔn)化測試等方面。我們感謝為改善這些技術(shù)做出貢獻(xiàn)的客戶和學(xué)者。“
下周在夏威夷檀香山(Honolulu)將舉行“人工智能、倫理和社會促進(jìn)會議”,而麻省理工學(xué)院的研究結(jié)果將在會上公布。