研究評(píng)估性別對(duì)于AI人臉識(shí)別軟件的影響
(文章來(lái)源:教育新聞網(wǎng))
人臉識(shí)別軟件工具如何準(zhǔn)確地識(shí)別不同性別,年齡和種族背景的人?根據(jù)美國(guó)國(guó)家標(biāo)準(zhǔn)技術(shù)研究院(NIST)的一項(xiàng)新研究,答案取決于系統(tǒng)核心的算法,使用該算法的應(yīng)用程序以及所饋送的數(shù)據(jù),但是大多數(shù)人臉識(shí)別算法都具有人口統(tǒng)計(jì)學(xué)特征差異。差異意味著算法對(duì)同一個(gè)人的兩張圖像進(jìn)行匹配的能力在一個(gè)人口統(tǒng)計(jì)學(xué)組之間變化。
報(bào)告中捕獲的結(jié)果,即面部識(shí)別供應(yīng)商測(cè)試(FRVT)第3部分:人口統(tǒng)計(jì)影響(NISTIR 8280),旨在為政策制定者提供信息,并幫助軟件開(kāi)發(fā)人員更好地了解其算法的性能。面部識(shí)別技術(shù)之所以引起了公眾的爭(zhēng)論,部分原因是因?yàn)樾枰私馊丝诮y(tǒng)計(jì)學(xué)對(duì)面部識(shí)別算法的影響。
NIST的計(jì)算機(jī)科學(xué)家,報(bào)告的主要作者帕特里克·格羅瑟(Patrick Grother)說(shuō):“雖然在各種算法中進(jìn)行陳述通常是不正確的,但我們發(fā)現(xiàn)了我們研究的大多數(shù)面部識(shí)別算法中存在人口統(tǒng)計(jì)學(xué)差異的經(jīng)驗(yàn)證據(jù)?!薄氨M管我們不探討可能導(dǎo)致這些差異的原因,但這些數(shù)據(jù)對(duì)于決策者,開(kāi)發(fā)人員和最終用戶在考慮這些算法的局限性和適當(dāng)使用時(shí)將是有價(jià)值的。”
這項(xiàng)研究是通過(guò)NIST的人臉識(shí)別供應(yīng)商測(cè)試(FRVT)程序進(jìn)行的,該程序?qū)π袠I(yè)和學(xué)術(shù)開(kāi)發(fā)人員提交的人臉識(shí)別算法執(zhí)行不同任務(wù)的能力進(jìn)行了評(píng)估。雖然NIST并未測(cè)試使用這些算法的最終商業(yè)產(chǎn)品,但該程序顯示出該領(lǐng)域正在迅速發(fā)展。
NIST的研究評(píng)估了來(lái)自大多數(shù)行業(yè)的99位開(kāi)發(fā)人員的189種軟件算法。它著重介紹每種算法在人臉識(shí)別最常見(jiàn)的應(yīng)用程序中執(zhí)行兩種不同任務(wù)之一的效果如何。確認(rèn)照片與數(shù)據(jù)庫(kù)中同一個(gè)人的另一張照片匹配的第一項(xiàng)任務(wù)稱為“一對(duì)一”匹配,通常用于驗(yàn)證工作,例如解鎖智能手機(jī)或檢查護(hù)照。第二,確定照片中的人在數(shù)據(jù)庫(kù)中是否有任何匹配項(xiàng),稱為“一對(duì)多”匹配項(xiàng),可用于識(shí)別感興趣的人。
為了評(píng)估每種算法在其任務(wù)上的性能,該團(tuán)隊(duì)測(cè)量了該軟件可能產(chǎn)生的兩類錯(cuò)誤:誤報(bào)和誤報(bào)。誤報(bào)意味著軟件錯(cuò)誤地認(rèn)為兩個(gè)不同的人的照片可以顯示同一個(gè)人,而誤報(bào)意味著軟件無(wú)法匹配實(shí)際上確實(shí)顯示同一人的兩張照片。
? ? ?