怎樣創(chuàng)造更加公平的人工智能
掃描二維碼
隨時(shí)隨地手機(jī)看文章
斯坦福大學(xué)和馬薩諸塞大學(xué)阿姆赫斯特分校合作團(tuán)隊(duì)開發(fā)出一種方法,可以將模糊的目標(biāo)進(jìn)行量化,幫助機(jī)器學(xué)習(xí)算法更好地完成避免歧視或調(diào)節(jié)血糖等復(fù)雜任務(wù)。
得益于機(jī)器學(xué)習(xí)算法日益強(qiáng)大的能力,人工智能已進(jìn)入了主流商業(yè)。機(jī)器學(xué)習(xí)算法使計(jì)算機(jī)能夠訓(xùn)練自己完成諸如駕駛汽車,控制機(jī)器人或自動(dòng)化決策等工作。
但是隨著人工智能開始處理一些敏感任務(wù),例如幫助選擇哪些囚犯獲得保釋,政策制定者堅(jiān)持要求計(jì)算機(jī)科學(xué)家提供保證,確保自動(dòng)化系統(tǒng)的設(shè)計(jì)能夠避免或最大程度地減少不希望的后果,例如過高的風(fēng)險(xiǎn)或種族和性別偏見。
由斯坦福大學(xué)(Stanford University)和馬薩諸塞大學(xué)阿姆赫斯特分校(University of Massachusetts Amherst)的研究人員領(lǐng)導(dǎo)的團(tuán)隊(duì)于 11 月 22 日在《科學(xué)》雜志上發(fā)表了一篇論文,在這方面提出了一些建議。論文概述了一種新技術(shù),可用于將諸如避免性別偏見之類的模糊目標(biāo)轉(zhuǎn)化為精確的數(shù)學(xué)標(biāo)準(zhǔn),從而使機(jī)器學(xué)習(xí)算法可以訓(xùn)練人工智能應(yīng)用程序來避免這種行為。
斯坦福大學(xué)計(jì)算機(jī)科學(xué)助理教授、該論文的資深作者 Emma Brunskill 表示:「我們希望推動(dòng)人工智能的發(fā)展,尊重人類用戶的價(jià)值觀并證明我們對(duì)自主系統(tǒng)的信任是合理的。」
避免錯(cuò)誤行為
這項(xiàng)工作的前提是,如果可以用數(shù)學(xué)方式定義「不安全」或「不公平」的結(jié)果或行為,那么就應(yīng)該有可能創(chuàng)建相應(yīng)的算法,可以從數(shù)據(jù)中學(xué)習(xí)如何避免不想要的結(jié)果,并具有很高的可信度。研究人員還希望開發(fā)一套技術(shù),方便用戶指定他們想要怎樣的行為約束,使機(jī)器學(xué)習(xí)設(shè)計(jì)者可以放心地使用過去的數(shù)據(jù)訓(xùn)練的系統(tǒng),將其應(yīng)用到現(xiàn)實(shí)環(huán)境中。
「我們展示了機(jī)器學(xué)習(xí)算法的設(shè)計(jì)者可以如何幫助其他開發(fā)者,在將人工智能植入到其產(chǎn)品和服務(wù)中的時(shí)候,他們可以更容易描述不想要的結(jié)果或行為,而人工智能系統(tǒng)將以高概率避免這些狀況?!柜R薩諸塞大學(xué)阿默斯特分校計(jì)算機(jī)科學(xué)助理教授、該論文的第一作者 Philip Thomas 說。
確保公平與安全
研究人員測(cè)試了他們的方法,試圖提高基于考試成績(jī)預(yù)測(cè)大學(xué)生 GPA 的算法的公平性,這種常見的算法可能產(chǎn)生性別偏見。他們使用實(shí)驗(yàn)數(shù)據(jù)集為算法提供了數(shù)學(xué)指令,以避免讓最終得到的預(yù)測(cè)性方法系統(tǒng)性地高估或低估某一性別的 GPA。通過這些指令,該算法找到了一種比現(xiàn)有方法更好的方法來預(yù)測(cè)學(xué)生的 GPA,其系統(tǒng)性性別偏見要少得多。在這方面,先前的方法很困難,要么是因?yàn)樗鼈儧]有內(nèi)置的公平性過濾器,要么是因?yàn)闉閷?shí)現(xiàn)公平性而開發(fā)的算法的范圍太有限。
研究小組還開發(fā)了另一種算法,并使用它來自動(dòng)平衡胰島素泵的安全性和性能。這種泵必須決定在進(jìn)餐時(shí)間給病人輸送多大劑量的胰島素。理想情況下,泵輸送的胰島素剛好能保持血糖水平穩(wěn)定。胰島素過少會(huì)使血糖升高,導(dǎo)致惡心等短期不適,并增加心血管疾病等長(zhǎng)期并發(fā)癥的風(fēng)險(xiǎn);過量使用胰島素又會(huì)導(dǎo)致血糖暴跌,這是一個(gè)潛在的致命后果。
機(jī)器學(xué)習(xí)可以識(shí)別個(gè)體的血糖水平對(duì)不同劑量的胰島素反應(yīng)的微妙模式,從而更好地提供幫助,但是現(xiàn)有方法并不容易讓醫(yī)生明確自動(dòng)劑量算法應(yīng)避免的結(jié)果(如低血糖)。Brunskill 和 Thomas 展示了如何訓(xùn)練泵來確定為指定患者量身定制的劑量,避免因劑量過大或劑量不足而引起并發(fā)癥。盡管該小組尚未準(zhǔn)備好在真實(shí)的人身上測(cè)試該算法,但它指出了一種人工智能方法,該方法最終可能會(huì)改善糖尿病患者的生活質(zhì)量。
Brunskill 和 Thomas在他們的《科學(xué)》論文中使用術(shù)語(yǔ)「Seldonian 算法」一詞來定義他們的方法,引用于科幻小說作者阿西莫夫發(fā)明的角色 Hari Seldon,他曾經(jīng)宣布了三條機(jī)器人定律,其開頭是「機(jī)器人不應(yīng)傷害人類,也不應(yīng)因?yàn)闊o作為而傷害人類」。
Thomas 承認(rèn)這個(gè)領(lǐng)域離遵循這三條定律還有很長(zhǎng)的路要走,但他說,這種 Seldonian 框架將使機(jī)器學(xué)習(xí)設(shè)計(jì)人員更容易將避免行為指令構(gòu)建到各種算法中,在某種程度上可以使他們能夠評(píng)估訓(xùn)練過的系統(tǒng)在現(xiàn)實(shí)世界中正常運(yùn)行的可能性。
Brunskill 說,這個(gè)提議框架建立在許多計(jì)算機(jī)科學(xué)家正在努力的基礎(chǔ)上,在創(chuàng)建強(qiáng)大的算法和開發(fā)方法之間取得平衡以確保其可靠性。
「隨著社會(huì)越來越依賴人工智能,思考如何創(chuàng)建出最能尊重安全、公平等價(jià)值的算法至關(guān)重要。」Brunskill 說。