IBM人機(jī)辯論賽 最終AI利大于弊觀點(diǎn)險勝
近日,一個 IBM 機(jī)器人參與了一場質(zhì)疑自身的辯論,論題是“AI 是否會帶來更大的弊端”,最終認(rèn)為“利大于弊”的觀點(diǎn)險勝。
這場辯論在劍橋聯(lián)合會(Cambridge Union)展開。劍橋聯(lián)合會的辯論禮堂有 150 年的歷史,迎接過撒切爾夫人、羅斯福總統(tǒng)、霍金、甚至色情演員等等,從總理到總統(tǒng),從明星演員到學(xué)界泰斗各行各業(yè)的辯論人士。但怎么也想不到,今天會有 300 名觀眾觀看這場人類與非人類的辯論。
這個機(jī)器人是 IBM 的“辯論家計劃”(Project Debater)中的一個對話型 AI 機(jī)器人,它是一個兩米高的黑箱子,發(fā)出的聲音類似某個女明星。整場辯論以其發(fā)表的開場詞正式開始。這個機(jī)器人設(shè)置有一個“群眾演講”(speech by crowd)的應(yīng)用程序,可以用它分析人們在網(wǎng)上提交的意見來生成自己的論點(diǎn)。它的論據(jù)來自 1100 多份事先提交的人類陳述。
兩個辯論隊分別由一名教授和一名辯論專家組成,兩隊都有這個機(jī)器人的 AI 輔助?!拔艺娴暮芎闷妫埠芘d奮能和一臺機(jī)器一起工作。”其中一名參與者、反人工智能團(tuán)隊的辯論專家莎米拉·帕瑪南(Sharmila Parmanand)在活動開始前說。
“人工智能無法在道德上做出正確的決定,因?yàn)榈赖率侨祟愄赜械摹!眻鱿乱黄澎o。通常觀眾的注意力會在禮堂中位置最高的聯(lián)合會主席身上,但是現(xiàn)在所有人的目光都在這個閃著藍(lán)光的辯手身上。
“人工智能的錯誤率低于人類……這將是一個巨大的優(yōu)勢,因?yàn)樗梢怨?jié)省更多時間來執(zhí)行平凡和重復(fù)的任務(wù)?!彼岢隽藘蓚€立場相反的觀點(diǎn)。
支持 AI 的一方認(rèn)為人工智能將在某些領(lǐng)域創(chuàng)造新的就業(yè)機(jī)會,并“在工作場合提高效率”。
隨后這個機(jī)器人又提出“人工智能可以照顧病人,或者機(jī)器人可以教學(xué)生——這些領(lǐng)域也不再需要人類。”
人工智能條理清晰地進(jìn)行了辯論,但也出現(xiàn)了一些失誤。有時它會重復(fù)自己的觀點(diǎn),有時它無法提供詳細(xì)的素材來支撐自己的觀點(diǎn)。
這是一場有意思的辯論,但這不僅僅是一場辯論。這次 IBM 展示的技術(shù)與之前展示的非常不同。
“辯論家”項(xiàng)目的初始提案脫胎于 2011 年出現(xiàn)的單個 PPT 幻燈片。由于提交內(nèi)容有限,而且挑戰(zhàn)項(xiàng)目的難度比較大,IBM 管理層經(jīng)過了大約一年的仔細(xì)考慮,才最終批準(zhǔn)了該項(xiàng)目。2012 年,IBM 研究院建立了一個項(xiàng)目團(tuán)隊,正式啟動“Project Debater”項(xiàng)目開發(fā)。而該項(xiàng)目的實(shí)質(zhì)性工作直到 2014 年才展開。
去年 6 月,IBM 的辯論機(jī)器人首次與人進(jìn)行辯論,最終得分 1:1,觀眾投票認(rèn)為,Debater 的辯論技巧比人要差,但是信息量很大。當(dāng)時這個系統(tǒng)有數(shù)以億計的文章庫,可從中提取內(nèi)容,涉及約 100 個主題。當(dāng)遇到辯論性問題時,需要花費(fèi)幾分鐘的時間來搜索這些文章,構(gòu)建論點(diǎn)并進(jìn)行總體演講。
今年 2 月,在 IBM 的 Think conference 上,AI 機(jī)器人再戰(zhàn)冠軍級辯論家 Harish Natarajan。雙方圍繞“政府是否應(yīng)該資助學(xué)前教育”進(jìn)行激烈交鋒,最終 AI 落敗。
以前這種和人辯論的方式主要是鍛煉 AI 的聽力理解能力和對一個論點(diǎn)做出有意義的回應(yīng)的能力。這些技能或許是遠(yuǎn)遠(yuǎn)超過了智能家居或者移動設(shè)備中智能助理的能力,但是這些遠(yuǎn)遠(yuǎn)達(dá)不到 IBM 做這個辯論計劃的初衷。
這一次采用 AI 自我辯論的形式,就好像“你把數(shù)千條正面和負(fù)面的餐廳評論集中在一起,然后用幾段話總結(jié)出來”,IBM 計算機(jī)科學(xué)家丹?拉哈夫(Dan Lahav)說。
所以這場辯論的意義不在于機(jī)器能否說服人類,而是機(jī)器可以增強(qiáng)人類。
“人類可以基于我們的文化和傳統(tǒng)更好地理解聽眾,但是機(jī)器可以通過大量數(shù)據(jù)來豐富我們的知識,去做一些更加具體的決定,使我們消除作為人類固有的偏見?!盠ahav 說。
機(jī)器能找到事物之間各種有效的聯(lián)系,而這些聯(lián)系很有可能因?yàn)槿说哪J(rèn)想法而被忽略。這會限制我們處理信息的能力。
“2016 年,Debater 還只是一個蹣跚學(xué)步的孩子,而到了 2019 年,我們已經(jīng)達(dá)到了大學(xué)水平,”該項(xiàng)目首席研究員、IBM 杰出工程師諾姆?斯洛尼姆(Noam Slonim)表示,“Project Debater 可以在很多方面幫助人類,可以通過展示一個有爭議話題的兩面,減少人類固有的偏見?!?/p>
長期以來,辯論一直都是一個很具智力挑戰(zhàn)性的任務(wù)。讓人類去理解一個論點(diǎn),并表示支持還是反對,對我們來說是很簡單的,但對機(jī)器來說是難以置信的復(fù)雜。接下來機(jī)器人的挑戰(zhàn)是判斷論證的質(zhì)量是否足以說服他人。最后,人工智能還必須以一種人類可以理解的敘述方式來闡述論點(diǎn)。
除了辯論,這項(xiàng)技術(shù)或許可以運(yùn)用在任何一個需要收集數(shù)據(jù)并根據(jù)數(shù)據(jù)做出決定的工作中?!澳憧梢园阉醋魇且粋€研究引擎,而不是一個搜索引擎,”Lahav 說,“想象一下,在一場政治演講中,它能提高討論的水平,因?yàn)槟隳芰私饴牨娫谡f什么,你會給他們一個參與的平臺。立法者可以更好地看到對方,因?yàn)檫@臺機(jī)器可以自我辯論?!?/p>
目前來看,這個“辯手”已經(jīng)做得很不錯了,它組織語言的方式,沒有讓觀眾在 11 月這個寒冷的季節(jié)聽著機(jī)器的聲音昏昏欲睡。相反,它的存在讓辯論充滿輕松和活躍。
米格姆大學(xué) (University of Birmigham) 法學(xué)和倫理學(xué)教授、反方的一名成員西爾維·德拉克洛瓦 (Sylvie Delacroix) 走上講臺,并開玩笑地稱 Project Debater 為“黛比”?!叭斯ぶ悄苁且环N重要的工具,因?yàn)樗越^對的速度改變著我們的工作方式和約會方式?!彼f。
辯論結(jié)束后,人們沒有立即投票,而是起立歡呼。之后,觀眾分別走向了代表“贊成”“反對”和“棄權(quán)”的三扇門,最終投票結(jié)果:48.17% 的人贊成,51.22% 的人反對,0.61% 的人棄權(quán)。
“我真的不知道人工智能的未來是什么,”Natarajan 說,“它肯定會產(chǎn)生巨大影響,但我們不知道會是什么?!?/p>