紐約時(shí)報(bào):計(jì)算機(jī)時(shí)代人工介入不可或缺
掃描二維碼
隨時(shí)隨地手機(jī)看文章
《紐約時(shí)報(bào)》網(wǎng)站周一發(fā)表署名史蒂夫·勞爾(Steve Lohr)的文章稱,如今計(jì)算機(jī)算法承擔(dān)了越來越多的工作,從股票買賣到廣告定位,從政治競選活動(dòng)到約會(huì)安排,甚至是挑選胸罩尺寸,計(jì)算機(jī)算法無處不在。 但不管算法如何演變,都不能完全脫離人工的介入而勝任當(dāng)今不斷升級的需求。以下是文章全文:
盡管計(jì)算機(jī)算法正變得越來越強(qiáng)大、快速和精準(zhǔn),但始終還是只能理解文字字面的意思,任何上下文的引申義和細(xì)微的差異往往會(huì)成為絆腳石。即便已經(jīng)非常強(qiáng)大,但計(jì)算機(jī)算法還是無法破譯人類語言的模糊性和推理的奧秘。但現(xiàn)在人們的要求已經(jīng)大大提高,希望身邊的設(shè)備更能像一個(gè)人一樣提供信息。
因此,當(dāng)編程專家們?nèi)匀?ldquo;按部就班” 地編寫計(jì)算機(jī)代碼時(shí),更多的人需要加入進(jìn)來做些更微妙的貢獻(xiàn)。為了滿足用戶更深層次的需求,人們不得不對計(jì)算機(jī)算法的工作進(jìn)行評價(jià)、編輯或校正。例如,人們收集網(wǎng)絡(luò)上的資料庫,檢查和驗(yàn)證它們,然后把它們編輯成能夠響應(yīng)計(jì)算機(jī)請求的表單,將答案呈現(xiàn)在用戶面前。在這一過程中,人類對信息做了解釋和調(diào)整,使之能夠同時(shí)被機(jī)器和用戶所理解。
我們不妨把這種行為稱為新興的機(jī)械與人工協(xié)作模式,諸如蘋果語音助手Siri和IBM的沃森超級計(jì)算機(jī)在內(nèi)的問答技術(shù)都屬于這一范疇。在這類技術(shù)中,單純的計(jì)算機(jī)算法是無法勝任的。
Twitter的裁判員
以 Twitter為例,該服務(wù)就動(dòng)用了很多被稱為“裁判員”的合約工,來理解那些搜索頻率突然飆升的詞匯的語義和上下文意思。例如,當(dāng)米特·羅姆尼 (Mitt Romney)在去年的總統(tǒng)競選中談及削減政府對公眾廣播的預(yù)算時(shí)提到了“大鳥”(Big Bird)一詞,一時(shí)間包含該詞的消息在Twitter上炸開了鍋。很快,Twitter的人工裁判就判斷出這里的“大鳥”應(yīng)該是一個(gè)政治評論,而非通常意義上的意思,從而對算法做出調(diào)整——當(dāng)人們搜索“大鳥”時(shí),保證跳出來的是羅姆尼談?wù)摰?ldquo;大鳥”及其相關(guān)消息。
在這個(gè)實(shí)例中,只有人類才能快速而準(zhǔn)確地理解這樣的詞匯及其背后的相關(guān)信息,軟件是無法在較短時(shí)間內(nèi)完成的。同時(shí),裁判們會(huì)立即把它加入Twitter的搜索算法,確保顯示結(jié)果與人們期望的一致。Twitter的兩位工程師在博客中寫道:“在這類事件中,人工才是系統(tǒng)的核心。”
谷歌搜索的評估員
即便是在非常崇尚算法和工程的谷歌,人工對搜索結(jié)果的貢獻(xiàn)也越來越多。幾個(gè)月前,谷歌開始在知名的地點(diǎn)或人物的搜索結(jié)果右邊欄顯示摘要信息,譬如當(dāng)你搜索 “奧巴馬”或“紐約”時(shí),旁邊就會(huì)出現(xiàn)簡單的介紹。這些摘要介紹信息一般來自維基百科和其它數(shù)據(jù)庫,經(jīng)過人工編輯而成。這樣一來,當(dāng)谷歌的搜索算法檢測到這些特殊詞匯是就會(huì)調(diào)用整理好的介紹信息,而不是簡單的顯示連接到其它站點(diǎn)的鏈接。
在谷歌負(fù)責(zé)搜索質(zhì)量的工程總監(jiān)斯科特·霍夫曼(Scott Huffman)表示:“我們的思路有了轉(zhuǎn)變,部分搜索結(jié)果加入了人工策劃的結(jié)果。”
除了內(nèi)容策劃人員,還有其他人在幫助谷歌開發(fā)調(diào)整搜索算法,以應(yīng)對每月超過1000億次的搜索請求。他們通常被成為“評估員”?;舴蚵硎荆?ldquo;我們的工程師開發(fā)了搜索算法,但需要評估員幫助測試某一改動(dòng)是否能夠提升搜索質(zhì)量。”
23 歲的凱瑟琳·楊(Katherine Young)是一位谷歌搜索的評估員,她是谷歌簽的合同工,目前還在上大學(xué)。楊的工作是檢測和調(diào)整模糊的搜索結(jié)果和排序問題。譬如,針對“國王手里握的是什么”,她需要審核現(xiàn)有的搜索結(jié)果,給出合理的搜索結(jié)果和先后排序。譬如,一個(gè)包含“國王手握權(quán)杖”的網(wǎng)頁會(huì)被作為合理的參考答案放在第一位。
楊表示:“評估不是非黑即白的選擇,有時(shí)你不得不將自己置于用戶的角色,然后找出合理的結(jié)果及排序。”
沃森的醫(yī)學(xué)老師
IBM的超級問答計(jì)算機(jī)沃森經(jīng)過了很長時(shí)間的訓(xùn)練,試圖為醫(yī)生診斷提供專業(yè)的答案。不過即便如此,它也需要人工的介入。
作為“助理醫(yī)生”,沃森掌握了多種醫(yī)療書籍里面的知識(shí)。此外,沃森還會(huì)接受來自醫(yī)學(xué)院的臨床醫(yī)生們各種詢問,不斷修正自己的知識(shí)庫。譬如,沃森可能會(huì)被問到這樣的問題,“什么樣的神經(jīng)系統(tǒng)疾病是禁忌使用安非他酮的?”沃森的軟件系統(tǒng)數(shù)據(jù)庫里可能包含了安非他酮這種抗抑郁劑,但它可能會(huì)不明白禁忌是什么意思。這時(shí)就需要人工的介入,告訴機(jī)器禁忌就是不能使用的意思,然后沃森才可能給出“癲癇癥不能使用安非他酮”這樣的答案。
IBM科學(xué)家埃里克·布朗(Eric Brown)稱:“我們借助醫(yī)學(xué)專家?guī)椭稚瓕W(xué)習(xí),使它變得越來越聰明。”
總之,我們的計(jì)算機(jī)算法正變得越來越好,但要完成更智能、更人性化的任務(wù),它們離不開人力的幫助。