梅勒妮·米切爾(Melanie Mitchell)寫了她的新書《人工智能:思考人類的指南》(Artificial Intelligence: A Guide for Thinking Humans),因為她對人工智能究竟取得了多大進步感到困惑。她寫道,她想“了解事情的真實狀態(tài)”。
得知她的矛盾心理是一種安慰,因為她自己就是一名人工智能研究員。她是波特蘭州立大學的計算機科學教授,也是著名的多學科研究中心圣達菲研究所(Santa Fe Institute)科學委員會的聯(lián)合主席。如果米切爾對人工智能的立場都感到困惑,請原諒我們其他人的困惑,或者是謬誤百出的見解。
正如米切爾所指出的那樣,許多有關人工智能勝利的故事正在流傳。這些報告中,最近在計算機視覺、語音識別、游戲和機器學習的其他方面的突破表明,人工智能可能會在未來幾十年很大范圍的任務中超越人類的能力。有些人覺得前景不可思議;另一些人擔心“超人類”計算機可能會判定不需要我們?nèi)祟愒谏磉?,并有能力做些與此有關的事。
我們要么離‘真正的’人工智能只有咫尺之遙,要么離了數(shù)百年。”
但也如米切爾另外證明的那樣,即使是當今最強大的人工智能系統(tǒng)也有關鍵性的局限。它們只擅長于狹隘定義的任務,對外面的世界一無所知;它們在數(shù)據(jù)中發(fā)現(xiàn)相關性,而不考慮數(shù)據(jù)的含義,因此他們的預測可能是非常不可靠的;它們沒有常識。
“要么取得了巨大的進展,要么幾乎沒有進展,”米切爾寫道。“我們要么離‘真正的’人工智能只有咫尺之遙,要么離了數(shù)百年?!?/p>
米切爾解決問題的方法使這本書具有紀念意義和啟發(fā)性。她對當今人工智能技術的耐心解釋給人的印象是,真正的機器智能還很遙遠。她表示,電腦不僅需要更好的大腦,還可能需要更好的身體。
米切爾提供了非常清晰易讀的人工神經(jīng)網(wǎng)絡入門知識,該技術是圖像識別,語言翻譯和自動駕駛方面最新進展的核心。20世紀50年代和60年代,在最初的一些建立人工智能的嘗試中使用了神經(jīng)網(wǎng)絡,但它們失寵了,因為看起來像一條死胡同,價值有限。但大約10年前有所改變,計算能力的進步使一種稱為深度學習的數(shù)據(jù)密集型方法來訓練神經(jīng)網(wǎng)絡成為可能。
跟隨米切爾對神經(jīng)網(wǎng)絡的描述,你不需要了解繁雜的的數(shù)學。她展示了數(shù)學主要是什么,這就同時解釋了它們的威力和缺陷。一種對識別圖像內(nèi)容特別有用的神經(jīng)網(wǎng)絡依賴于一種叫做“卷積”(convoluTIon)的數(shù)學計算。處理文本的版本依賴于計算機表示語言統(tǒng)計方面的能力,即在穿過數(shù)百個維度的復雜“向量”里,單詞在句子中出現(xiàn)的頻率有多高。
令人印象深刻的是,人們已經(jīng)將世界上如此多的方面進行了量化,以供計算機繼續(xù)工作。同樣值得注意的是,這些方法有如此多樣的應用,比如檢測腫瘤、自動駕駛和過濾垃圾郵件。但是這種偉大計算器的巧妙新用途并不一定賦予它們與我們的智力相當?shù)哪芰ΑU缑浊袪査赋龅?,讓卷積神經(jīng)網(wǎng)絡(ConvoluTIonal Neural Networks, CNN)正常工作“需要大量的人類智慧”。
機器學習系統(tǒng)本質(zhì)上是統(tǒng)計工作,所以很清楚,為什么它們很容易受到所饋送數(shù)據(jù)中的不準確、漏洞和其他缺點的影響。難怪如果神經(jīng)網(wǎng)絡在主要顯示白人的圖像上經(jīng)過訓練,它就不能識別黑人的臉。當一輛自動駕駛汽車無法識別一個有貼紙的停車標志,但(對人類來說)它仍然是一個明顯的停車標志時,就并不奇怪。
幸運的是,這類問題已經(jīng)引發(fā)了許多富有成果的討論,這些討論關于面部識別技術和自動決策的社會影響。紐約大學數(shù)據(jù)新聞學副教授梅雷迪思·布魯薩德(Meredith Broussard)在2018年出版的《人工智能:計算機如何誤解世界》(ArTIficial Unintelligence: How Computers The World)一書中有說服力地提出,無論你是否稱它為“人工智能”,計算機仍然應該被當作是被我們這些好奇的人類使用的工具,人類應該始終處于這個范圍內(nèi)。
不過,盡管米歇爾并不是第一個指出機器學習系統(tǒng)弱點的人,她還是在評論中加了一層解釋說,即使在它們處于最佳狀態(tài)的時候,計算機可能也沒有你想的那么好。在過去幾年里,研究人員開發(fā)出了神經(jīng)網(wǎng)絡,他們聲稱,在識別照片或視頻中的物體時,神經(jīng)網(wǎng)絡的表現(xiàn)達到甚至超過了人類的表現(xiàn)。這在新聞中被作為另一個必然對機器優(yōu)勢“抵抗無果”的例子。
米切爾指出,討論的基準是一個基于名為ImageNet的大型圖片數(shù)據(jù)庫的測試。2017年,最優(yōu)秀的計算機系統(tǒng)對來自ImageNet的圖片進行了分類,正確率達98%的top-5正確率,據(jù)稱超過了95%的人類正確率。(注:top-5準確率指排名前五的類別包含實際結果的準確率,即對一個圖片,如果概率前五中包含正確答案,即認為正確。)
“top-5”的障礙是什么?這意味著正確的物體分類是機器作出的前五種猜測之一。米切爾寫道:“如果給定一個籃球的圖像,機器按這個順序輸出‘槌球’、‘比基尼’、‘疣豬’、‘籃球’和‘搬運車’,就被認為是正確的。top-5指標存在的原因可以理解:如果一張圖片顯示了不止一個物體,那么了解機器是否能檢測出這些物體是很有用的。但它削弱了對極端技能的要求。米切爾表示,2017年,當該機器將正確的類別歸置在其列表首位時,top-1的最高準確率僅為82%。(注:top-1準確率是指排名第一的類別與實際結果相符的準確率,即對一個圖片,如果概率最大的是正確答案,才認為正確。)
至于說人類有95%的準確率,米切爾認為支持這一說法的數(shù)據(jù)站不住腳。在2015年發(fā)表的一個研究項目中,兩個人嘗試了ImageNet挑戰(zhàn)的一部分。投入更多時間的人是安德烈·卡帕西(Andrej Karpathy),他現(xiàn)在是特斯拉的人工智能主管。以top-5準確率作為衡量標準,他錯了5%。而現(xiàn)在,這個數(shù)字被用作人類表現(xiàn)的標準。
如果不是因為這個特殊測試的古怪之處,他的錯誤率可能會更低。卡帕西寫道,他和另一名測試對象所犯錯誤的四分之一,不是因為他們對所看到的圖片一無所知,而是因為他們不知道或不記得ImageNet中使用的一些確切的標簽。
更糟糕的是,“據(jù)我所知,還沒有人報道過機器和人類在top-1準確率上的比較,”米切爾寫道。
憑借其快速和無盡的耐心,計算機是許多應用中圖像識別的理想選擇。在某些情況下,它們肯定比人類更準確。但說得太過了?!拔矬w識別尚未接近被人工智能‘解決’的程度,”米切爾寫道。
我很難想象我們需要什么樣的突破才能制造出這樣一臺機器?!?/p>
人工智能目前最熱門的話題之一是,如何讓機器不僅檢測數(shù)據(jù)中的統(tǒng)計相關性,而且在某種程度上理解它們正在處理的內(nèi)容的意義。和米切爾一樣,紐約大學的研究人員加里·馬庫斯(Gary Marcus)和歐內(nèi)斯特·戴維斯(Ernest Davis)表示,如果沒有這些改進,人工智能就不會“安全、智能或可靠”。在他們的新書《重啟AI:構建我們可以信任的人工智能》(RebooTIng A.I.:Building Artificial Intelligence We Can Trust)中,馬庫斯和戴維斯說,人們由于“可信度差距”而誤以為計算機比它們更先進。
他們寫道:“我們不得不從認知的角度來思考機器(‘它認為我刪除了我的文件’),不管機器實際上可能遵循的規(guī)則多么簡單?!?/p>
為了讓機器變得不那么簡單,許多研究人員正在重新探索用邏輯和常識來編碼計算機的舊方法。以米切爾為例,她用類比的方式描述了她讓計算機進行推理所做的努力。如果你想要一個電腦識別圖像描繪“遛狗”,現(xiàn)在的基本方法是給它顯示成千上萬的遛狗的圖片,然后使之相信那些照片中常見的事物——狗,皮帶,手等。當機器看到之后遛狗的照片時,將觸發(fā)一個積極的信號。然而,它可能會嗅出一些不尋常的遛狗行為。米切爾展示了一些例子,比如一張照片,一個人騎著自行車遛狗,另一只狗叼著另一只狗的皮帶。她的研究小組正試圖讓計算機理解后一種情況是典型情況的“延伸”版本。
那樣的工作是辛苦而緩慢的。即使它成功了——如果一臺電腦可以在某種程度上理解“遛狗”可以有多種形式——如果這臺機器自己從來沒有遇到過狗,這種理解能有多豐富呢?
當我6歲左右的時候,我在我家附近的人行道上騎自行車,停下來看(也許還扔了) 一串從甜膠樹上摘下來的帶刺的種子球。突然,有人打開了街對面一所房子旁邊的一扇門,出來一條棕色的狗,它猶豫了一兩秒鐘,然后徑直撲過來,咬住我,撕破了我的燈芯絨褲子。這些記憶幫助我洞察到經(jīng)歷的無數(shù)方面——驚訝、恐懼和痛苦的感覺;一些狗的不可預測性;甜膠種子球的奇異古怪。相比之下,如果計算機被告知當人們說“something bit them in the ass”時并不總是一個習語,那就太膚淺了。(注:bite本意為“咬“,ass本意為“屁股”,bite (someone) in the ass指不當行為導致了不良后果。)
哲學家和其他人工智能懷疑論者一直認為,沒有真實身體的電子大腦只能學到盒子里這點東西。許多人工智能研究人員將這種懷疑歸咎于“某種殘留的神秘主義”——正如認知科學家安迪·克拉克(Andy Clark)在1997年出版的《此在:重整大腦、身體和世界》(Being There: put Brain, Body, and World Together Again)一書中所寫的那樣,這是一種“對類似靈魂的精神實質(zhì)的非科學信仰”。但是,當你考慮到爬行的嬰兒能快速掌握基本概念,而數(shù)據(jù)中心的計算機需要大量的電力來吸收一個東西時,人工智能需要一個身體的這個想法就聽起來相當不錯。
米切爾似乎不情愿地轉變?yōu)閼岩烧撜叩牧觥!霸谂c人工智能搏斗多年之后,我發(fā)現(xiàn)關于身體化的爭論越來越有說服力,”她寫道。
那么,怎樣才能制造出一個能在世界各地移動的機器人呢?這個機器人不僅能洞察自己的行為,還能洞察人類、動物和其他機器的行為。“我?guī)缀鯚o法想象,”她寫道,“我們需要什么樣的突破才能制造出這樣一臺機器?!?/p>
來源:鉛筆道pencilnews