人工神經(jīng)網(wǎng)絡在這六大領域的表現(xiàn)已經(jīng)超越了人類
五年前,研究人員在能夠解讀圖像的軟件的準確性上有了一次突如其來但大幅度的飛躍,其背后的人工神經(jīng)網(wǎng)絡支撐了我們現(xiàn)在在人工智能行業(yè)所看到的繁榮景象。然而,我們?nèi)赃h未達到《終結(jié)者》或《黑客帝國》中所描述的那種現(xiàn)實。
目前,研究人員正試圖把重點放在怎樣教機器把一件事做到極致。與人腦同時處理多個事物的大腦不同,機器人必須以線性的方式“思考”。無論如何,在某些領域,人工智能已經(jīng)打敗了人類。深度神經(jīng)網(wǎng)絡已經(jīng)學會了交談、駕駛汽車、玩電子游戲、下圍棋、畫畫,以及幫助探索科學發(fā)現(xiàn)。
在以下六個領域中,人工神經(jīng)網(wǎng)絡已經(jīng)證明,它們可以超越人類智能。
1.圖像和物體識別
記錄表明,機器在圖像和物體識別方面的能力遠遠超過了人類。在一次測試軟件識別玩具的能力的實驗中,Geoff Hinton發(fā)明的Capsule網(wǎng)絡的錯誤率幾乎只有之前最低錯誤率的一半。在不同的掃描過程中,增加這些膠囊的數(shù)量可以讓系統(tǒng)更好地識別一個物體,即使這個視圖與之前分析的不同。
另一個例子來自于一個最先進的網(wǎng)絡,它是在一個有標簽的圖片數(shù)據(jù)庫上訓練的,并且能夠比一個博士生更好地對物體進行分類,而這些博士生在相同的任務上接受了超過100個小時的訓練。
2.電子游戲谷歌的DeepMind使用一種被稱為“深度強化學習”的深度學習技術,研究人員用這種方法教電腦玩雅達利的打磚塊游戲Breakout。他們沒有以任何特定的方式對這臺電腦進行教學或編程。相反,它在看分數(shù)的同時還控制了鍵盤,它的目標是得到盡可能高的分數(shù)。玩了兩個小時后,電腦就成為了這個游戲的專家。
深度學習社區(qū)正在進行一場競賽,訓練計算機在幾乎所有你能想到的游戲中擊敗人類,包括太空入侵者、末日、Pong和魔獸世界。在大多數(shù)游戲中,深度學習網(wǎng)絡已經(jīng)勝過有經(jīng)驗的玩家。電腦并不是通過編程來玩游戲的,他們只是通過玩游戲來學習。
3.語音生成和識別去年,谷歌發(fā)布了WaveNet,百度發(fā)布了Deep Speech。兩者都是深度學習網(wǎng)絡,能自動生成語音。這些系統(tǒng)學會了模仿人類的聲音,并且它們的水平隨著時間的推移不斷提高。將他們的演講與真實的人區(qū)別開來,要比人們想象的要難得多。
牛津大學和谷歌公司DeepMind的科學家們創(chuàng)造了一個深度網(wǎng)絡,LipNet,在閱讀人們的唇語上達到了93%的正確率,而普通的人類唇語閱讀者只能達到52%的正確率。來自華盛頓大學的一個小組利用唇形同步創(chuàng)建了一個系統(tǒng),將合成音頻與現(xiàn)有視頻實現(xiàn)同步。
4.藝術品和風格的模仿神經(jīng)網(wǎng)絡可以研究某一特定藝術作品的筆觸、顏色和陰影的圖案。在此基礎上,它可以根據(jù)分析將原始的藝術作品轉(zhuǎn)化為新的圖像。
DeepArt.io就是一個例子,這家公司開發(fā)的應用可以使用深度學習來學習數(shù)百種不同的風格,你可以將它們應用到你的照片中。藝術家和程序員Gene Kogan也運用了風格轉(zhuǎn)換,基于算法從埃及象形文字中學習的風格來修改蒙娜麗莎畫像。
5.預測斯坦福大學的研究人員TImnit Gebru選取了5000萬張谷歌街景圖片,探索一個深度學習網(wǎng)絡可以做些什么。結(jié)果是,計算機學會了定位和識別汽車。它檢測到超過2200萬輛汽車,包括它們的制造、型號、體型和年份。這一系統(tǒng)獲得的洞見之一就是,選民隊伍的起點和終點在哪里。根據(jù)這一分析,“如果在15分鐘車程中遇到的轎車數(shù)量高于皮卡車的數(shù)量,那么這座城市可能會在下次總統(tǒng)選舉中投票給民主黨人(88%的幾率),”TImnit Gebru和他的合著者寫道。
另一個機器提供比人類更準確的預測的例子來自谷歌的Sunproof項目,這項技術使用了來自谷歌地球的航拍照片來創(chuàng)建一個你的屋頂?shù)?D模型,將它與周圍的樹木和陰影區(qū)分開。然后,它利用太陽的軌跡,根據(jù)位置參數(shù)來預測你屋頂?shù)奶柲茈姵匕迥墚a(chǎn)生多少能量。
6.網(wǎng)站設計修改在網(wǎng)站生成器中集成的人工智能可以幫助網(wǎng)站更新,并對網(wǎng)站進行有用的修改,比人類更快速、更準確。這種系統(tǒng)的基本技術提供了關于網(wǎng)站外觀的普通用戶的意見,這可以告訴設計師網(wǎng)站設計的好壞。如今,網(wǎng)站建設者們要么利用深層網(wǎng)絡來修改設計,要么計劃在不久的將來使用它們。該技術可以分析不同的模式,并根據(jù)以前的轉(zhuǎn)化率和其他重要指標,創(chuàng)造更好的結(jié)果。
雖然我們距離實現(xiàn)矩陣級別的人工智能還差得很遠,但企業(yè)正在努力快速提高神經(jīng)網(wǎng)絡的智能化水平。上面提到的項目只是這項技術的淺層次應用,新的想法和改進不斷涌現(xiàn),證明機器在完成任務方面正在不斷超越人類的表現(xiàn)。