Michael I. Jordan:AI時(shí)代未到大爆炸的時(shí)代,需正確認(rèn)知
掃描二維碼
隨時(shí)隨地手機(jī)看文章
現(xiàn)今的我們,并非處于一個(gè)人工智能的神奇大爆炸時(shí)代。
在人工智能成為炙手可熱的話題之后,前百度首席科學(xué)家吳恩達(dá)的導(dǎo)師、被譽(yù)為人工智能領(lǐng)域的“根目錄”之一的Michael I. Jordan教授希望能通過自己的課程讓人們更準(zhǔn)確地認(rèn)知AI領(lǐng)域。
授課老師|Michael I. Jordan
加州大學(xué)伯克利分校教授、美國三院院士
Michael I. Jordan,前百度首席科學(xué)家吳恩達(dá)的導(dǎo)師、被譽(yù)為人工智能領(lǐng)域的“根目錄”之一。近兩年,人工智能技術(shù)發(fā)展的如火如荼,混沌大學(xué)課堂上,Michael I. Jordan提出,我們并非處于人工智能的大爆炸時(shí)代,在這一領(lǐng)域,我們?nèi)蕴幱诜浅3跫?jí)的階段,很多事情我們還不了解。他還從三方面告訴了我們?cè)鯓訙?zhǔn)確認(rèn)知人工智能的現(xiàn)在與未來。
目前,人們講到人工智能和機(jī)器學(xué)習(xí),可能還是覺得它很復(fù)雜。
事實(shí)上,當(dāng)你聽過我的課程,就會(huì)發(fā)現(xiàn),關(guān)于這個(gè)話題,有很多還停留在概念性、戰(zhàn)略性的階段。當(dāng)然,也有一些投入實(shí)際應(yīng)用的技術(shù),但這背后的理論,還是非?;A(chǔ)和簡單的。
人工智能與機(jī)器學(xué)習(xí),其實(shí)還遠(yuǎn)遠(yuǎn)不是一門基礎(chǔ)扎實(shí)的工程學(xué)科,它并不能為現(xiàn)在用數(shù)據(jù)分析問題提供強(qiáng)大且可拓展的解決方案。
因此,我們并不能將人工智能與機(jī)器學(xué)習(xí)的發(fā)展簡單理解為一個(gè)神跡,如同高樓非一夜而起,它是必須要經(jīng)歷長時(shí)間的發(fā)展的。
大家首先要意識(shí)到,在這一領(lǐng)域,我們?nèi)蕴幱诜浅3跫?jí)的階段。很多事情我們還不了解,現(xiàn)今的我們并非處于一個(gè)人工智能的神奇大爆炸時(shí)代。
可以說,我們有可能要花上百年的時(shí)間,這個(gè)高樓大廈才能真正地建立起來。
準(zhǔn)確認(rèn)知人工智能的現(xiàn)在與未來
本節(jié)要點(diǎn)
目前的智能系統(tǒng)還無法做到對(duì)場(chǎng)景的常識(shí)理解;
我們不太可能看到所謂的“超級(jí)人類AI”。
拋棄那些外界的宣傳,我們需要實(shí)際且準(zhǔn)確地理解人工智能。我們來講,目前的人工智能有哪些可能性,以及,哪些技術(shù)還沒有實(shí)現(xiàn)的可能。
計(jì)算機(jī)視覺
可能:在可視場(chǎng)景中標(biāo)記對(duì)象
目前尚無可能:對(duì)視覺場(chǎng)景的常識(shí)理解
比如,一個(gè)會(huì)議室的攝像機(jī),把它連接到電腦上后,讓它區(qū)分哪些是人臉。在目前,人工智能也許可以標(biāo)記對(duì)象,但卻不能理解這個(gè)場(chǎng)景。
作為人類,我知道這個(gè)會(huì)議室有很多人,出口在哪里,我要小心臺(tái)階不能掉下去。這是我的常識(shí)性理解,但計(jì)算機(jī)是做不到的。
語音識(shí)別
可能:多語種語音到文本和文本到語音的轉(zhuǎn)換
目前尚無可能:對(duì)聽覺場(chǎng)景的常識(shí)理解
我的聲音可以通過話筒接到電腦中并轉(zhuǎn)化為文本,轉(zhuǎn)化為語音。但如上所述,電腦并不能對(duì)文本背后的常識(shí)進(jìn)行理解。
人們可以馬上理解一個(gè)很復(fù)雜的句子來預(yù)測(cè)下一步行動(dòng),但計(jì)算機(jī)做不到。
自然語言處理
可能:最低限度的翻譯和問答
目前尚無可能:語義理解、對(duì)話
自然語言中有很多東西,機(jī)器是做不到的。機(jī)器只能死記硬背,卻沒有辦法真正地回答問題。
當(dāng)你和電腦交流的時(shí)候,它可以回答你“中國最大的城市是哪一個(gè)”,那是它通過“中國”、“城市”、“最大”這三個(gè)關(guān)鍵詞,在百度搜索的答案。
但如果你的問題是“中國不在河邊的第二大城市是哪一個(gè)”,電腦給你的答案一定是對(duì)你一點(diǎn)用都沒有的。因?yàn)樵诖酥翱赡軓膩頉]有人做過這個(gè)問題的相關(guān)數(shù)據(jù),沒有這個(gè)問題答案的數(shù)據(jù)列表。
但在未來的十年,上述被列為“尚無可能”的部分,將至少可實(shí)現(xiàn)基本形式。
十年,就技術(shù)而言,是一個(gè)很長的時(shí)間窗口了。事實(shí)上有一些技術(shù)已經(jīng)開始出現(xiàn),只是目前在比較原始初級(jí)的階段而已。
比如自駕車以及自駕式空中出租車,它們還是會(huì)出現(xiàn)的。盡管不會(huì)是超級(jí)智能,但肯定會(huì)越來越好。
但請(qǐng)注意,人工智能系統(tǒng)仍然是非常有限的智能系統(tǒng)。我相信,我的AI同事們也會(huì)贊同我的觀點(diǎn):我們不太可能看到和人有同等智力的靈活性與創(chuàng)造性的AI系統(tǒng)。
首先,人類每時(shí)每刻都在以新的方式思考怎樣用新的語言來表述,就像我現(xiàn)在講的每一句話都是有創(chuàng)造性的,我在講話中可以不斷講新的內(nèi)容以及新的理念,使用隱喻、反諷等修辭。
在現(xiàn)實(shí)中,AI系統(tǒng)還做不到。AI可以幫你做一些基礎(chǔ)工作,比如幫你在網(wǎng)上訂一張票,但是它無法和你談人生。
此外,人類還非常善于做新的抽象推理。
比如,“Blank從上海走到杭州只花了3個(gè)小時(shí)”。作為人類,你會(huì)做很多推理:Blank會(huì)移動(dòng),而且從上海走到杭州只花了三個(gè)小時(shí),它的運(yùn)動(dòng)速度一定很快。那么,你會(huì)針對(duì)Blank問很多問題。
但AI系統(tǒng)就做不到,它需要反復(fù)、重復(fù)用海量的數(shù)據(jù)才能得出一個(gè)答案。
最后,人非常擅長計(jì)劃和規(guī)劃。而AI系統(tǒng)只是擅于捕捉目前的數(shù)據(jù),而不可能對(duì)未來做出一個(gè)長期的、有條不紊的規(guī)劃。
很多人在講“超級(jí)人類AI”,這類人一定沒有在AI領(lǐng)域工作過,他們根本就不知道AI領(lǐng)域中存在的技術(shù)問題有多難。
AI系統(tǒng)可以知道世界所有的城市、餐廳、電影院,然而它也只知道這些事實(shí)而已。
所以,我不相信所謂的“超級(jí)人類AI”,也不相信AI會(huì)比人更聰明。
人們覺得AlphaGo很厲害,是因?yàn)橛X得一般玩圍棋的人就很聰明了,那能打敗玩圍棋的人肯定更聰明。
這是有誤解的。人知道怎么還貸款,上什么學(xué)校,怎么和同伴做智慧交流,這些事都是AlphaGo做不到的。
其實(shí),AlphaGo只是通過無數(shù)對(duì)棋盤的模擬,非常機(jī)械地、不斷重復(fù)地復(fù)盤,十幾億、幾百億次地進(jìn)行學(xué)習(xí)。這背后沒有什么創(chuàng)造力,只是無數(shù)次的重復(fù)工作。
所謂的“智能”,是我們根據(jù)參數(shù)匯集起來的數(shù)據(jù)算法,它們只能復(fù)制、模仿、模擬人類的行動(dòng),而不是真正的智能。說到底,相比我們真實(shí)的世界,圍棋的復(fù)雜程度要低很多,因?yàn)檎鎸?shí)的世界充滿不確定性。
我覺得,有生之年不會(huì)出現(xiàn)這個(gè)奇點(diǎn)了。
傳統(tǒng)的機(jī)器人算法不能適應(yīng)未來
本節(jié)要點(diǎn)
傳統(tǒng)單一機(jī)器人的算法并不能應(yīng)用于未來的智能城市構(gòu)建;
甚至在今天,傳統(tǒng)的機(jī)器人問題也沒有得到很好的解決;
相比過去的工業(yè)革命,人工智能帶來的事業(yè)浪潮將會(huì)比過去進(jìn)程快三倍;
那么,什么是值得大家擔(dān)心的呢?
我前面講到,所謂的超人類智能系統(tǒng),我們是不應(yīng)該擔(dān)心的。而正好相反的是,看似智能,實(shí)則不夠智能的這些系統(tǒng),卻是值得我們警惕的。
很多媒體提到AI的時(shí)候,講到的是視覺、語音的方面。但我們未來涉及到城市規(guī)劃、推薦系統(tǒng)、醫(yī)學(xué)診斷等,都不再是傳統(tǒng)單一機(jī)器人的問題。
這是完全不同類型的問題。
一個(gè)機(jī)器人的某一錯(cuò)誤我們是可以控制的。比如,機(jī)器人走到舞臺(tái)邊緣,探測(cè)到下面將有一個(gè)高度落差,它會(huì)知道停下來。
但如果是一系列問題呢?又或者,是很多機(jī)器人一起呢?
如果大樓發(fā)生火災(zāi),這個(gè)機(jī)器人就不會(huì)知道該怎樣逃出去。因?yàn)?,這是一系列的決策,涉及到你從哪里轉(zhuǎn)移到哪里,還需要和其他人的合作。
比如,大家都從同一個(gè)逃生通道出逃,就會(huì)出現(xiàn)堵塞,那么,就要選擇換其他的道路。在這種情況下,機(jī)器人是做不到的,這樣的算法是非常難的。
如果你用過去傳統(tǒng)的機(jī)器人研發(fā)算法去應(yīng)用到城市規(guī)劃建設(shè)等領(lǐng)域,就會(huì)出現(xiàn)很多無法解決的重大問題:
NO.1:大規(guī)模多重相關(guān)決策的錯(cuò)誤控制
搜索引擎給你一個(gè)錯(cuò)誤的推薦建議,如果沒有人因此死亡,就不會(huì)出現(xiàn)什么大錯(cuò)漏。頂多你會(huì)覺得這個(gè)搜索引擎不好用,再換一個(gè)就完了。
但假設(shè)這個(gè)推薦是醫(yī)療診斷意見呢?如果這個(gè)意見出現(xiàn)錯(cuò)誤,那真的是會(huì)出人命的。而且,我們已經(jīng)看到這件事情的發(fā)生了。
即便是在金融服務(wù)領(lǐng)域,一旦出現(xiàn)錯(cuò)誤,也可能會(huì)引發(fā)市場(chǎng)的大動(dòng)蕩。交通也是如此,如果連公交走向都出現(xiàn)問題,就極有可能發(fā)生車輛碰撞,整個(gè)城市的交通陷入癱瘓。
因此,一旦擴(kuò)大到這些領(lǐng)域,我們就不能再以傳統(tǒng)應(yīng)用到單一機(jī)器人的算法去做這種大規(guī)模的事情,必須要有新算法。
但事實(shí)上,在這一點(diǎn)上,我們遠(yuǎn)未達(dá)到。目前,我們所沿用的思路都是比較傳統(tǒng)或通用的,并沒有意識(shí)到在這個(gè)層級(jí)上還需要做很多事情。
NO.2:如何在競(jìng)爭環(huán)境中共享數(shù)據(jù)
很多公司手握數(shù)據(jù),卻不愿與人分享。
假如,有一個(gè)黑客找出了新的辦法來騙錢,他針對(duì)了某一家公司A。那么,A公司就會(huì)從這次欺詐當(dāng)中學(xué)到新東西,可以未來避免同樣的情況。
但因?yàn)楫?dāng)初的攻擊只針對(duì)了A公司,其他的公司并不知道,因此也就不知道如何改進(jìn)自己的系統(tǒng)了。
表面上看,A公司只把這個(gè)技術(shù)掌握在自己手里,讓其他人學(xué)不到,這好像有點(diǎn)自私。因?yàn)?,他沒有從整個(gè)行業(yè)的角度去考慮問題。如果這家公司把這個(gè)數(shù)據(jù)分享給所有人,整個(gè)行業(yè)就可以一起改善這個(gè)算法。
但現(xiàn)在大家都不愿分享,其實(shí)一方面是技術(shù)原因,一方面也是法律的原因。
NO.3:大規(guī)模的云端互動(dòng)
大家都在談云計(jì)算,所有的東西都在云上,讓人們感覺到非常便利。
但這些智能設(shè)備,并不是云設(shè)備,而是端設(shè)備。
事實(shí)上,我們未來將要接觸的設(shè)備,都會(huì)是所謂的端設(shè)備,它們沒有時(shí)間將數(shù)據(jù)上傳到云中。如果你和機(jī)器人的每一次對(duì)話都要上傳到云,就會(huì)導(dǎo)致速度跟不上。
比如,汽車做智能,“我在這里到底要不要轉(zhuǎn)彎”這樣的問題,是不可能每一次都實(shí)時(shí)和云進(jìn)行交互的。
因此,要把端設(shè)備和云連接起來,還要實(shí)時(shí)交互,這兩者之間是存在極大挑戰(zhàn)的,我們現(xiàn)在也不知道該怎么做。
NO.4:如何實(shí)現(xiàn)公平,保證品質(zhì)、保持多元化
收集大量的數(shù)據(jù)并沒有問題,但這些數(shù)據(jù)是可能產(chǎn)生偏差的。
比如,你出于某種原因不喜歡某類人而沒有把他們納入你的樣本,但以這樣的樣本去做預(yù)測(cè)其結(jié)果本身就是存在偏差和偏見的。
NO.5:穩(wěn)健性和安全性問題
我們?cè)趫?bào)紙上經(jīng)常講到所謂的超級(jí)AI,發(fā)生了某種革命。
但請(qǐng)記住我今天講的話:很多技術(shù)還遠(yuǎn)遠(yuǎn)不能實(shí)現(xiàn),很多問題還有待解決。
比如,無人駕駛車怎樣確保在所有氣候條件下,在所有的路況前提上,每一臺(tái)車都可以保證安全駕駛呢?這其實(shí)也是一個(gè)極大的挑戰(zhàn)。
甚至在今天,傳統(tǒng)的單一機(jī)器人,也仍有很多問題沒有解決。
還有失業(yè)浪潮。每一次工業(yè)革命,都有很多人會(huì)因此失去工作。但值得注意的是,過去的失業(yè)浪潮是花費(fèi)三五十年完成的。但接下來,很多工作可能在5-10年內(nèi)就會(huì)被完全取代,這是一個(gè)新的趨勢(shì),貧富差距也會(huì)隨之進(jìn)一步拉大。
并且,人工智能可能會(huì)被居心叵測(cè)的人濫用。AI本身不存在邪惡與正義,主要還是看它被誰利用。比如,我們現(xiàn)在的網(wǎng)絡(luò)安全就是一個(gè)很嚴(yán)重的問題。
現(xiàn)階段人工智能的商機(jī)
本節(jié)要點(diǎn)
United Masters:用數(shù)據(jù)分析打造新市場(chǎng),換取新的商業(yè)模式;
Jibo:開放機(jī)器人學(xué)習(xí)的應(yīng)用平臺(tái),聚焦家庭;
螞蟻金服:應(yīng)用大數(shù)據(jù),連接客戶與商戶兩端。
我想向大家介紹三家公司,我也是這三家公司的科學(xué)顧問委員會(huì)的委員,因此有更多的信息分享。
United Masters
這家公司是專門做音樂作品的。
事實(shí)上,音樂市場(chǎng)在幾十年前是為幾十家大公司所控的,它們會(huì)簽幾個(gè)音樂歌手,然后在市場(chǎng)上大規(guī)模推廣。而作為消費(fèi)者,你沒什么選擇,也就那么幾個(gè)作曲家和歌手。
但你看現(xiàn)在的音樂市場(chǎng),已經(jīng)并非僅限于幾位少數(shù)的歌手了。在網(wǎng)上,有很多音樂人才,他們會(huì)在網(wǎng)上播放自己制作的音樂視頻,也會(huì)有越來越多的人聽他們的音樂。這和以前聽音樂的人數(shù)相比,達(dá)到了一個(gè)全新的數(shù)量級(jí)。
問題是,這些歌手沒有一個(gè)很大的商業(yè)市場(chǎng),在市場(chǎng)上最受歡迎的音樂,一般還是大公司做出來的。
United Masters的目標(biāo),就是希望有更多的人從事自己所喜歡的音樂創(chuàng)作,并可以以此為生。
這家公司怎么實(shí)現(xiàn)這一目標(biāo)呢?就是連接數(shù)據(jù),用數(shù)據(jù)分析。
比如一個(gè)年輕的音樂人,他寫了很好的歌,有幾萬名死忠粉。但其實(shí)他本人并不知道自己有這么多追隨者。
誰知道這個(gè)數(shù)據(jù)呢?網(wǎng)站,比如微信。
United Masters就會(huì)把這個(gè)數(shù)據(jù)拿過來,告訴這個(gè)歌手,你的粉絲有多少,分布在哪里,接下去可以做什么。比如,你可以去粉絲多的地方開演唱會(huì)。
而且,這家公司還會(huì)告訴你如何針對(duì)自己的粉絲去打造一些產(chǎn)品。
比如,有個(gè)粉絲要來這個(gè)歌手北京的現(xiàn)場(chǎng)演唱會(huì),那么,歌手可以給這個(gè)粉絲一個(gè)VIP后臺(tái)通行證,讓他可以到后臺(tái)見面。很多粉絲是很看重這種和偶像親密接觸的機(jī)會(huì)的。
所以,通過這些數(shù)據(jù)的匯總,就可以創(chuàng)造出盈利模式。只要有人對(duì)這些數(shù)據(jù)感興趣,就可以獲取這些數(shù)據(jù)。因此,慢慢地,這家公司的口碑就建立起來了。
這就是非常好的商業(yè)模式——通過一個(gè)小的數(shù)據(jù)交換。傳統(tǒng)的唱片公司對(duì)歌手的抽成要到85%以上,但對(duì)于UnitedMasters來說,它只抽10~15%,就打造了這樣一個(gè)全新的市場(chǎng)。
Jibo
這家公司做家庭機(jī)器人很多年了。未來10~20年,我們每個(gè)人家里可能都會(huì)出現(xiàn)一個(gè)家庭機(jī)器人。
目前,很多人還是把家庭機(jī)器人當(dāng)作玩具,它們?cè)诩依镒邅碜呷?huì)發(fā)出很有意思的聲音,但真正時(shí)候幫助到人們的生活,現(xiàn)在還是很少。但是,所謂的家庭助手或者家庭秘書,卻是不一樣的。
Jibo三年前推出了一個(gè)機(jī)器人,長得很像手機(jī)。但是它會(huì)跟隨你,像眼睛一樣看著你,給你拍照片。你可以對(duì)它說:Jibo,今天晚上我要在家里開派對(duì),你幫家里的人們拍照片好嗎?
Jibo就會(huì)給你拍照。它還會(huì)跟你說看這兒、看那兒,可以把整個(gè)派對(duì)的影像資料保留下來。
這聽上去是一個(gè)很有意思的應(yīng)用,但要把它打造成一個(gè)規(guī)模性的應(yīng)用還是很難。三年后,這家公司終于感覺找到了方向,推出了一款新的家用社交機(jī)器人。
這個(gè)機(jī)器人擁有電子眼睛、耳朵和聲音,可以捕捉照片、視頻通話,也可以做提醒、訂餐、發(fā)送郵件等這些輔助工作。它是一個(gè)開放式的平臺(tái),可以讓人們不斷開發(fā)新的應(yīng)用。
這和手機(jī)上的應(yīng)用是不同的。手機(jī)的應(yīng)用并非機(jī)器學(xué)習(xí)的應(yīng)用。但這中機(jī)器人的平臺(tái)應(yīng)用,會(huì)進(jìn)行適應(yīng)性的調(diào)整,進(jìn)行自我學(xué)習(xí)。
而Jibo肯定不是唯一一個(gè)往這個(gè)的方向努力的公司。
我相信可能在中國、日本也是會(huì)對(duì)這種機(jī)器人非常感興趣。
螞蟻金服
螞蟻金服在中國發(fā)展非常迅速,我現(xiàn)在是螞蟻金服科學(xué)智囊團(tuán)的主席。他們也是中國首家有這么一個(gè)科學(xué)智囊團(tuán)的組織,他們希望智囊團(tuán)可以幫助這家企業(yè)把握未來的方向。
這家公司比我所知道的任何一家西方公司成長都要快。
美國還是一個(gè)信用卡加現(xiàn)金的社會(huì)。盡管美國有一個(gè)Paypal,與支付寶有點(diǎn)類似,但是它的規(guī)模也不過是支付寶的十分之一,并且也不是所有人都在用。
也許是受益于中國沒有信用卡這個(gè)產(chǎn)業(yè)的束縛,使得支付寶一下子實(shí)現(xiàn)了移動(dòng)支付的巨量增長。螞蟻金服手握大量的數(shù)據(jù),它知道你買了什么,了解很多關(guān)于你的個(gè)人信息。
它使貸款變得前所未有的容易。這不是表面上你在手機(jī)上按一個(gè)鍵說“給我錢”這么簡單,其背后蘊(yùn)含著大量的機(jī)器學(xué)習(xí)。這涉及到機(jī)器學(xué)習(xí)中的“欺詐監(jiān)測(cè)”:如果你很簡單地讓人們貸到款,很多人是會(huì)來騙你的。
總結(jié):人工智能的商業(yè)模式,是要?jiǎng)?chuàng)造一個(gè)市場(chǎng),而非一個(gè)算法
傳統(tǒng)的推薦,都是針對(duì)個(gè)人。
但這里的問題是,如果有一家很好的餐廳,它被推薦給很多人,那么大家都跑到這家餐廳去,就需要排長隊(duì),人們的體驗(yàn)就會(huì)很糟糕,反過來給差評(píng)和抱怨。
如此,整個(gè)系統(tǒng)就開始崩潰,形成惡性循環(huán)。
你必須要去創(chuàng)造一個(gè)市場(chǎng),而非一個(gè)簡單的算法。
比如,在APP上面,不僅僅是向客戶推薦某一家餐廳。除了讓客戶看到自己附近有什么餐廳之外,你還要讓餐廳看到自己今晚可以供應(yīng)多少食材,我今天接了一場(chǎng)婚宴之后,還剩下多少個(gè)散客的位置。
甚至,你可以了解一下旁邊的競(jìng)爭對(duì)手餐廳,他們有沒有滿座。如果旁邊滿座了,那么對(duì)我而言就是一個(gè)機(jī)會(huì),我可以打折吸引更多的人流到的餐廳。
你要結(jié)合客戶和商戶兩端的需求。
這不僅是一個(gè)應(yīng)用的事情?,F(xiàn)在很多公司已經(jīng)著手在研究這方面的工作。當(dāng)然,這個(gè)過程要充分考慮人們不同的喜好和需求,要掌握大量的數(shù)據(jù)。