AI未來的發(fā)展速度會是怎樣的
掃描二維碼
隨時(shí)隨地手機(jī)看文章
一陣涼風(fēng)吹過人工智能,讓這個曾是燥熱的領(lǐng)域逐漸冷卻下來,留下的是扎實(shí)地在做研究的人、機(jī)構(gòu)、企業(yè)。先后在 NEC 公司中央研究所、微軟亞洲研究院、華為諾亞方舟實(shí)驗(yàn)室從事和領(lǐng)導(dǎo) AI 技術(shù)研發(fā),現(xiàn)任字節(jié)跳動人工智能實(shí)驗(yàn)室總監(jiān)的李航,就是一位 AI 技術(shù)的堅(jiān)實(shí)研究者和實(shí)踐者。
初遇“機(jī)器學(xué)習(xí)”,也曾有過懷疑
從事 AI 研究 30 多年,目前李航作為字節(jié)跳動人工智能實(shí)驗(yàn)室總監(jiān),負(fù)責(zé)領(lǐng)導(dǎo)AI 技術(shù)基礎(chǔ)研究和產(chǎn)品落地,主要集中在搜索、推薦、對話、問答、教育幾個領(lǐng)域。目前,李航投入主要的精力在產(chǎn)品研發(fā)上,但仍有一些精力放在基礎(chǔ)研究上。
例如在搜索領(lǐng)域,李航表示他們今年發(fā)表了一篇關(guān)于排序?qū)W習(xí)的論文,提出使用點(diǎn)擊數(shù)據(jù)訓(xùn)練搜索排序模型的新方法。因?yàn)辄c(diǎn)擊數(shù)據(jù)會有偏差,這個方法能自動做糾偏同時(shí)學(xué)習(xí)排序模型,在搜索中很有效。據(jù)悉,這項(xiàng)成果已經(jīng)用到了字節(jié)跳動的搜索引擎中。這項(xiàng)技術(shù)的成功為搜索引擎變成一個自學(xué)習(xí)的系統(tǒng)邁出了重要一步。
在字節(jié)跳動,李航的主攻方向還是自然語言處理、信息檢索、數(shù)據(jù)挖掘,認(rèn)為學(xué)術(shù)和落地兩者的結(jié)合至關(guān)重要。他認(rèn)為,把研究的成果應(yīng)用到產(chǎn)品,解決實(shí)際問題,同時(shí)把具有普世意義的成果,作為學(xué)術(shù)論文發(fā)表,在計(jì)算機(jī)領(lǐng)域這樣的工作很有價(jià)值。因此,他表示將不斷推動產(chǎn)品開發(fā)和學(xué)術(shù)研究,同時(shí)做好兩者之間的平衡。
對李航的現(xiàn)狀有所了解之后,我們不妨來了解一下,當(dāng)初是什么樣的契機(jī),讓他走上了 AI 研究的道路并一直堅(jiān)持到現(xiàn)在。相信這會讓有意進(jìn)入該領(lǐng)域,但是對于未來職業(yè)和人生規(guī)劃感到迷茫的年輕人受益匪淺。
1、京都大學(xué)留學(xué)開始“AI”生涯
李航回憶道,他最初與 AI “結(jié)緣”,是1988年,在日本京都大學(xué)留學(xué)的本科時(shí)期。當(dāng)時(shí),他最早做的兩個工作都是文本生成相關(guān)的。然而,彼時(shí)的主流技術(shù)并不是機(jī)器學(xué)習(xí),而是基于規(guī)則的方法。
讀本科時(shí),李航做了一個叫做 System Grammar(系統(tǒng)文法)的語言學(xué)框架,用它進(jìn)行中文生成;碩士期間,他研發(fā)了一個能夠根據(jù)不同需求生成多樣表達(dá)的系統(tǒng)。但值得一提的是,這兩個項(xiàng)目中使用的都是基于規(guī)則的方法。
他回憶道,其實(shí)到 90 年代初,機(jī)器學(xué)習(xí)才進(jìn)入到自然語言等領(lǐng)域,或者說在這些領(lǐng)域產(chǎn)生更大的影響,逐漸變成主流技術(shù)。但當(dāng)李航開始進(jìn)入這個行業(yè)時(shí),狀況并不是這樣,他也未曾想到,機(jī)器學(xué)習(xí)后來會給AI帶來翻天覆地的變化。
回首 90 年代初開始接觸機(jī)器學(xué)習(xí)時(shí)的經(jīng)歷,李航坦誠當(dāng)時(shí)內(nèi)心也有過一些懷疑,因?yàn)槿说恼Z言理解和生成機(jī)制與機(jī)器學(xué)習(xí)是完全不同,當(dāng)時(shí)整個業(yè)界都認(rèn)為應(yīng)該基于規(guī)則建立認(rèn)知模型,去做一些智能相關(guān)的任務(wù)。李航說,他的機(jī)器學(xué)習(xí)知識也都是從那時(shí)開始,通過自學(xué)獲取的。
“可以說,80 年代至 90 年代初,人們對人工智能的期待非常高,比如 80 年代日本有所謂的第五代計(jì)算機(jī)項(xiàng)目,那時(shí)人們覺得人工智能的實(shí)現(xiàn)應(yīng)該通過推理技術(shù),但后來發(fā)現(xiàn)那些路根本走不通。接著,在90 年代,人工智能進(jìn)入低谷期,當(dāng)時(shí)業(yè)界甚至都不愿意提及人工智能這個詞。相反地,更多的人把 AI 落到實(shí)處,用機(jī)器學(xué)習(xí)去做簡單的事情?!痹诶詈降难壑?,90 年代的AI從業(yè)者和研究者,是一群務(wù)實(shí)的人。
2、務(wù)實(shí)的 90年代
李航以他自己的親身經(jīng)歷,講解了 90 年代那群“務(wù)實(shí)”的人。他最早接觸的機(jī)器學(xué)習(xí)算法是決策樹,叫做 ID3,這個算法其實(shí)只能做一些簡單的事情。再如,基于神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別,也是一個典型的例子。
李航認(rèn)為,這些事情都比較簡單,聽起來也沒有那么智能,但是當(dāng)時(shí)人們更多地是在腳踏實(shí)地做一些實(shí)際的事情,沒有過多考慮智能。所以,從 90 年代到本世紀(jì)初的10年,在大約 20 年的時(shí)間里,關(guān)于人工智能的談?wù)摬⒉欢?,更多的是用機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘去解決實(shí)際問題。
2012 年左右,深度學(xué)習(xí)開始火起來。而實(shí)際上,2012-2014年,最火的詞匯還不是人工智能,是大數(shù)據(jù)。直到 2015年 Alpha Go 橫空出世,人工智能這個詞才又一次完全火爆起來。所以說,業(yè)界在不斷發(fā)生變化,技術(shù)在演進(jìn),大家的關(guān)注點(diǎn)和期待,也在隨之改變。
新書再版,增加深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)
接著,我們的話題轉(zhuǎn)到了李航最近的《統(tǒng)計(jì)學(xué)習(xí)方法》第二版。這一次,作者在新版本中加入了無監(jiān)督學(xué)習(xí)相關(guān)內(nèi)容。為什么要增加這一部分內(nèi)容?未來這本書還會有哪些變動?
李航指出,無監(jiān)督學(xué)習(xí)有若干個不同的定義,《統(tǒng)計(jì)學(xué)習(xí)方法》第二版新增的無監(jiān)督學(xué)習(xí)內(nèi)容主要是傳統(tǒng)機(jī)器學(xué)習(xí)中的無監(jiān)督學(xué)習(xí),與Hinton等人最近說的深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)不盡相同。他認(rèn)為無監(jiān)督學(xué)習(xí)確實(shí)是深度學(xué)習(xí)未來發(fā)展的重要方向,有望讓機(jī)器變得更加智能化,像人一樣使用語言,比如,自然語言處理領(lǐng)域的BERT 之所以可以發(fā)揮巨大的威力,根本原因在于它做了很好的預(yù)訓(xùn)練,就是無監(jiān)督學(xué)習(xí)。Hinton 所謂的無監(jiān)督學(xué)習(xí)是深度學(xué)習(xí)的未來,是指類似于 BERT這樣的預(yù)訓(xùn)練方法。從這個意義上來說,無監(jiān)督學(xué)習(xí)非常重要。
李航表示,因?yàn)檫@本書是在業(yè)余時(shí)間寫作的,因此耗費(fèi)時(shí)間較長,第一版花了七年,第二版花了六年時(shí)間。2012 年《統(tǒng)計(jì)學(xué)習(xí)方法》第一版出版時(shí)正值深度學(xué)習(xí)初火,當(dāng)時(shí)他曾有意加入一些神經(jīng)網(wǎng)絡(luò)的內(nèi)容,但是擔(dān)心時(shí)間拖得太久故作罷,所以第一版只對傳統(tǒng)機(jī)器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)的主要方法做了介紹。
本來,李航計(jì)劃再加上無監(jiān)督學(xué)習(xí)的內(nèi)容就結(jié)束本書,但是出版之后受到讀者的歡迎,這使他備受鼓舞,很多人希望再加上深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí),可以看到全新的,沿襲本書簡潔和重點(diǎn)突出風(fēng)格的內(nèi)容。所以,李航計(jì)劃為這本書增加深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí),希望可以覆蓋所有機(jī)器學(xué)習(xí)常用的方法,幫助讀者更好更快地掌握機(jī)器學(xué)習(xí)技術(shù)。然而,再出新版的時(shí)間不能確定,也許要幾年之后。
李航特別指出,這本書的定位并非入門書籍,不一定適合入門者,因?yàn)殡m然該書的內(nèi)容都是最基本的,沒有一定的統(tǒng)計(jì)概率知識和其他相關(guān)基礎(chǔ)知識,學(xué)起來可能有點(diǎn)吃力。他希望,這本書能成為一本字典一樣的書籍,讓大家能夠反復(fù)研讀,經(jīng)常使用。
對人工智能的洞察與前瞻
回顧人工智能的發(fā)展歷史,每一個階段都有會因?yàn)橐恍┘夹g(shù)突破使得領(lǐng)域的發(fā)展曲線升向新的高峰,取得巨大進(jìn)展。近年來,人工智能領(lǐng)域的的一些新技術(shù),或者新思路,比如深度強(qiáng)化學(xué)習(xí)、圖神經(jīng)網(wǎng)絡(luò)、通用人工智能、神經(jīng)符號處理等引起了業(yè)界的矚目,大家對這些新詞匯或新技術(shù)寄予厚望,希望能讓這個領(lǐng)域發(fā)生更多的奇跡。然而,每每被冠以“突破性”的技術(shù),產(chǎn)生的影響果真的有這么大嗎?李航憑借 多年的研究經(jīng)驗(yàn),給出了他的看法。
1、強(qiáng)化學(xué)習(xí)比監(jiān)督學(xué)習(xí)更需要數(shù)據(jù)
李航曾表示,構(gòu)建一個復(fù)雜的智能系統(tǒng),原理上需要從“身體“入手,讓智能系統(tǒng)在與環(huán)境的互動中進(jìn)行學(xué)習(xí),而強(qiáng)化學(xué)習(xí)是實(shí)現(xiàn)這一目標(biāo)的有效手段。深度強(qiáng)化學(xué)習(xí)應(yīng)用到真實(shí)環(huán)境中有什么樣的優(yōu)勢?深度強(qiáng)化學(xué)習(xí)在智能系統(tǒng)的學(xué)習(xí)過程中會起到什么樣的作用?
深度強(qiáng)化學(xué)習(xí)是把深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)結(jié)合起來,用深度學(xué)習(xí)學(xué)習(xí)強(qiáng)化學(xué)習(xí)模型,所以深度強(qiáng)化學(xué)習(xí)本質(zhì)上還是強(qiáng)化學(xué)習(xí)。
李航表示,當(dāng)智能系統(tǒng)學(xué)習(xí)做一些相對簡單任務(wù)時(shí),可以使用監(jiān)督學(xué)習(xí),監(jiān)督學(xué)習(xí)技術(shù)已經(jīng)比較成熟和實(shí)用,但代價(jià)是要用很多標(biāo)注數(shù)據(jù)。相比,強(qiáng)化學(xué)習(xí)可以適用于讓智能系統(tǒng)學(xué)習(xí)做更加復(fù)雜的任務(wù)。所以,從這種意義上來說,強(qiáng)化學(xué)習(xí)未來很有前景。
強(qiáng)化學(xué)習(xí)未來發(fā)展前景廣大,但當(dāng)前卻面臨著一個巨大的挑戰(zhàn),即強(qiáng)化學(xué)習(xí)從某種意義上比監(jiān)督學(xué)習(xí)更需要大數(shù)據(jù),數(shù)據(jù)成為當(dāng)前強(qiáng)化學(xué)習(xí)發(fā)展的最大瓶頸??梢韵胂螅磥?u>5G、物聯(lián)網(wǎng)等技術(shù)的發(fā)展會帶來更多的數(shù)據(jù),可能強(qiáng)化學(xué)習(xí)之后會獲得更大的發(fā)展。所以,強(qiáng)化學(xué)習(xí)是大家都很看好的一個方向。
2、機(jī)器學(xué)習(xí)做不到和人一樣觸類旁通
目前,統(tǒng)計(jì)學(xué)習(xí)是機(jī)器學(xué)習(xí)的主流,但是統(tǒng)計(jì)學(xué)習(xí)還做不到和人一樣的觸類旁通,自學(xué)知識,達(dá)到人的學(xué)習(xí)能力。統(tǒng)計(jì)學(xué)習(xí)在機(jī)器學(xué)習(xí)中起到什么作用?機(jī)器如何才能獲得人的學(xué)習(xí)能力?
對于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)目前取得的一些成果,李航認(rèn)為應(yīng)理性看待,“這讓大家有一種錯覺,認(rèn)為機(jī)器已經(jīng)非常接近人,但實(shí)際上差得還很遠(yuǎn),這是因?yàn)槿祟悓W(xué)習(xí)和機(jī)器學(xué)習(xí)具有完全不同的機(jī)制。人天然具有三個最重要的學(xué)習(xí)能力,即記憶能力、泛化能力、聯(lián)想能力,在機(jī)器上實(shí)現(xiàn)同樣的學(xué)習(xí)能力還有很多困難。特別是現(xiàn)在人的學(xué)習(xí)的具體機(jī)理還不是很清楚?!?/p>
3、人的思考機(jī)制與機(jī)器本質(zhì)上不同
那么,有沒有一種方法能夠讓機(jī)器做到和人一樣觸類旁通呢?李航認(rèn)為還看不到這種可能,要想機(jī)器學(xué)習(xí)做到像人類一樣觸類旁通非常難,做到這一點(diǎn)還需要漫長的時(shí)間,至于是多久,他也無法給出準(zhǔn)確的估計(jì)。
為什么機(jī)器無法和人一樣觸類旁通?這要從人的學(xué)習(xí)機(jī)制來看。一言以蔽之:人與機(jī)器的學(xué)習(xí)在本質(zhì)上是完全不同的。
李航講到,人和動物天然具有記憶和泛化能力,這其實(shí)是在做概念的存儲和抽象。比如,老鼠吃了一次讓它中毒的食物,就能認(rèn)識到這種食物不能吃,下次看到同樣的有毒食物就不會再去碰它。也就是說,只用了一個樣本就把有毒食物的特點(diǎn),如顏色和氣味學(xué)到了(記憶了)。在這個過程中,老鼠做了抽象,因?yàn)槭澄锏膫€體都不是完全一樣的,老鼠能區(qū)分哪些東西屬于同類。這些能力都是老鼠生來具有的,有很充分理由相信,人也具有同樣的能力。
此外,人還具有一項(xiàng)重要的能力,它在人的學(xué)習(xí)或概念形成、推理、語言使用中起到最根本的作用,那就是聯(lián)想。聯(lián)想是什么?李航用一個簡單的例子來做了說明,比如現(xiàn)在你看到一瓶水,你可能會聯(lián)想到你昨晚也喝過這種水,或者它的生產(chǎn)廠家等。人的經(jīng)歷不同、場景不同,聯(lián)想的內(nèi)容也不同。人時(shí)時(shí)刻刻都會做聯(lián)想,所以人的思考其實(shí)很大部分都是在找到相關(guān)的記憶。計(jì)算機(jī)做檢索的過程其實(shí)也是在聯(lián)想。我們產(chǎn)生新的概念、做創(chuàng)造發(fā)明、學(xué)習(xí)新知識等常常也是在做聯(lián)想。即記憶的機(jī)制就是聯(lián)想,發(fā)明創(chuàng)造的機(jī)制也是聯(lián)想。
所以,人的這種最基本的思考機(jī)制是記憶、泛化、聯(lián)想→學(xué)到知識。
但是,機(jī)器學(xué)習(xí)目前完全是基于統(tǒng)計(jì),即依靠數(shù)據(jù)。李航表示,他的書之所以命名為《統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法》,是為了強(qiáng)調(diào)理論和統(tǒng)計(jì)的重要性,因?yàn)樵谒恼J(rèn)知里,機(jī)器學(xué)習(xí)基本上約等于統(tǒng)計(jì)機(jī)器學(xué)習(xí)或統(tǒng)計(jì)學(xué)習(xí),這也是目前業(yè)界的共識。未來也有可能出現(xiàn)其他的機(jī)器學(xué)習(xí)方法,但至少目前來說機(jī)器學(xué)習(xí)就是約等于統(tǒng)計(jì)學(xué)習(xí)。
統(tǒng)計(jì)機(jī)器學(xué)習(xí)最核心的想法,就是從大量數(shù)據(jù)中找到統(tǒng)計(jì)規(guī)律。即使是深度學(xué)習(xí),本質(zhì)上也是統(tǒng)計(jì)學(xué)習(xí),用復(fù)雜的訓(xùn)練神經(jīng)網(wǎng)絡(luò),表示找到的復(fù)雜的統(tǒng)計(jì)規(guī)律,去做一些看似智能,但本質(zhì)上和人的智能機(jī)制不同的事情。
因此,機(jī)器學(xué)習(xí)與人類學(xué)習(xí)的本質(zhì)完全不同,所以讓機(jī)器達(dá)到與人一樣觸類旁通非常難。
4、圖神經(jīng)網(wǎng)絡(luò)重要,但其作用不應(yīng)被夸大
近年,圖神經(jīng)網(wǎng)絡(luò)(GNN)的研究火了起來。這是因?yàn)樯疃葘W(xué)習(xí)雖然進(jìn)展迅猛,但是卻有著無法進(jìn)行推理的缺陷,而基于圖的深度學(xué)習(xí)將端到端學(xué)習(xí)和歸納推理結(jié)合起來,使模型兼有表示能力和推理能力,被有些人視為未來智能技術(shù)突破的關(guān)鍵。
對此,李航表示,圖神經(jīng)網(wǎng)絡(luò)是很重要的技術(shù),但其作用不應(yīng)該被夸大。
深度學(xué)習(xí),從最基本的深度神經(jīng)網(wǎng)絡(luò) ,發(fā)展到CNN,之后又出現(xiàn)了幾次重大突破,如 GAN、自然語言處理領(lǐng)域的 BERT 等,圖神經(jīng)網(wǎng)絡(luò)也屬于這樣的重大突破。從這個意義上來說,圖神經(jīng)網(wǎng)絡(luò),GNN是一個重要方向,也是一個大的突破口,很多人在做相關(guān)研究,包括字節(jié)跳動。
然而,李航認(rèn)為,GNN 的特點(diǎn)在于通常以圖數(shù)據(jù)為輸入,利用圖上各個節(jié)點(diǎn)之間的關(guān)系,學(xué)習(xí)更加復(fù)雜的模式,做智能性的判斷和簡單推理。這種意義上它是一個強(qiáng)大的工具,目前在很多應(yīng)用中已經(jīng)得到了很好的結(jié)果,未來還有很大的發(fā)展前景,值得深入研究。但是實(shí)現(xiàn)智能的一些關(guān)鍵問題,僅靠GNN還不能解決。它是未來重要的研究方向,但并非唯一方向。
“人類研究人工智能這么多年,苦于不知道如何把自己的知識告訴計(jì)算機(jī),以實(shí)現(xiàn)人類智能,GNN并沒有本質(zhì)解決這個問題 ,單靠GNN實(shí)現(xiàn)人類智能,我認(rèn)為不現(xiàn)實(shí)?!崩詈秸f道。
5、符號處理+神經(jīng)處理、多模態(tài)讓機(jī)器更加智能
上面討論了一些機(jī)器學(xué)習(xí)領(lǐng)域很重要的技術(shù),但是顯然每一項(xiàng)技術(shù)單獨(dú)來看都有局限性,無法單純依靠某種技術(shù)實(shí)現(xiàn)人的智能。那么問題來了,如何才能讓機(jī)器變得更加智能呢?我們至少需要一些思路。
李航認(rèn)為,要實(shí)現(xiàn)人工智能,需要解決的一個重要問題是把符號處理與神經(jīng)處理結(jié)合起來。
他首先解釋了大腦的思考機(jī)制。人類的智能有兩個層面,一個層面是人的大腦,是一個包含 1000 億神經(jīng)元,1000萬億聯(lián)接的復(fù)雜神經(jīng)網(wǎng)絡(luò)。這個網(wǎng)絡(luò)每個時(shí)刻都處于不同的狀態(tài),信號在網(wǎng)絡(luò)中傳輸,網(wǎng)絡(luò)狀態(tài)發(fā)生變化。人工神經(jīng)網(wǎng)絡(luò)一定程度上與人腦神經(jīng)網(wǎng)絡(luò)相似,比如兩者都是在網(wǎng)絡(luò)結(jié)構(gòu)中引入一些輸入,做各種變換,之后產(chǎn)生一些輸出?,F(xiàn)在,深度學(xué)習(xí)中是用向量、矩陣或張量進(jìn)行神經(jīng)表示。但是,人工神經(jīng)網(wǎng)絡(luò)比人腦簡單得多。
另外一個是意識層面,即人類做推理、理解語言、使用知識的層面,意識層面的東西大致可以用符號表示,對應(yīng)著計(jì)算機(jī)的符號處理。但這方面的機(jī)制,我們并不十分清楚,腦科學(xué)和認(rèn)知科學(xué)有一些假說。人腦中,意識層面的符號處理和腦層面(下意識層面)的神經(jīng)處理是如何結(jié)合的還完全不清楚。
但是,看來要推進(jìn)機(jī)器使用人類語言的能力,即自然語言處理能力,可能需要神經(jīng)符號處理,就是把神經(jīng)處理和符號處理兩者結(jié)合起來,這樣才能使機(jī)器更接近人。
另一個重要問題,多模態(tài)技術(shù)也是實(shí)現(xiàn)人工智能的關(guān)鍵技術(shù)。近年來也引起了大家廣泛關(guān)注。
李航對此表示認(rèn)同,他講道,人的智能中的模態(tài)其實(shí)并沒有明確的劃分,人思考時(shí)大部分情況下都是在進(jìn)行一種多模態(tài)“處理”,結(jié)合了視覺、聽覺、觸覺、味覺等各種模態(tài)。未來,相信隨著數(shù)據(jù)的增多,計(jì)算能力的增大,多模態(tài)技術(shù)將能夠做到更多,有望成為AI技術(shù)的一個突破口。
另一個重要問題是Hinton等所說的無監(jiān)督學(xué)習(xí),這里不在重復(fù)。
6、通用人工智能展望
實(shí)現(xiàn)通用人工智能,是人工智能領(lǐng)域的終極目標(biāo)。李航在 2016 年的一次采訪中曾預(yù)測,通用人工智能可能要 500 年才能實(shí)現(xiàn),但或許永遠(yuǎn)都不可能實(shí)現(xiàn)。時(shí)隔三年,隨著人工智能領(lǐng)域的進(jìn)一步發(fā)展,李航的觀點(diǎn)有改變嗎?
“我不太喜歡用強(qiáng)人工智能、弱人工智能、通用人工智能的說法,因?yàn)檫@幾個概念都沒有嚴(yán)格的定義,很多時(shí)候大家說的并不是同一個東西。但是AI領(lǐng)域會不斷發(fā)展,機(jī)器智能的水平會不斷提高,這一點(diǎn)是不容置疑的。當(dāng)時(shí),被記者要求一定要說個數(shù)字,就隨便說需要500年才能實(shí)現(xiàn)通用人工智能,其實(shí)沒有科學(xué)的依據(jù)?!崩詈秸f道。
所謂的通用人工智能還是很遙遠(yuǎn)的。比如,機(jī)器很難具備常識和情感,即使是簡單的常識性推理對于機(jī)器來說也是一道很難跨越的門檻,更不用說具有情感的機(jī)器。而這些都是人類智能的一部分。
面向未來,李航預(yù)測,從功能主義的角度來說,今后有相當(dāng)長一段時(shí)間,瞄著實(shí)現(xiàn)合理行動的機(jī)器、合理思考的機(jī)器,把符號處理和神經(jīng)處理結(jié)合起來,加上無監(jiān)督學(xué)習(xí)、多模態(tài)等技術(shù),可以讓系統(tǒng)的智能程度上升好幾個臺階,但是它最核心的可能還是機(jī)器學(xué)習(xí),未來 50年,我們?nèi)栽谑褂眠@些最基本的技術(shù),看來這個概率最大。
從另外的思路來看,常識推理、因果推斷等也是一些重要的研究方向,希望它們能和機(jī)器學(xué)習(xí)結(jié)合起來??梢灶A(yù)見,合理行動、合理思考的機(jī)器會根據(jù)不同的場景需求,組合衍生出各種各樣的智能系統(tǒng)和智能工具。
7、未來若干年,很有可能AI發(fā)展將會慢一些,突破會少一些
當(dāng)然,李航談?wù)摿怂麑τ跈C(jī)器學(xué)習(xí)發(fā)展的看法。他說道,就像人的智能發(fā)育是一個漫長的過程一樣,機(jī)器智能的構(gòu)建也需要漫長的積累。人雖然自出生的那一刻起就具備了基本的認(rèn)知和感知的能力,但是后天成長中也需要漫長的學(xué)習(xí)過程,不斷積累才擁有了各種知識,具備了各種能力。
雖然李航認(rèn)為機(jī)器學(xué)習(xí)的發(fā)展距離人的智能還有相當(dāng)大的距離,但有幾件事情是可以預(yù)見的:機(jī)器最強(qiáng)大能力就是計(jì)算和存儲,過去 30 年,計(jì)算的速度、存儲的容量、通訊的速度都提升了 100 萬倍,未來 30 年、100年、500 年以后仍會飛速增長。如果我們能讓機(jī)器很好地利用大數(shù)據(jù)和大算力,進(jìn)行自主學(xué)習(xí),這在將來帶來革命性的變化。
“我的感受是人工智能研究其實(shí)需要長時(shí)間的積累,2012 年到 2018 年這段時(shí)間有很大的突破, 大家的期待特別高,以為今后一直會同樣高歌猛進(jìn)。然而事實(shí)并不是這樣,大部分研究實(shí)際上都是需要不斷積累,緩慢進(jìn)步,不斷發(fā)展的。包括深度學(xué)習(xí)大師 Yoshua Bengio 最近也在說,人工智能技術(shù)研究需要長期積累,我對他這句話的解讀是,人工智能的發(fā)展也是有高峰和低谷的,我們不會永遠(yuǎn)處于高峰。未來若干年,概率最大的可能性是,人工智能相對前幾年發(fā)展會緩慢一些,新的突破會少一些,但是還是會不斷進(jìn)步。未來還有更多有挑戰(zhàn)性的問題,需要大家不斷克服,持續(xù)積累,對于 AI,我們要有一個正確的期待?!?/p>
來源:DataWhale