按:在采訪Tom Mitchell前,編輯告訴他,目前媒體少有報道您的個人經(jīng)歷,這次的采訪我們希望能多聊一些您在不同的時間點何以做出當時的抉擇。
當Tom Mitchell看到編輯給的采訪提綱時,他立馬笑了,他說,“關于我為什么在本科和博士期間都拿的是電子工程的學位,這是一件有趣的事情”。
Tom Mitchell,他是全球公認的機器學習教父,在全球人工智能實力排名第一的卡耐基梅隆大學(以下簡稱CMU)創(chuàng)辦了人類歷史上的第一個機器學習系并擔任系主任;他的經(jīng)典著作《機器學習:一種人工智能方法》被認為是行業(yè)圣經(jīng),銷量驚人;他創(chuàng)辦了美國《Machine Learning》雜志、國際機器學習年度會議(ICML),他的學術論文專著超過130篇;他擁有眾多閃亮的頭銜:CMU計算機科學學院機器學習系主任、教授,美國工程院院士,美國科學進展學會(AAAS)成員,人工智能進展學會(AAAI)成員。
這篇對話實錄,將呈現(xiàn)更多大家所不知道的Tom Mitchell:
他在CMU讀本科時,第一年主修數(shù)學,第二年變成了管理學,第三年是物理,第四年又成了電子工程,換了四次專業(yè),只因為不知道想學什么;
他最終拿到了MIT電氣工程學位博士,但是卻去羅格斯大學當計算機系助理教授和副教授,而后在CMU任計算機系教授,迄今為止都沒有計算機領域?qū)W位;
他在研究生期間開始對人類智力感興趣,在研究人類大腦和嘗試模擬人類大腦之間選擇了后者;
當上世紀90年代,腦影像技術出現(xiàn)后,他開始進行人工智能與人腦的交叉研究;
他認為AI是一個整體,不應該被細分為計算機視覺、語音識別、自然語言處理,應該以整體的方式去學習;
他目前正致力于Conversational Learning項目,讓機器從自然會話中學習如何編程;
在他看來,AI專業(yè)成為熱門一方面是大家的理性選擇,另一方面也有炒作過度,未來量子計算或?qū)⒈華I更火。
本科換四次專業(yè),不尋常的學生
“我進入麻省理工讀本科時,第一年主修數(shù)學,第二年變成了管理學,第三年是物理,第四年又成了電子工程。我每一年都在換專業(yè),因為我還沒想好要學什么?!?/p>
1951年,Mitchell出生于賓夕法尼亞的布洛斯堡,在紐約度過童年。1973年,他在麻省理工學院獲得電子工程學士學位,1979年獲得斯坦福大學電氣工程博士學位,輔修計算機科學。1978年,Mitchell在羅格斯大學開始教學生涯,擔任計算機系助理和副教授職位,1986年,Mitchell加入CMU成為一名計算機系教授。他的研究領域包括機器學習、人工智能、認知神經(jīng)科學等領域。
:第一個問題,您的本科和博士專業(yè)是電子工程,當時為什么要選擇這個專業(yè)?
Tom Mitchell:好吧,這是一件有趣的事情。事實上是因為,我當時不知道自己應該選什么專業(yè)。我進入麻省理工讀本科時,第一年主修數(shù)學,第二年變成了管理學,第三年是物理,第四年又成了電子工程。我每一年都在換專業(yè),因為我還沒想好要學什么。后來我去斯坦福讀研究生,主修晶體管設計,成了一名電子工程師。但我又改變了主意,參加了計算機課程,就因為我覺得這個專業(yè)更好玩。后來我拿到了電子工程的博士學位。但這只是一個意外,因為雖然我身在電子工程系,但我決定去學AI。我的確這么做了。不過,我目前拿到的仍然只有電子工程專業(yè)的學位。
:這是因為麻省理工允許你換專業(yè),對此其他老師沒有意見嗎?
Tom Mitchell:他們認為這種現(xiàn)象很反常,但還是同意了我換專業(yè)的要求。最后,我修了電氣工程專業(yè)畢業(yè)所需的課程。
:您曾經(jīng)對頻繁更換專業(yè)感到厭煩嗎?
Tom Mitchell:不,我覺得很有趣。那時我真的不知道我想做什么,所以我嘗試了不同的領域。但事實是我對智力(intelligence)感興趣,我也想過學心理學。但我沒有去學心理學,因為在我考慮這個問題的時候,心理學領域還沒有辦法研究人類的智慧。我不認為心理學家或者是其他人能研究人類智力,因為當時還沒有“腦影像”(brain imaging)。
所以我就在想,他們甚至都沒有示波器這種衡量工具。我接受不了。這種研究方法不行。這太浪費時間了,這種方法不可取。但之后,我又對人工智能產(chǎn)生了興趣,因為如果你想學習智力方面的東西,你有兩個選擇,你可以研究人類的大腦,也可以嘗試模擬人類的大腦。而當時似乎沒有可以研究人類智力的設備,所以我決定走模擬人腦這條路。之后,腦成像終于在90年代末橫空出世,我就開始在那個時候研究起“腦影像”,就因為這種工具突然變成了現(xiàn)實。
:不過,Jordan和Hinton最開始對人工智能感興趣都是從心理學研究開始。
Tom Mitchell:他們比我更有勇氣,因為他們是在“腦影像”技術出現(xiàn)之前就在嘗試這種新事物。當時我認為這種研究不會有結(jié)果。所以我才選擇了創(chuàng)建智能程序這條路,但他們的確是勇氣可嘉。
:您從研究生開始學習機器學習,當時的契機是什么?這一學科在當時還不是那么火。
Tom Mitchell:我始終認為學習是智力中最有趣的部分,我現(xiàn)在還是這么想的。我想學習智力的同時也可以研究學習,這就是我的選擇。這就是我的研究動機。我在讀研究生的時候就開始研究這個方向了。在我讀研究生,去學晶體管設計之后,我決定改學機器學習,我的導師當時有一個研究項目要創(chuàng)建一個幫助藥劑師設計藥品的AI系統(tǒng)。他們研究的問題之一就是分析化學實驗中的數(shù)據(jù),也就是質(zhì)譜學,其原理是你將一些化學品放進機器中,讓它在與機器的碰撞中釋放能量,分裂成微粒。然后你再從中選擇場景以及你收集到的碎片。現(xiàn)在的問題就是,這實際上是質(zhì)譜學的研究。所以我就最終通過后續(xù)的應用完成了自己的論文。如果你將一個有機分子放入質(zhì)譜儀,就可以學到如何預測它的分裂之處,它的分裂方式。所以我們就掌握了一些有關化學的培訓數(shù)據(jù),以及它們的獲取方式,此時的機器學習問題就是關于預測分子分裂方式的監(jiān)測學習問題。
:您談到90年代末開始研究腦影像,這個領域您有什么成果呢?
Tom Mitchell:我從事大腦研究工作十五年了,研究領域包括通過大腦成像、FMRI 和 MEG 技術研究語言在大腦中的表征,包括大腦如何表征不同詞語的含義,像是電腦、朋友或椅子這些詞。我們一直在做這方面的研究,并且已經(jīng)在表征不同含義的神經(jīng)活動模式領域獲得新發(fā)現(xiàn)。事實上,我們發(fā)現(xiàn)每個人的大腦在這方面擁有非常相似的模式。如果我提到番茄,每個人大腦的反應模式其實是很相似的。在此之前,沒人發(fā)現(xiàn)這一點。我們發(fā)現(xiàn)了支持這些表征的系統(tǒng)原則,這樣一來我們就可以預測新詞。我們研發(fā)了一項電腦程序,對于你輸入的任何一個詞,它都能預測出這個詞的大腦模式。這些是我們的研究成果。
:你目前在做人工智能與人類大腦的交叉研究,請問人工智能采用的神經(jīng)網(wǎng)絡的工作原理與人腦思維方式的不同點是什么?
Tom Mitchell:我認為人工神經(jīng)網(wǎng)絡和生物神經(jīng)網(wǎng)絡主要有兩點不同。第一,在人工神經(jīng)網(wǎng)絡里,我們通過數(shù)字傳遞數(shù)量。但在真實大腦中,神經(jīng)元以不同的速率進行單個和成簇放電,這使得它與電腦神經(jīng)網(wǎng)絡十分不同。第二點不同是,在能夠識別圖像的卷積神經(jīng)網(wǎng)絡中,信息是從輸入層,即像素所在區(qū)域,有序地向外朝著最終答案流動的。但是如果你看一下大腦內(nèi)部以及大腦是如何理解圖像的,你會發(fā)現(xiàn)它對圖像的處理并不是前饋傳遞,在大腦中有信息從視覺皮層的兩個不同部分流出。但也有信息進行反向流動。大腦中的反饋循環(huán)會告訴像素級別的神經(jīng)元,鑒于這兩側(cè)有線經(jīng)過,所以這里也應該有一條線。因此,第二點不同是大腦中真正存在著反饋循環(huán),而在卷積神經(jīng)網(wǎng)絡中不存在。
:您從1978年開始在羅格斯大學擔任計算機系助理和副教授職位,當時是如何從電子工程系轉(zhuǎn)到計算機系的?
Tom Mitchell:這并不是一個很關鍵的問題。雖然我畢業(yè)時拿的是電子工程學位,但我在攻讀博士學位期間已經(jīng)在進修機器學習的課程了。所以,計算機科學系當然會承認我在這個學科上的教學能力。
當時還沒有出現(xiàn)機器學習的學位。如果有的話,當時我就會換成這個專業(yè),斯坦福大學應該會把這方面的研究納入計算機系而不是電子工程專業(yè)??上覜]換專業(yè)。
:您此前多次更換專業(yè),那么您攻讀博士學位時為什么沒有根據(jù)自己的想法換專業(yè)呢?
Tom Mitchell:你是說我為什么不讀計算機科學博士學位是嗎?原因?qū)嶋H上很簡單,你在斯坦福大學讀博士學位時,到了第二年就會面臨一些很嚴格的考試。你只有通過了這些考試,才能順利拿到學位。我當時參加并通過了電子工程專業(yè)的考試。后來我說我實際上想去計算機科學系,我想調(diào)劑專業(yè)。計算機科學系方面表示,你不能調(diào)劑,你得先提出申請,我們有可能接收你,之后你得參加我們的博士資格考試才算過關。然后我就說,好吧,我還是繼續(xù)呆在電子工程系好了。但我的博士導師是Bruce教授,他是計算機科學方面的專家。所以我雖然是電子工程專業(yè)的學生,但我也是計算機科學導師的弟子。
:那么您當時有多少導師呢?
Tom Mitchell:兩個,主要導師就是計算機科學系的Bruce教授。但因為我是電子工程專業(yè)的學生,所以我也有一個電子工程導師Bernie教授,他也是AI領域方面的先驅(qū)之一,因為他做過大量有關感知機的早期研究工作。
:您在本科和博士期間的學習經(jīng)歷在中國和中國的教育體制中幾乎無法復制。
Tom Mitchell:雖然我不知道這種情況。但在卡內(nèi)基梅隆大學和許多美國大學里,學生可以換專業(yè),有時候?qū)W生也會換導師,比如五個博士學生中就會有一人在某個階段跟一位導師,后來又換成其他導師,這種現(xiàn)象并不算罕見。
:您指導過中國學生嗎?
Tom Mitchell:我的學生來自五湖四海,當然也有中國學生,目前我?guī)ьI的中國學生是Fan Yang。我現(xiàn)在的學生不但有中國人,還有希臘人、羅馬尼亞人、美國人、加拿大人、斯洛文尼亞人,總之天南地北的學生都有。我很樂見這種現(xiàn)象,因為我認為一個富有創(chuàng)意的團隊就應該有不同的思想碰撞,集合不同的教育背景,畢竟不同國家的學生接受的教育也各不相同。將各種學生組合在一起,就形成了一個團隊。我們可以通過相互學習,互補長短。
:所以您認為中國學生有哪些不同于其他國家學生的特點嗎?
Tom Mitchell:可以這么說。這是個很廣泛的問題。我認識許多中國學生,所以我知道中國學生的類型并不單一。中國學生也有各種各樣的類型。但總體而言,我發(fā)現(xiàn)中國學生在進入卡內(nèi)基梅隆大學之前學習就非常用功,我也經(jīng)常在研究生院碰到他們。他們學習很努力,他們也清楚自己的基礎很扎實。我認為這是中國學生的特質(zhì)之一。
:我很想知道,您挑選學生的標準有哪些呢?
Tom Mitchell:我其實不便公開透露這一點,否則可能就會有人刻意迎合我的要求。實際上,不同教授的行事方式各不相同。我最看重的天賦是創(chuàng)造力。有些教授會挑成績最好的學生,或者發(fā)表論文數(shù)量最多的學生。但我不會這么做,我只會和對方走進教室,聊一些我們彼此可能都不太清楚的話題??纯次覀兙烤鼓芰亩嗑?。如果我們交流很順利,我覺得我們就可以共事。
ICML:從講習班到5000人大會
“可我們那時候從來沒有想到,機器學習會獲得商業(yè)上的成就。我們只是單純地覺得它是一個很有趣的智能問題?!?/p>
在加入CMU之前,Tom Mitchell就已經(jīng)頻繁來往于CMU組織ICML(國際機器學習大會),1980年,ICML第一次在CMU召開,從最初的幾十人發(fā)展到目前數(shù)千人參加的國際大會,ICML與NIPS一起,它是在機器學習和人工智能研究中影響最大的兩個主要會議之一。
:您是ICML創(chuàng)始人,并在1980年舉辦了首屆ICML學術會議,當時有哪些科學家同您一起推廣了這個會議?
Tom Mitchell:那次會議是在卡內(nèi)基梅隆大學舉辦的,當時也是我初次來到這所大學,因為那時候我還在羅杰斯大學教書。為了召開那次會議,我就去了卡內(nèi)基梅隆大學。當時還有另外兩名重要成員聯(lián)合組織了這場會議,我們一共是三人。一位是Jaime Carbonell,他現(xiàn)在仍然是卡內(nèi)基梅隆大學的教授。他當時已經(jīng)在這所大學任教了,所以我們才會在這里舉辦會議。另一位就是伊利諾伊大學教授Richard。我們?nèi)齻€人就在1980年聯(lián)合舉辦了這場會議。我記得當時的會場只比今天這個房間大一點點,一共有35人出席了會議。我現(xiàn)在還記得一些當時的出席人員。當最讓我印象深刻的人應該是John Anderson,因為John是一位研究人類學習模式,并據(jù)此創(chuàng)建計算機模型的心理學家。
我之前也提到了,我對人類智力很感興趣,但放棄了研究心理學,就是因為這一行沒有什么輔助研究的儀器。John Anderson在那次會議上的確讓我記憶猶新,因為他是一名研究學習與人類的心理學家。而且他取得了卓越的研究成果。他當時在創(chuàng)建可以展示電腦行為如何匹配人類行為的計算機模型。John今天仍然在這所大學的心理系任教。去年,我們還做出一項決定,讓他的團隊與我的團隊每個月碰面一次,相互交流思想。我很珍惜與他共事的機會,真的非常有收獲。
:您當時成立并推廣ICML的契機是什么?
Tom Mitchell:這么說吧。ICML其實是自發(fā)形成的。我們在卡內(nèi)基梅隆大學舉辦了首次會議,可能在兩年后我們就決定把它作為一個關于機器學習的講習班。當時我們沒有將它稱為國際會議。兩年之后的伊利諾伊大學召開了第二場會議,當時還是我們?nèi)藫谓M織者。后來我們開始每年召開一次,每年會議都出現(xiàn)了不少驚喜,會議規(guī)模也不斷擴大。又過了幾年,我們才決定將它稱為國際大會?,F(xiàn)在還保留著每年召開會議的傳統(tǒng)?,F(xiàn)在每年都有上千人參加這個會議。
:發(fā)展到現(xiàn)在,ICML2018的參會人數(shù)已經(jīng)超過5000人,這與您最初的設想是否一致?當時有想到這一會議會像如今這般火熱嗎?
Tom Mitchell:沒有,完全沒想到。我相信這個會議的參加者都想不到有這么一天。但我始終認為,機器學習在未來會成為計算機科學的中心,想想計算機科學的發(fā)展就很容易得出這個結(jié)論??傆幸惶?,我們不再需要手動編程,我們可以讓程序自己學習編程。我一直在設想它早期的運行方式,我始終認為這終將變成一種重要的應用。但我時常在想,我有生之年可能看不到這一天了。計算機科學可能需要經(jīng)歷幾百年才能發(fā)展到這個地步。希望它能夠以超乎我想象的速度,實現(xiàn)飛速發(fā)展。但在過去,我認為參加我們會議的人都認為,這種技術是一種學術人士才關注的最有趣的智能話題之一。
可我們那時候從來沒有想到,機器學習會獲得商業(yè)上的成就。我們只是單純地覺得它是一個很有趣的智能問題。
扛起CMU人工智能教育大旗
“我認為未來本科階段的機器學習,并不僅僅是針對AI專業(yè)的學生,而是一種許多技術領域的學生都應該掌握的默認數(shù)學知識?!?/p>
1986年加入CMU之后,Tom Mitchell一頭扎入了機器學習的學術研究和教育教學之中。1997年,Mitchell出版機器學習領域的第一本教科書,名為《機器學習》,是機器學習領域的奠基之作,被奉為第一代機器學習的圣經(jīng),是入門機器學習的必讀教材之一。2006年,他在CMU計算機科學學院創(chuàng)辦機器學習系,并成為第一任系主席。2010年,他因在機器學習領域杰出地位入選美國國家工程院院士。
今年秋天,CMU 成為美國首個提供人工智能本科學位的大學。從本科教育啟航培養(yǎng)AI人才,CMU的AI研究和AI教育都走在世界的先列。
:Michael Jordan在伯克利進行AI教學有一系列課程,包括「data 8」和connector 課程,CMU今年秋季也開始了AI 的本科課程,有哪些特色課程?現(xiàn)在報名情況如何?
Tom Mitchell:對于本科專業(yè),這學期我們剛剛迎來了新一屆的學生。在本科生階段,我們每年總共有200名本科生進入計算機科學系。他們讀完第一學年之后可以選擇主修AI專業(yè)或者傳統(tǒng)的計算機科學專業(yè),我們的目標是第一年招收10%的AI學生。所以我們的目標是招收20名學生。這也大概就是我們可能會招到的學生數(shù)量。我們現(xiàn)在正在教授其它課程。
這還只是第一學年,我認為我們的課程值得稱道的一點就是,我們會教授機器學習方面的內(nèi)容。這本來是大二時才會傳授的課程。而且我認為這是很正確的事情,因為我認為未來本科階段的機器學習,并不僅僅是針對AI專業(yè)的學生,而是一種許多技術領域的學生都應該掌握的默認數(shù)學知識。我在讀工程學本科專業(yè)時,也學了微積分學,因為我認為這個學科很重要,我很高興自己做了這個選擇。它是工程學的數(shù)學。
微積分仍然是一門很有價值的課程。但我認為統(tǒng)計學可能會成為更有價值的學科。即便如此,對今天的多數(shù)本科生來說,微積分都是一門重要的學科,因為經(jīng)驗數(shù)據(jù)分析會成為未來各個職業(yè)的重要部分,而這種分析就離不開微積分。不過也不盡然,除非你是工程學專業(yè)的學生。
:那么設定10%的招生率,就是為了控制學生的規(guī)模是嗎?
Tom Mitchell:我們想先從少數(shù)學生入手,可能只有兩名學生,因為像研究生二年級的機器學習一樣的新本科課程真的是太多了。所以我們希望先在周末時進行小班授課,我們在發(fā)展這個課程期間最好保持良好的教師與學生比例。之后,我想我們的招生比例就會顯著超過10%。
:如何挑選這10%的學生呢?
Tom Mitchell:這個也是我們目前討論的問題,我們卡內(nèi)基梅隆大學推出了很嚴格的入學要求。但只要學生能夠考入計算機科學的本科專業(yè),我們就允許他們選擇AI或者計算機科學作為自己的專業(yè),我們認為如果招生超過20%,我們就得啟動篩選流程,但目前學生人數(shù)還沒超過這個比例,所以運行情況良好。我們也不需要對其進行管理,目前教學秩序正常。
AI不應該被劃分成不同技術
“我沒有想過,也不認為AI可以劃分成許多不同的板塊。我不可能推薦學生去專修哪個領域的內(nèi)容。如果非要推薦的話,我會建議他們涉獵所有相關知識,吃透這些內(nèi)容后再將其結(jié)合在一起?!?/p>
:卡內(nèi)基梅隆大學的教授和學生最關注哪種AI技術?
Tom Mitchell:我沒有想過,也不認為AI可以劃分成許多不同的板塊。我和自己的學生交流時,我會盡量不去建議他們專修哪種技術、深層網(wǎng)絡、自然語言理解或者類似的東西。因為我認為未來的AI,甚至是當前的AI(但未來趨勢會更明顯),會以我們還沒有開發(fā)的做法來整合、結(jié)合我們不同的方法。所以我不可能推薦學生去專修哪個領域的內(nèi)容。如果非要推薦的話,我會建議他們涉獵所有相關知識,吃透這些內(nèi)容后再將其結(jié)合在一起。
:您能舉例說明如何將各項AI技術整合嗎?
Tom Mitchell:例如,我做了很多有關機器學習的研究,但我想將機器學習應運用于不同的領域,針對不同的方向推進這種應用。在機器學習領域,可以說有許多人習慣于認為你可以用貝葉斯或者深層網(wǎng)絡來做研究??傊?,你擇其一而行。但今天,我們越來越清楚如何使用深層網(wǎng)絡來 了解概率分布的問題。所以,認為這種研究是一個非此即彼的選擇,這種想法是錯誤的。如果你同時掌握了兩個領域的知識,你只要將它們結(jié)合在一起,讓深層網(wǎng)絡去掌握概念分布的知識就可以了。針對我不想建議別人去學某項技術的問題,我能舉的實例就是:我想讓他們關注知識整合,將不同的方法融為一體,集百家之大成。
:CV和語音技術發(fā)展已經(jīng)趨近成熟,NLP還要多久才能達到同樣的程度?NLP的機會在哪里?
Tom Mitchell:這個問題有兩個答案。第一個是,我不認為它們正不斷趨于成熟。我認為語音識別和計算機視覺仍然將持續(xù)取得重大進步。但我認為它們只能說是不斷接近人類的水平,而不能算是趨于成熟。
:但是CV和語音識別的準確率已經(jīng)接近100%了。
Tom Mitchell:那是因為我們使用人類的標準來衡量這種技術的發(fā)展。但計算機視覺將繼續(xù)超越人類。比如,有一些高分辨率的攝像頭已經(jīng)能夠觀察到角落里的塑料袋,發(fā)現(xiàn)塑料袋在振動,可以用計算機視覺觀察震動當時,并據(jù)此判斷人的說話的內(nèi)容。我認為計算機視覺不會止步于人類的水平,它會超越人類視覺,我們將把它作為一種感應設備來獲取人類無法感知的信息。
我認為聲音識別也可以超越人類水平,甚至越過語音識別技術的發(fā)展。我認為人們說話的時候,他們說話的聲音(而不是內(nèi)容)輪廓含有大量有關其心理狀態(tài)的信息,比如他們是否心情愉快?他們是在說話嗎?他們說的是真話嗎?他們現(xiàn)在很不安嗎?我認為超人類的語音識別技術將能夠破解語言中含有的更多信息,就好像超人類視覺可以破解更多圖像信息一樣。所以我認為它們的發(fā)展不會止步于人類的水平。
請允許我用NLU而不是NLP(自然語言理解)這個術語。我們不談自然語言處理,因為它涉及許多概念,而是把它稱為自然語言理解,它是一個非常有難度的問題。從某種意義上說,這可能完全是一個人工智能的問題,如果你能夠真正解決自然語言理解的問題,那么你還必須解決AI領域中大多數(shù)關于推理和表現(xiàn)的其它大型開放性問題。所以我認為自然語言理解是AI領域中最困難的開放性問題之一。我認為我們在未來十年會在這方面獲得許多進步。我們很難預測我們究竟能否解決這個問題,以及何時解決這個問題。
讓機器在對話中學習——Conversational Learning
Mitchell在計算機科學領域出版了130余篇文章,內(nèi)容涵蓋機器學習、人工智能、認知神經(jīng)科學等領域,在機器學習方面,他主要研究統(tǒng)計學習算法的開發(fā)和應用,如賦予計算機理解自然語言的能力以及發(fā)現(xiàn)人腦如何表示信息。
Mitchell 與其在 CMU 心理學系的同仁創(chuàng)建了首個預測大腦神經(jīng)元激活模式的計算模型,該研究后來被擴展到其它單詞類型、單詞序列和情緒中。
他開發(fā)出名為NELL(Never-Ending Language Learning)的計算機程序,能夠從 web 中不斷抽取信息,并教會自己閱讀。
在11月15日的“全球AI+智適應教育峰會”上,Tom Mitchell介紹了一項他們正在研究的技術——Conversational Learning(會話學習),希望能通過對話的形式教會手機理解用戶的指令,自己編程來完成命令,同時不斷從這個過程中學習進化,最終實現(xiàn)機器人可以自己編程的目標。
:您在今天的大會上談到了一種可指導機器學習——Conversational Learning(會話學習),你能再解釋一下嗎?
Tom Mitchell:它的理念就是今天多數(shù)機器學習算法都在執(zhí)行大數(shù)量的統(tǒng)計性分析。但這只是人們通過尋找結(jié)果、統(tǒng)計趨勢而掌握的學習方法之一。人們還有其它學習方法。人們可以通過對話交流、閱讀書籍、進行實驗來學習。所以我們的會話學習項目的理念就是,我認為未來會出現(xiàn)超越統(tǒng)計式學習的機器學習方式。這對我來說是一個很自然的發(fā)展過程。所以,我們開展了這方面的研究,例如,我們有一個目標是讓每個擁有手機的人教手機如何執(zhí)行新任務。那么這會出現(xiàn)什么新應用呢?比如,我想告訴自己的手機,無論何時有人給我發(fā)送了一張我媽媽的照片,那就請把照片轉(zhuǎn)發(fā)給我媽媽。我的手機實際上可以做到這一點,但它還沒有這么做,那是因為還沒有人編寫這樣的程序。但如果我可以同自己的手機進行對話,相信手機就可以掌握這種技能。如果這種技術成熟了,我就可以教手機如何做到這一點。我可以給手機展示一下我媽媽的一些照片,讓它可以學習一下人臉識別的技術。然后我再對手機說,把照片發(fā)送給我媽,這樣,我就可以教它怎么執(zhí)行這個操作。這就像編程一樣,但它并不是使用java或python這種語言來編程。我是在使用自然語言來編程。
:您是否有關于Conversational Learning的論文?
Tom Mitchell:我們的確寫了幾篇關于這項研究的論文。最早的一篇論文是2016年時發(fā)布于IEEE的論文,我們在該論文中介紹了這個系統(tǒng)的第一個版本。從那時候開始,我們發(fā)表了許多論文,其中涉及我今天無暇在會議上分享的最有趣的開發(fā)項目。但我認為那個項目最有趣的新方向就是,我們發(fā)現(xiàn)人們在傳授知識時,有許多內(nèi)容你只想通過對話來表達。有時候向人傳授知識會更容易一些。假設我想說,無論下午外面何時下雨了,請在我離開辦公室前提醒我?guī)嫌陚?。好吧,這是我想教手機掌握的另一項技能。但現(xiàn)在我得教手機學習了,我該如何教手機反饋外面是否下雨的情況?這個時候,親自示范可能要比說話更容易一點。我可能會說,如果你想知道外面是否下雨,打開天氣預報app,看一下當時的天氣狀況就行了。如果天氣預報顯示有雨,那就是下雨了,你這么說就可以了。但親自示范就是要比說話更容易理解。所以我們在這個系統(tǒng)的最新版本中,整合了通過展示和口頭對話來傳授本領的功能,以便人們可以結(jié)合這兩種方法向手機傳達指令。
:我們會推動這種技術實現(xiàn)商業(yè)化嗎?
Tom Mitchell:有人會,但在此之前還是得先解決一些技術性問題。我們有一個原型可以展示這種強大的功能,但這個原型也失敗了。我們針對這個機械進行了測試,我們?yōu)榇斯陀昧?23個人在非語音模式下使用我們的系統(tǒng),他們只能通過打字這種仍然屬于自然語言的模式,教系統(tǒng)執(zhí)行大約20項任務。測試結(jié)果發(fā)現(xiàn),完成了了測試的人員都取得了良好的結(jié)果,但在這123人中僅有半數(shù)人完成了測試,其他人都失敗了,因為計算機并不能完全理解他們發(fā)出的指令。所以我認為,這項技術的商業(yè)化之路任重道遠。但我仍然認為它是當前十分重要的一個研究領域。
理性擁抱AI
:機器學習很火熱,現(xiàn)在很多人都一窩蜂涌上來要學習機器學習,你如何看待這種現(xiàn)象?
Tom Mitchell:我想,出現(xiàn)這個現(xiàn)象有兩個原因。其中一個原因,我認為是理性的。如果你看下自己可以主修的所有學科,選擇機器學習或者AI不失為一個理性的選擇,因為這是一個迅速發(fā)展的領域,如果你掌握了這項技能和知識,未來就有可能參與許多有趣的事情,從這個角度來看這是一種理性的選擇。但這其中也有過度炒作的成分。我認為再過幾年這一行的炒作就會消失,人們終會回歸理性。
:現(xiàn)在什么都往AI上靠,甚至包括波士頓動力機器人也有人說它用了AI算法,如何讓大家理性看待AI?
Tom Mitchell:我認為AI仍然是一個非正式術語。目前來看,它只是一個流行使用的非正式術語。所以每家公司都希望在宣傳上蹭一下AI的熱度。這倒沒錯,我是說我認為多數(shù)消費者都很清楚,市場營銷部門都很擅長使用這種噱頭,聲稱自己使用了AI技術,實際上未必如此。這些公司實際上可能只是使用了非常簡單,或者非常復雜的算法。這種現(xiàn)象可能過一段時間就會發(fā)生變化,因為AI概念現(xiàn)在很火,大家就喜歡用這種套路,但今后可能又會出現(xiàn)更熱門的概念。到時候,大家又會說他們家的產(chǎn)品使用了這種新技術。這種現(xiàn)象并不奇怪。
:您認為未來還有什么技術會比AI更流行?
Tom Mitchell:很難說,我只能說區(qū)塊鏈現(xiàn)在在中國很火,但從長遠來看,我并不認為它會比AI走得更遠。量子計算( Quantity computing)如果被證實可行的話,有可能比AI更熱門,但這還得再等上幾年才看得分明。
總結(jié)
雖然Tom Mitchell教授每年都把其最新的思想和研究帶來中國,但是我們很少有機會能與他進行一對一的探討,在這次長達一個小時的一對一專訪中,Tom Mitchell教授解決了編輯諸多疑問,在AI大牛的光環(huán)之下,我們也了解到了一個更加真實、更完整的Tom Mitchell。
整個采訪過程中,Tom Mitchell教授說話慢條斯理,總是面帶微笑,聲音中充滿愉悅的氣息。能與他對談,讓人覺得是一件幸運的事。
相關文章:
機器學習教父 Tom Mitchell :人工智能將成為自適應學習的驅(qū)動式技術 | 全球AI+智適應教育峰會
肩扛CMU人工智能大旗,機器學習教父Tom Mitchell如何講述AI+教育?
專訪機器學習祖師爺 Tom Mitchell:帶著理性擁抱機器學習的熱潮 | GMIC 2018
對話機器學習教父Tom Mitchell:人工智能不會出現(xiàn)第三次衰退了 | GMIC 2017
《機器學習》作者Tom Mitchell:人工智能如何向人類大腦學習 | GMIC 2017
吳甘沙對話Tom Mitchell:人工智能如何顛覆我們的城市 | GMIC 2017
原創(chuàng)文章,未經(jīng)授權禁止轉(zhuǎn)載。