10位AI大牛暢想2020:李開復(fù)看好醫(yī)療教育 LeCun強(qiáng)調(diào)自監(jiān)督學(xué)習(xí)
2020,AI的研究會(huì)有哪些突破?
2020,AI的應(yīng)用又會(huì)有什么變化?
吳恩達(dá)DeepLearning.ai旗下的THE BATCH刊物,分享了包括Yann LeCun、李開復(fù)、周志華、還有他們的老板吳恩達(dá)在內(nèi)的10位AI大佬的新年寄語,以及對AI在2020年能有什么突破的“新年愿望”。
一起來看看吧~
吳恩達(dá):保持學(xué)習(xí)和好奇心
在這份「新年寄語篇」的開頭,吳恩達(dá)作為發(fā)起人開場,總體是一些關(guān)于學(xué)習(xí)新知識的碎碎念。
吳恩達(dá)說,他每年冬天的假期都會(huì)圍繞一個(gè)新的主題進(jìn)行學(xué)習(xí)。
比如10年前的那個(gè)冬天,他的學(xué)習(xí)主題是教育學(xué),雖然當(dāng)時(shí)他拖著十分沉重的書箱在機(jī)場趕路,但對教育學(xué)的研究的確為后來在線學(xué)習(xí)平臺Coursera的成立起到了幫助。
而去年,當(dāng)時(shí)他的寶貝女兒Nova還在母親腹中,吳恩達(dá)就在冬天讀了很多育兒書籍。
而這個(gè)冬天,吳恩達(dá)說他在研究續(xù)命—;—;包括遺傳學(xué)、還有夸克什么的在內(nèi)的新興科學(xué),還實(shí)地探訪去拜見了自己101歲的爺爺,爺爺用親身經(jīng)歷告訴他:
長壽的秘方,就是保持好奇心。
照這個(gè)規(guī)律,吳恩達(dá)覺得自己的關(guān)注者里會(huì)有不少人能在101歲之后依然活蹦亂跳的。
最后,吳恩達(dá)祝大家過一個(gè)充滿好奇心、學(xué)到新東西、有愛的2020年。
李開復(fù):AI將在更多行業(yè)落地
李開復(fù)的新年寄語主題,是AI無處不在。他說:
人工智能已經(jīng)從發(fā)現(xiàn)的時(shí)代到了落地的時(shí)代。在我們主要在中國的投資組合中,我們看到了在銀行、金融、運(yùn)輸、物流、超市、飯店、倉庫、工廠、學(xué)校和藥物研發(fā)中使用人工智能和自動(dòng)化技術(shù)的應(yīng)用。
但是,從整體經(jīng)濟(jì)的角度來看,只有一小部分企業(yè)開始使用AI,這表明還AI有巨大的增長空間。
我相信,在人類技術(shù)進(jìn)步的歷史上,AI將與電力同等重要。在未來的一二十年中,人工智能將滲透到我們的生活和工作中,從而提供更高的效率和更智能的體驗(yàn)。現(xiàn)在正是企業(yè)、機(jī)構(gòu)和政府充分擁抱AI并推動(dòng)社會(huì)前進(jìn)的時(shí)機(jī)。
我對AI在醫(yī)療和教育上的影響非常興奮。這兩個(gè)行業(yè)已經(jīng)為AI的部署做好了準(zhǔn)備。
我們投資了一家使用AI和大數(shù)據(jù)優(yōu)化供應(yīng)鏈的公司,從而緩解了超過1.5億中國農(nóng)村人口的藥品短缺情況。我們也在投資用深度學(xué)習(xí)來生成化合物的藥物研發(fā)公司,以將藥物發(fā)現(xiàn)時(shí)間縮短三到四倍。
在教育方面,我們看到一些公司正在用AI改善學(xué)生的英語發(fā)音,幫助學(xué)生提升成績,用個(gè)性化和游戲化的方式幫助學(xué)生學(xué)習(xí)數(shù)學(xué)。這將使教師從日常工作中解放出來,并使他們能夠花時(shí)間為新興一代的學(xué)生做更多鼓勵(lì)性的工作。
我希望看到更多明智的企業(yè)家和公司在2020年及以后的幾年中開始使用AI來幫助他們獲得更大的好處。
LeCun:自監(jiān)督學(xué)習(xí)帶來AI革命
深度學(xué)習(xí)三巨頭之一、圖靈獎(jiǎng)得主Yann LeCun的新年寄語主題,是Learning From Observation。
讓人忍不住把它翻譯成“格物致知”。
“格”的是開車這件小事。LeCun提到,人類學(xué)開車只要幾十個(gè)小時(shí),但是模仿學(xué)習(xí)算法需要學(xué)幾十萬個(gè)小時(shí),強(qiáng)化學(xué)習(xí)算法甚至需要學(xué)幾百萬個(gè)小時(shí),這里面一定有什么問題。
人類可以高效學(xué)習(xí),是因?yàn)槲覀內(nèi)嗽谀X海里建立了世界的模型。嬰兒很難和世界互動(dòng),但是在剛出生的幾個(gè)月里,他們通過觀察吸收了大量關(guān)于這個(gè)世界的背景知識。顯然,大腦的很大一部分被用在了理解世界的結(jié)構(gòu),并預(yù)測一些無法直接觀察到的事物,比如未來才會(huì)出現(xiàn)的東西、或者被隱藏的事物。
因此,AI的前進(jìn)方向,就是自監(jiān)督學(xué)習(xí)(self-supervised learning),它和監(jiān)督學(xué)習(xí)類似,但是并不會(huì)訓(xùn)練系統(tǒng)去把數(shù)據(jù)分類,而是我們隱藏一些部分,讓后讓機(jī)器預(yù)測丟失的部分,比如把視頻的一些幀抹掉,然后訓(xùn)練機(jī)器根據(jù)剩余的幀來填補(bǔ)被抹掉的部分。
最近,這種方法在NLP方面非常成功。諸如BERT、RoBERTa、XLNet、XLM之類的模型以自監(jiān)督的方式進(jìn)行訓(xùn)練來預(yù)測文本中缺少的單詞,它們在所有主要的自然語言基準(zhǔn)測試中都有記錄。
希望在2020年,自監(jiān)督學(xué)習(xí)能夠用在視頻和圖像上。它會(huì)在視頻這類高維連續(xù)數(shù)據(jù)上創(chuàng)造類似的革命嗎?
其中一項(xiàng)嚴(yán)峻的挑戰(zhàn)是應(yīng)對不確定性。像BERT這樣的模型無法判斷句子中丟失的單詞是“貓”還是“狗”,但是它們可以產(chǎn)生概率分布向量。對于圖像或視頻幀,我們沒有一個(gè)好的概率分布模型。但是最近的研究非常接近,或許我們很快就會(huì)發(fā)現(xiàn)這樣一個(gè)模型。
這樣,我們就能用很少的視頻訓(xùn)練樣本,來實(shí)現(xiàn)非常好的性能預(yù)測、動(dòng)作預(yù)測,而這在以前是不可能的。
當(dāng)這個(gè)想法實(shí)現(xiàn)的時(shí)候,2020年就會(huì)是AI領(lǐng)域非常激動(dòng)人心的時(shí)刻。
周志華:方法創(chuàng)新,方針明確
南京大學(xué)周志華教授對2020年有三個(gè)希望:
1、希望能夠出現(xiàn)深度神經(jīng)網(wǎng)絡(luò)以外的高級機(jī)器學(xué)習(xí)技術(shù)。神經(jīng)網(wǎng)絡(luò)已經(jīng)被許多研究人員、工程師和從業(yè)人員研究并應(yīng)用了很長時(shí)間,其他機(jī)器學(xué)習(xí)技術(shù)為創(chuàng)新提供了相對未開發(fā)的空間。
2、希望AI可以涉足更多領(lǐng)域,為人們的日常生活帶來更多積極的變化。
3、希望研究人員、工程師和從業(yè)者們對于如何采取措施防止AI技術(shù)的錯(cuò)誤開發(fā)和濫用進(jìn)行更多的思考和討論。
Anima Anandkumar:模擬的力量
Anima Anandkumar是英偉達(dá)機(jī)器學(xué)習(xí)的總監(jiān),也是加州理工的計(jì)算機(jī)教授。
Anandkumar教授提到,在仿真環(huán)境學(xué)習(xí)中訓(xùn)練算法會(huì)讓網(wǎng)絡(luò)更為強(qiáng)大,并且能模擬各種復(fù)雜的情況,在一些情況下可以解決研究人員數(shù)據(jù)不夠的問題。
她所在的加州理工已經(jīng)用物理模型來模擬真實(shí)數(shù)據(jù),用深度學(xué)習(xí)進(jìn)行地震預(yù)測的研究;英偉達(dá)也推出了仿真平臺Isaac。
她希望,2020年AI科學(xué)家們能認(rèn)識到在模擬環(huán)境中進(jìn)行訓(xùn)練的價(jià)值,并在新的一年產(chǎn)生更為重大的AI進(jìn)步。
Oren Etzioni:工具創(chuàng)造平等
Oren Etzioni是艾倫人工智能研究所的首席執(zhí)行官、華盛頓大學(xué)計(jì)算機(jī)教授、Madrona資本合伙人。
他認(rèn)為,AI界花了很多時(shí)間討論算法的公平和透明性,但在應(yīng)用上,AI還可以為社會(huì)提供更多幫助,比如為行動(dòng)不便的人提供無障礙技術(shù),解決教育、流浪者、人口販賣的問題,AI能對人們的生活質(zhì)量產(chǎn)生巨大的積極影響,但現(xiàn)在AI界對此的研究和探討只浮于表面。
因此,他希望2020年AI界能用切實(shí)的手段讓這些處于不利地位的人受益,讓世界更公平。
Chelsea Finn:泛化的機(jī)器人
Chelsea Finn是斯坦福計(jì)算機(jī)科學(xué)與電氣工程助理教授。
她認(rèn)為,目前的許多AI技術(shù)都能在圍棋等特定任務(wù)上取得非常好的成績,但在泛化方面做得還不夠,無法用一個(gè)機(jī)器人來完成多個(gè)任務(wù)。
比如,識別ImageNet上的圖片需要一個(gè)模型,但如果機(jī)器人需要與環(huán)境交互,那為每個(gè)任務(wù)都創(chuàng)造一個(gè)ImageNet那么大的數(shù)據(jù)集是不切實(shí)際的。
因此,她也在進(jìn)行更多賦予機(jī)器人泛化能力的研究。如果強(qiáng)化學(xué)習(xí)的臨界質(zhì)量發(fā)展和泛化有所突破,會(huì)是非常令人振奮的事情。如果能應(yīng)對這些挑戰(zhàn),機(jī)器人會(huì)比現(xiàn)在的更加智能,而不僅僅是停留在實(shí)驗(yàn)室里。
David Patterson:快速訓(xùn)練與推理
David Patterso是加州大學(xué)伯克利分校的計(jì)算機(jī)科學(xué)教授,RISC-V國際開源實(shí)驗(yàn)室負(fù)責(zé)人,也是ACM和IEEE的Fellow。
他說,過去一年,阿里巴巴、 Graphcore和英特爾等公司都在研發(fā)專門的人工智能處理器,而這些芯片將慢慢進(jìn)入研究實(shí)驗(yàn)室和數(shù)據(jù)中心。
他認(rèn)為,投資數(shù)十億美元打造新穎的人工智能硬件將在2020年初見成效。
并希望人工智能社區(qū)能接受其中最好的芯片,來推動(dòng)這個(gè)領(lǐng)域朝著更好的模型和更有價(jià)值的應(yīng)用方向發(fā)展。
Dawn Song:要對數(shù)據(jù)負(fù)責(zé)
Dawn Song是安全領(lǐng)域的頂尖學(xué)者之一,1996年本科畢業(yè)于清華大學(xué),現(xiàn)在是加州大學(xué)伯克利分校(UC Berkeley)計(jì)算機(jī)科學(xué)和電子工程教授,也是Oasis Labs 首席執(zhí)行官和聯(lián)合創(chuàng)始人。
她認(rèn)為,人們對敏感數(shù)據(jù)的收集正在迅速增加,幾乎涵蓋了人們生活的方方面面。但用戶幾乎無法控制他們生成的數(shù)據(jù)如何被使用。與此同時(shí),企業(yè)和研究人員在利用數(shù)據(jù)方面面臨著諸多挑戰(zhàn)。
在她看來,這種數(shù)據(jù)收集方式將個(gè)人和企業(yè)置于危險(xiǎn)之中,她希望2020年應(yīng)該是為負(fù)責(zé)任的數(shù)據(jù)經(jīng)濟(jì)打下基礎(chǔ)的一年。
這需要?jiǎng)?chuàng)造新的技術(shù)、法規(guī)和商業(yè)模式。Dawn Song認(rèn)為,2020年在在機(jī)器學(xué)習(xí)方面仍然存在更大的挑戰(zhàn),要打造可擴(kuò)展的系統(tǒng)來為實(shí)際部署大型、異構(gòu)數(shù)據(jù)集服務(wù),聯(lián)邦學(xué)習(xí)的進(jìn)一步研究和部署對于某些用例也很重要等等。
Richard Socher:信息海洋已經(jīng)沸騰
Richard Socher博士畢業(yè)于斯坦福大學(xué)計(jì)算機(jī)系。2016年,自己創(chuàng)辦的公司被Salesforce收購后,加入Salesforce,現(xiàn)在是Salesforce的首席科學(xué)家。
他認(rèn)為,如何處理鋪天蓋地的事實(shí)、意見和觀點(diǎn)仍然是一個(gè)挑戰(zhàn)。
比如,在你沒有讀過一個(gè)冗長的文檔之前,你很難知道你會(huì)在里面找到什么信息。而且,想要知道某個(gè)特定的陳述是否正確也非常困難。
在他看來,自動(dòng)提取摘要可以解決這些問題,2020年,這一技術(shù)將會(huì)迎來重大發(fā)展,改變我們消費(fèi)信息的方式。
不僅能幫助人們應(yīng)對不斷涌現(xiàn)的新信息,而且還能讓人們進(jìn)一步擁抱人工智能的巨大潛力,創(chuàng)造一個(gè)更美好的世界。