10位AI大牛暢想2020:李開復看好醫(yī)療教育 LeCun強調(diào)自監(jiān)督學習
2020,AI的研究會有哪些突破?
2020,AI的應用又會有什么變化?
吳恩達DeepLearning.ai旗下的THE BATCH刊物,分享了包括Yann LeCun、李開復、周志華、還有他們的老板吳恩達在內(nèi)的10位AI大佬的新年寄語,以及對AI在2020年能有什么突破的“新年愿望”。
一起來看看吧~
吳恩達:保持學習和好奇心
在這份「新年寄語篇」的開頭,吳恩達作為發(fā)起人開場,總體是一些關于學習新知識的碎碎念。
吳恩達說,他每年冬天的假期都會圍繞一個新的主題進行學習。
比如10年前的那個冬天,他的學習主題是教育學,雖然當時他拖著十分沉重的書箱在機場趕路,但對教育學的研究的確為后來在線學習平臺Coursera的成立起到了幫助。
而去年,當時他的寶貝女兒Nova還在母親腹中,吳恩達就在冬天讀了很多育兒書籍。
而這個冬天,吳恩達說他在研究續(xù)命—;—;包括遺傳學、還有夸克什么的在內(nèi)的新興科學,還實地探訪去拜見了自己101歲的爺爺,爺爺用親身經(jīng)歷告訴他:
長壽的秘方,就是保持好奇心。
照這個規(guī)律,吳恩達覺得自己的關注者里會有不少人能在101歲之后依然活蹦亂跳的。
最后,吳恩達祝大家過一個充滿好奇心、學到新東西、有愛的2020年。
李開復:AI將在更多行業(yè)落地
李開復的新年寄語主題,是AI無處不在。他說:
人工智能已經(jīng)從發(fā)現(xiàn)的時代到了落地的時代。在我們主要在中國的投資組合中,我們看到了在銀行、金融、運輸、物流、超市、飯店、倉庫、工廠、學校和藥物研發(fā)中使用人工智能和自動化技術的應用。
但是,從整體經(jīng)濟的角度來看,只有一小部分企業(yè)開始使用AI,這表明還AI有巨大的增長空間。
我相信,在人類技術進步的歷史上,AI將與電力同等重要。在未來的一二十年中,人工智能將滲透到我們的生活和工作中,從而提供更高的效率和更智能的體驗?,F(xiàn)在正是企業(yè)、機構和政府充分擁抱AI并推動社會前進的時機。
我對AI在醫(yī)療和教育上的影響非常興奮。這兩個行業(yè)已經(jīng)為AI的部署做好了準備。
我們投資了一家使用AI和大數(shù)據(jù)優(yōu)化供應鏈的公司,從而緩解了超過1.5億中國農(nóng)村人口的藥品短缺情況。我們也在投資用深度學習來生成化合物的藥物研發(fā)公司,以將藥物發(fā)現(xiàn)時間縮短三到四倍。
在教育方面,我們看到一些公司正在用AI改善學生的英語發(fā)音,幫助學生提升成績,用個性化和游戲化的方式幫助學生學習數(shù)學。這將使教師從日常工作中解放出來,并使他們能夠花時間為新興一代的學生做更多鼓勵性的工作。
我希望看到更多明智的企業(yè)家和公司在2020年及以后的幾年中開始使用AI來幫助他們獲得更大的好處。
LeCun:自監(jiān)督學習帶來AI革命
深度學習三巨頭之一、圖靈獎得主Yann LeCun的新年寄語主題,是Learning From Observation。
讓人忍不住把它翻譯成“格物致知”。
“格”的是開車這件小事。LeCun提到,人類學開車只要幾十個小時,但是模仿學習算法需要學幾十萬個小時,強化學習算法甚至需要學幾百萬個小時,這里面一定有什么問題。
人類可以高效學習,是因為我們?nèi)嗽谀X海里建立了世界的模型。嬰兒很難和世界互動,但是在剛出生的幾個月里,他們通過觀察吸收了大量關于這個世界的背景知識。顯然,大腦的很大一部分被用在了理解世界的結(jié)構,并預測一些無法直接觀察到的事物,比如未來才會出現(xiàn)的東西、或者被隱藏的事物。
因此,AI的前進方向,就是自監(jiān)督學習(self-supervised learning),它和監(jiān)督學習類似,但是并不會訓練系統(tǒng)去把數(shù)據(jù)分類,而是我們隱藏一些部分,讓后讓機器預測丟失的部分,比如把視頻的一些幀抹掉,然后訓練機器根據(jù)剩余的幀來填補被抹掉的部分。
最近,這種方法在NLP方面非常成功。諸如BERT、RoBERTa、XLNet、XLM之類的模型以自監(jiān)督的方式進行訓練來預測文本中缺少的單詞,它們在所有主要的自然語言基準測試中都有記錄。
希望在2020年,自監(jiān)督學習能夠用在視頻和圖像上。它會在視頻這類高維連續(xù)數(shù)據(jù)上創(chuàng)造類似的革命嗎?
其中一項嚴峻的挑戰(zhàn)是應對不確定性。像BERT這樣的模型無法判斷句子中丟失的單詞是“貓”還是“狗”,但是它們可以產(chǎn)生概率分布向量。對于圖像或視頻幀,我們沒有一個好的概率分布模型。但是最近的研究非常接近,或許我們很快就會發(fā)現(xiàn)這樣一個模型。
這樣,我們就能用很少的視頻訓練樣本,來實現(xiàn)非常好的性能預測、動作預測,而這在以前是不可能的。
當這個想法實現(xiàn)的時候,2020年就會是AI領域非常激動人心的時刻。
周志華:方法創(chuàng)新,方針明確
南京大學周志華教授對2020年有三個希望:
1、希望能夠出現(xiàn)深度神經(jīng)網(wǎng)絡以外的高級機器學習技術。神經(jīng)網(wǎng)絡已經(jīng)被許多研究人員、工程師和從業(yè)人員研究并應用了很長時間,其他機器學習技術為創(chuàng)新提供了相對未開發(fā)的空間。
2、希望AI可以涉足更多領域,為人們的日常生活帶來更多積極的變化。
3、希望研究人員、工程師和從業(yè)者們對于如何采取措施防止AI技術的錯誤開發(fā)和濫用進行更多的思考和討論。
Anima Anandkumar:模擬的力量
Anima Anandkumar是英偉達機器學習的總監(jiān),也是加州理工的計算機教授。
Anandkumar教授提到,在仿真環(huán)境學習中訓練算法會讓網(wǎng)絡更為強大,并且能模擬各種復雜的情況,在一些情況下可以解決研究人員數(shù)據(jù)不夠的問題。
她所在的加州理工已經(jīng)用物理模型來模擬真實數(shù)據(jù),用深度學習進行地震預測的研究;英偉達也推出了仿真平臺Isaac。
她希望,2020年AI科學家們能認識到在模擬環(huán)境中進行訓練的價值,并在新的一年產(chǎn)生更為重大的AI進步。
Oren Etzioni:工具創(chuàng)造平等
Oren Etzioni是艾倫人工智能研究所的首席執(zhí)行官、華盛頓大學計算機教授、Madrona資本合伙人。
他認為,AI界花了很多時間討論算法的公平和透明性,但在應用上,AI還可以為社會提供更多幫助,比如為行動不便的人提供無障礙技術,解決教育、流浪者、人口販賣的問題,AI能對人們的生活質(zhì)量產(chǎn)生巨大的積極影響,但現(xiàn)在AI界對此的研究和探討只浮于表面。
因此,他希望2020年AI界能用切實的手段讓這些處于不利地位的人受益,讓世界更公平。
Chelsea Finn:泛化的機器人
Chelsea Finn是斯坦福計算機科學與電氣工程助理教授。
她認為,目前的許多AI技術都能在圍棋等特定任務上取得非常好的成績,但在泛化方面做得還不夠,無法用一個機器人來完成多個任務。
比如,識別ImageNet上的圖片需要一個模型,但如果機器人需要與環(huán)境交互,那為每個任務都創(chuàng)造一個ImageNet那么大的數(shù)據(jù)集是不切實際的。
因此,她也在進行更多賦予機器人泛化能力的研究。如果強化學習的臨界質(zhì)量發(fā)展和泛化有所突破,會是非常令人振奮的事情。如果能應對這些挑戰(zhàn),機器人會比現(xiàn)在的更加智能,而不僅僅是停留在實驗室里。
David Patterson:快速訓練與推理
David Patterso是加州大學伯克利分校的計算機科學教授,RISC-V國際開源實驗室負責人,也是ACM和IEEE的Fellow。
他說,過去一年,阿里巴巴、 Graphcore和英特爾等公司都在研發(fā)專門的人工智能處理器,而這些芯片將慢慢進入研究實驗室和數(shù)據(jù)中心。
他認為,投資數(shù)十億美元打造新穎的人工智能硬件將在2020年初見成效。
并希望人工智能社區(qū)能接受其中最好的芯片,來推動這個領域朝著更好的模型和更有價值的應用方向發(fā)展。
Dawn Song:要對數(shù)據(jù)負責
Dawn Song是安全領域的頂尖學者之一,1996年本科畢業(yè)于清華大學,現(xiàn)在是加州大學伯克利分校(UC Berkeley)計算機科學和電子工程教授,也是Oasis Labs 首席執(zhí)行官和聯(lián)合創(chuàng)始人。
她認為,人們對敏感數(shù)據(jù)的收集正在迅速增加,幾乎涵蓋了人們生活的方方面面。但用戶幾乎無法控制他們生成的數(shù)據(jù)如何被使用。與此同時,企業(yè)和研究人員在利用數(shù)據(jù)方面面臨著諸多挑戰(zhàn)。
在她看來,這種數(shù)據(jù)收集方式將個人和企業(yè)置于危險之中,她希望2020年應該是為負責任的數(shù)據(jù)經(jīng)濟打下基礎的一年。
這需要創(chuàng)造新的技術、法規(guī)和商業(yè)模式。Dawn Song認為,2020年在在機器學習方面仍然存在更大的挑戰(zhàn),要打造可擴展的系統(tǒng)來為實際部署大型、異構數(shù)據(jù)集服務,聯(lián)邦學習的進一步研究和部署對于某些用例也很重要等等。
Richard Socher:信息海洋已經(jīng)沸騰
Richard Socher博士畢業(yè)于斯坦福大學計算機系。2016年,自己創(chuàng)辦的公司被Salesforce收購后,加入Salesforce,現(xiàn)在是Salesforce的首席科學家。
他認為,如何處理鋪天蓋地的事實、意見和觀點仍然是一個挑戰(zhàn)。
比如,在你沒有讀過一個冗長的文檔之前,你很難知道你會在里面找到什么信息。而且,想要知道某個特定的陳述是否正確也非常困難。
在他看來,自動提取摘要可以解決這些問題,2020年,這一技術將會迎來重大發(fā)展,改變我們消費信息的方式。
不僅能幫助人們應對不斷涌現(xiàn)的新信息,而且還能讓人們進一步擁抱人工智能的巨大潛力,創(chuàng)造一個更美好的世界。