10位AI大牛暢想2020：李開復看好醫(yī)療教育 LeCun強調(diào)自監(jiān)督學習

時間：2020-02-06 13:36:01

關(guān)鍵字： AI 人工智能吳恩達李開復

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]2020，AI的研究會有哪些突破？ 2020，AI的應用又會有什么變化？吳恩達DeepLearning.ai旗下的THE BATCH刊物，分享了包括Yann LeCun、李開復、周志華、還有他們的老

2020，AI的研究會有哪些突破？

2020，AI的應用又會有什么變化？

吳恩達DeepLearning.ai旗下的THE BATCH刊物，分享了包括Yann LeCun、李開復、周志華、還有他們的老板吳恩達在內(nèi)的10位AI大佬的新年寄語，以及對AI在2020年能有什么突破的“新年愿望”。

一起來看看吧~

吳恩達：保持學習和好奇心

在這份「新年寄語篇」的開頭，吳恩達作為發(fā)起人開場，總體是一些關(guān)于學習新知識的碎碎念。

吳恩達說，他每年冬天的假期都會圍繞一個新的主題進行學習。

比如10年前的那個冬天，他的學習主題是教育學，雖然當時他拖著十分沉重的書箱在機場趕路，但對教育學的研究的確為后來在線學習平臺Coursera的成立起到了幫助。

而去年，當時他的寶貝女兒Nova還在母親腹中，吳恩達就在冬天讀了很多育兒書籍。

而這個冬天，吳恩達說他在研究續(xù)命—;—;包括遺傳學、還有夸克什么的在內(nèi)的新興科學，還實地探訪去拜見了自己101歲的爺爺，爺爺用親身經(jīng)歷告訴他：

長壽的秘方，就是保持好奇心。

照這個規(guī)律，吳恩達覺得自己的關(guān)注者里會有不少人能在101歲之后依然活蹦亂跳的。

最后，吳恩達祝大家過一個充滿好奇心、學到新東西、有愛的2020年。

李開復：AI將在更多行業(yè)落地

李開復的新年寄語主題，是AI無處不在。他說：

人工智能已經(jīng)從發(fā)現(xiàn)的時代到了落地的時代。在我們主要在中國的投資組合中，我們看到了在銀行、金融、運輸、物流、超市、飯店、倉庫、工廠、學校和藥物研發(fā)中使用人工智能和自動化技術(shù)的應用。

但是，從整體經(jīng)濟的角度來看，只有一小部分企業(yè)開始使用AI，這表明還AI有巨大的增長空間。

我相信，在人類技術(shù)進步的歷史上，AI將與電力同等重要。在未來的一二十年中，人工智能將滲透到我們的生活和工作中，從而提供更高的效率和更智能的體驗?，F(xiàn)在正是企業(yè)、機構(gòu)和政府充分擁抱AI并推動社會前進的時機。

我對AI在醫(yī)療和教育上的影響非常興奮。這兩個行業(yè)已經(jīng)為AI的部署做好了準備。

我們投資了一家使用AI和大數(shù)據(jù)優(yōu)化供應鏈的公司，從而緩解了超過1.5億中國農(nóng)村人口的藥品短缺情況。我們也在投資用深度學習來生成化合物的藥物研發(fā)公司，以將藥物發(fā)現(xiàn)時間縮短三到四倍。

在教育方面，我們看到一些公司正在用AI改善學生的英語發(fā)音，幫助學生提升成績，用個性化和游戲化的方式幫助學生學習數(shù)學。這將使教師從日常工作中解放出來，并使他們能夠花時間為新興一代的學生做更多鼓勵性的工作。

我希望看到更多明智的企業(yè)家和公司在2020年及以后的幾年中開始使用AI來幫助他們獲得更大的好處。

LeCun：自監(jiān)督學習帶來AI革命

深度學習三巨頭之一、圖靈獎得主Yann LeCun的新年寄語主題，是Learning From Observation。

讓人忍不住把它翻譯成“格物致知”。

“格”的是開車這件小事。LeCun提到，人類學開車只要幾十個小時，但是模仿學習算法需要學幾十萬個小時，強化學習算法甚至需要學幾百萬個小時，這里面一定有什么問題。

人類可以高效學習，是因為我們?nèi)嗽谀X海里建立了世界的模型。嬰兒很難和世界互動，但是在剛出生的幾個月里，他們通過觀察吸收了大量關(guān)于這個世界的背景知識。顯然，大腦的很大一部分被用在了理解世界的結(jié)構(gòu)，并預測一些無法直接觀察到的事物，比如未來才會出現(xiàn)的東西、或者被隱藏的事物。

因此，AI的前進方向，就是自監(jiān)督學習（self-supervised learning），它和監(jiān)督學習類似，但是并不會訓練系統(tǒng)去把數(shù)據(jù)分類，而是我們隱藏一些部分，讓后讓機器預測丟失的部分，比如把視頻的一些幀抹掉，然后訓練機器根據(jù)剩余的幀來填補被抹掉的部分。

最近，這種方法在NLP方面非常成功。諸如BERT、RoBERTa、XLNet、XLM之類的模型以自監(jiān)督的方式進行訓練來預測文本中缺少的單詞，它們在所有主要的自然語言基準測試中都有記錄。

希望在2020年，自監(jiān)督學習能夠用在視頻和圖像上。它會在視頻這類高維連續(xù)數(shù)據(jù)上創(chuàng)造類似的革命嗎？

其中一項嚴峻的挑戰(zhàn)是應對不確定性。像BERT這樣的模型無法判斷句子中丟失的單詞是“貓”還是“狗”，但是它們可以產(chǎn)生概率分布向量。對于圖像或視頻幀，我們沒有一個好的概率分布模型。但是最近的研究非常接近，或許我們很快就會發(fā)現(xiàn)這樣一個模型。

這樣，我們就能用很少的視頻訓練樣本，來實現(xiàn)非常好的性能預測、動作預測，而這在以前是不可能的。

當這個想法實現(xiàn)的時候，2020年就會是AI領(lǐng)域非常激動人心的時刻。

周志華：方法創(chuàng)新，方針明確

南京大學周志華教授對2020年有三個希望：

1、希望能夠出現(xiàn)深度神經(jīng)網(wǎng)絡以外的高級機器學習技術(shù)。神經(jīng)網(wǎng)絡已經(jīng)被許多研究人員、工程師和從業(yè)人員研究并應用了很長時間，其他機器學習技術(shù)為創(chuàng)新提供了相對未開發(fā)的空間。

2、希望AI可以涉足更多領(lǐng)域，為人們的日常生活帶來更多積極的變化。

3、希望研究人員、工程師和從業(yè)者們對于如何采取措施防止AI技術(shù)的錯誤開發(fā)和濫用進行更多的思考和討論。

Anima Anandkumar：模擬的力量

Anima Anandkumar是英偉達機器學習的總監(jiān)，也是加州理工的計算機教授。

Anandkumar教授提到，在仿真環(huán)境學習中訓練算法會讓網(wǎng)絡更為強大，并且能模擬各種復雜的情況，在一些情況下可以解決研究人員數(shù)據(jù)不夠的問題。

她所在的加州理工已經(jīng)用物理模型來模擬真實數(shù)據(jù)，用深度學習進行地震預測的研究；英偉達也推出了仿真平臺Isaac。

她希望，2020年AI科學家們能認識到在模擬環(huán)境中進行訓練的價值，并在新的一年產(chǎn)生更為重大的AI進步。

Oren Etzioni：工具創(chuàng)造平等

Oren Etzioni是艾倫人工智能研究所的首席執(zhí)行官、華盛頓大學計算機教授、Madrona資本合伙人。

他認為，AI界花了很多時間討論算法的公平和透明性，但在應用上，AI還可以為社會提供更多幫助，比如為行動不便的人提供無障礙技術(shù)，解決教育、流浪者、人口販賣的問題，AI能對人們的生活質(zhì)量產(chǎn)生巨大的積極影響，但現(xiàn)在AI界對此的研究和探討只浮于表面。

因此，他希望2020年AI界能用切實的手段讓這些處于不利地位的人受益，讓世界更公平。

Chelsea Finn：泛化的機器人

Chelsea Finn是斯坦福計算機科學與電氣工程助理教授。

她認為，目前的許多AI技術(shù)都能在圍棋等特定任務上取得非常好的成績，但在泛化方面做得還不夠，無法用一個機器人來完成多個任務。

比如，識別ImageNet上的圖片需要一個模型，但如果機器人需要與環(huán)境交互，那為每個任務都創(chuàng)造一個ImageNet那么大的數(shù)據(jù)集是不切實際的。

因此，她也在進行更多賦予機器人泛化能力的研究。如果強化學習的臨界質(zhì)量發(fā)展和泛化有所突破，會是非常令人振奮的事情。如果能應對這些挑戰(zhàn)，機器人會比現(xiàn)在的更加智能，而不僅僅是停留在實驗室里。

David Patterson：快速訓練與推理

David Patterso是加州大學伯克利分校的計算機科學教授，RISC-V國際開源實驗室負責人，也是ACM和IEEE的Fellow。

他說，過去一年，阿里巴巴、 Graphcore和英特爾等公司都在研發(fā)專門的人工智能處理器，而這些芯片將慢慢進入研究實驗室和數(shù)據(jù)中心。

他認為，投資數(shù)十億美元打造新穎的人工智能硬件將在2020年初見成效。

并希望人工智能社區(qū)能接受其中最好的芯片，來推動這個領(lǐng)域朝著更好的模型和更有價值的應用方向發(fā)展。

Dawn Song：要對數(shù)據(jù)負責

Dawn Song是安全領(lǐng)域的頂尖學者之一，1996年本科畢業(yè)于清華大學，現(xiàn)在是加州大學伯克利分校(UC Berkeley)計算機科學和電子工程教授，也是Oasis Labs 首席執(zhí)行官和聯(lián)合創(chuàng)始人。

她認為，人們對敏感數(shù)據(jù)的收集正在迅速增加，幾乎涵蓋了人們生活的方方面面。但用戶幾乎無法控制他們生成的數(shù)據(jù)如何被使用。與此同時，企業(yè)和研究人員在利用數(shù)據(jù)方面面臨著諸多挑戰(zhàn)。

在她看來，這種數(shù)據(jù)收集方式將個人和企業(yè)置于危險之中，她希望2020年應該是為負責任的數(shù)據(jù)經(jīng)濟打下基礎的一年。

這需要創(chuàng)造新的技術(shù)、法規(guī)和商業(yè)模式。Dawn Song認為，2020年在在機器學習方面仍然存在更大的挑戰(zhàn)，要打造可擴展的系統(tǒng)來為實際部署大型、異構(gòu)數(shù)據(jù)集服務，聯(lián)邦學習的進一步研究和部署對于某些用例也很重要等等。

Richard Socher：信息海洋已經(jīng)沸騰

Richard Socher博士畢業(yè)于斯坦福大學計算機系。2016年，自己創(chuàng)辦的公司被Salesforce收購后，加入Salesforce，現(xiàn)在是Salesforce的首席科學家。

他認為，如何處理鋪天蓋地的事實、意見和觀點仍然是一個挑戰(zhàn)。

比如，在你沒有讀過一個冗長的文檔之前，你很難知道你會在里面找到什么信息。而且，想要知道某個特定的陳述是否正確也非常困難。

在他看來，自動提取摘要可以解決這些問題，2020年，這一技術(shù)將會迎來重大發(fā)展，改變我們消費信息的方式。

不僅能幫助人們應對不斷涌現(xiàn)的新信息，而且還能讓人們進一步擁抱人工智能的巨大潛力，創(chuàng)造一個更美好的世界。