誕生AlphaGo的DeepMind回顧2016年,提出三大發(fā)展方向
掃描二維碼
隨時(shí)隨地手機(jī)看文章
谷歌旗下DeepMind團(tuán)隊(duì)本周在官方網(wǎng)站上撰文,回顧了2016年所取得的進(jìn)展。展望2017年,DeepMind提出了三大發(fā)展方向,包括算法突破、社會(huì)影響,以及道德倫理的最佳行為。以下為文章全文:
在當(dāng)前世界中,無(wú)論是天氣還是征服疾病,我們都面臨著非常復(fù)雜、緊急、難于掌握的系統(tǒng)。我們認(rèn)為,智能程序?qū)⒂兄谕诰蛐碌目茖W(xué)知識(shí),給社會(huì)帶來(lái)幫助。為了實(shí)現(xiàn)這一目標(biāo),我們需要通用的學(xué)習(xí)系統(tǒng),從頭開始建立起對(duì)問題的理解,并利用這些去識(shí)別模式,取得其他方式無(wú)法獲得的突破。在DeepMind,這是我們長(zhǎng)期研究使命的焦點(diǎn)。
盡管距離我們?cè)O(shè)想的智能還有很遠(yuǎn)的距離,但2016年是重要的一年。對(duì)于多項(xiàng)核心挑戰(zhàn),我們?nèi)〉昧肆钊伺d奮的進(jìn)展,而我們也首次看到了人工智能對(duì)現(xiàn)實(shí)世界可能的積極影響。
我們的程序AlphaGo挑戰(zhàn)并擊敗了世界圍棋冠軍李世石,而相關(guān)論文很幸運(yùn)地讓我們第二次登上了《自然》雜志的封面。許多專家認(rèn)為,這一成就比預(yù)期中提前了幾十年。對(duì)我們以及全球圍棋社區(qū)來(lái)說(shuō),最令人興奮的是,AlphaGo展示了贏得比賽的創(chuàng)造性,在某些情況下甚至找到了挑戰(zhàn)數(shù)千年圍棋智慧的下法。
對(duì)于史上最復(fù)雜的游戲之一,AlphaGo探索并分享了新思路,這表明了人工智能未來(lái)某天可能帶來(lái)的價(jià)值。我們期待2017年能去完成更多游戲。
我們?cè)谏赡P皖I(lǐng)域也取得了有意義的進(jìn)展,這樣的軟件能自主想象新的結(jié)構(gòu)和場(chǎng)景。在發(fā)表關(guān)于圖像生成的PixelCNN論文之后,我們發(fā)表至WaveNet的論文展示了生成音頻的有效性。我們通過(guò)原始的波形合成了全球最近似真人的語(yǔ)音,而不是將語(yǔ)音樣本簡(jiǎn)單地拼接在一起。我們計(jì)劃與谷歌合作將這項(xiàng)技術(shù)產(chǎn)品化,并且很高興這項(xiàng)技術(shù)能給數(shù)千萬(wàn)人使用的產(chǎn)品帶來(lái)優(yōu)化。
另一個(gè)重要研究領(lǐng)域是記憶和存儲(chǔ),尤其是如何將神經(jīng)網(wǎng)絡(luò)的決策能力與復(fù)雜結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)和推理能力結(jié)合在一起。我們憑借“可微分神經(jīng)計(jì)算機(jī)”在18個(gè)月內(nèi)發(fā)表了第三篇《自然》論文。
這種模型能同時(shí)像神經(jīng)網(wǎng)絡(luò)一樣學(xué)習(xí),以及像計(jì)算機(jī)一樣記憶數(shù)據(jù)。這樣的模型能學(xué)習(xí)如何回答關(guān)于數(shù)據(jù)結(jié)構(gòu)的問題,無(wú)論是族譜還是地鐵線路圖。這意味著我們更接近利用人工智能通過(guò)復(fù)雜數(shù)據(jù)集完成科學(xué)發(fā)現(xiàn)的目標(biāo)。
除了推動(dòng)這類系統(tǒng)用于更多場(chǎng)合,我們還投入了大量時(shí)間,優(yōu)化系統(tǒng)的學(xué)習(xí)方式。一篇題為“無(wú)監(jiān)督輔助任務(wù)的增強(qiáng)學(xué)習(xí)”論文描述了將某些任務(wù)學(xué)習(xí)速度提升多個(gè)數(shù)量級(jí)的方法??紤]到高質(zhì)量訓(xùn)練環(huán)境的重要性,我們向整個(gè)社區(qū)開源了旗艦的DeepMind Lab研究環(huán)境。我們也在與暴雪合作,開發(fā)用于《星際爭(zhēng)霸2》的人工智能訓(xùn)練環(huán)境。
當(dāng)然,這些只是冰山一角。通過(guò)我們今年在頂級(jí)刊物,例如《Neuron》和《PNAS》,以及主流機(jī)器學(xué)習(xí)會(huì)議,例如ICLR和NIPS上發(fā)表的論文,你可以了解到我們的更多工作。我們很高興看到,社區(qū)中的其他參與者正在這些論文成果的基礎(chǔ)上積極部署和開發(fā),例如2016年晚些時(shí)候圍棋程序的再次興起,以及人工智能和機(jī)器學(xué)習(xí)在更廣泛的領(lǐng)域快速發(fā)展。
我們也很高興看到,這類工作對(duì)現(xiàn)實(shí)世界的初步影響。我們與谷歌數(shù)據(jù)中心團(tuán)隊(duì)展開了合作,利用類似AlphaGo的技術(shù)發(fā)現(xiàn)創(chuàng)造性的新方法管理散熱,使樓宇能效大幅提升了15%。
如果這類技術(shù)可以被用于其他大規(guī)模工業(yè)系統(tǒng),那么將很可能給全球環(huán)境和成本帶來(lái)幫助。這只是我們與谷歌多支團(tuán)隊(duì)合作,將先進(jìn)研究用于全球產(chǎn)品和基礎(chǔ)設(shè)施的一個(gè)案例。
與此同時(shí),我們也在積極參與與英國(guó)兩家NHS(全國(guó)醫(yī)療系統(tǒng))醫(yī)院的機(jī)器學(xué)習(xí)研究合作,探索我們的技術(shù)如何帶來(lái)更有效的診斷,以及對(duì)影響全球數(shù)百萬(wàn)人的癥狀的治療。
我們還與另兩家醫(yī)院集團(tuán)就移動(dòng)應(yīng)用,以及基礎(chǔ)性設(shè)施展開合作,給醫(yī)療帶來(lái)優(yōu)化。
當(dāng)然,這類技術(shù)對(duì)社會(huì)的積極影響不僅僅是我們正試圖解決的現(xiàn)實(shí)世界問題,也包括算法和模型的設(shè)計(jì)、訓(xùn)練和部署方式。我們很自豪,能參與創(chuàng)立Partnership on AI項(xiàng)目。
這一項(xiàng)目將領(lǐng)先的研究實(shí)驗(yàn)室、非營(yíng)利的民間社會(huì)團(tuán)體,以及學(xué)術(shù)機(jī)構(gòu)聯(lián)合在一起,在算法透明度和安全性等方面制定最佳行為規(guī)范。
通過(guò)體驗(yàn)和信息的多樣化,我們希望能協(xié)助解決這些挑戰(zhàn),找到方法將社會(huì)目標(biāo)置于全球人工智能社區(qū)的中心。
我們?nèi)允且患夷贻p的公司,處于使命的早期。但如果2017年我們可以進(jìn)一步在這三大領(lǐng)域,包括算法突破、社會(huì)影響,以及道德倫理的最佳行為,取得同時(shí)的進(jìn)展,那么將可以更好地對(duì)科學(xué)社區(qū)和全世界做出貢獻(xiàn)。