阿爾法元大敗阿爾法狗,將AI推入全新階段
去年,在AlphaGo以4:1戰(zhàn)勝了李世石之后,AI技術(shù)就開始走進(jìn)了人們的視線,它華麗的出現(xiàn)讓人對它更加的追捧?,F(xiàn)在機(jī)器人阿爾法狗下一代友又引起了關(guān)注,將會把AI推入一個全新的階段。
近日,阿爾法狗的下一代阿爾法元(AlphaZero)的出現(xiàn)再次引起了世人的關(guān)注。在此次對弈過程中,阿爾法元以100比0的戰(zhàn)績輕松擊敗阿爾法狗。阿爾法元的成功讓人工智能進(jìn)入了一個全新的階段。
繼今年5月,機(jī)器人阿爾法狗(AlphaGo)在世界級三番棋人機(jī)大戰(zhàn)中戰(zhàn)勝了世界排名第一的中國棋手柯潔,近日,阿爾法狗的下一代阿爾法元(AlphaZero)的出現(xiàn)再次引起了世人的關(guān)注。在此次對弈過程中,阿爾法元以100比0的戰(zhàn)績輕松擊敗阿爾法狗。阿爾法元的成功讓人工智能進(jìn)入了一個全新的階段。
我把人和機(jī)器的學(xué)習(xí)特征歸分為三個階段。第一階段即從外界汲取知識的學(xué)習(xí)階段。就像我們?nèi)艘W(xué)校上課,就是從老師、書本上汲取知識。人工智能機(jī)器人在這個階段也一樣。阿爾法狗為了打敗人類圍棋的世界冠軍,訓(xùn)練期長達(dá)幾個月。在這段時間里,它需要基于上百萬種人類專業(yè)選手的下棋步驟來進(jìn)行自我對弈的強(qiáng)化學(xué)習(xí)。另外一個案例,IBM基于“DeepQA” (深度開放域問答系統(tǒng)工程)技術(shù)所開發(fā)的醫(yī)療輔助機(jī)器人Watson,為了能更好地向醫(yī)生提供可供選擇的循證治療方案,它目前已經(jīng)“學(xué)習(xí)”了腫瘤學(xué)研究領(lǐng)域的42種醫(yī)學(xué)期刊、臨床試驗的60多萬條醫(yī)療證據(jù)和200萬頁文本資料。
到了第二階段,就是人和人工智能的一個自我學(xué)習(xí)的階段。就在上周,《自然》雜志發(fā)表了一篇名為《Mastering the game of Go without human knowledge》的學(xué)術(shù)論文。文中提到,與阿爾法狗相比,阿爾法元不需要借助任何人類經(jīng)驗知識,從零開始學(xué)習(xí),完全靠自己強(qiáng)化學(xué)習(xí)和參悟。其中,最大的突破就是無監(jiān)督的深度學(xué)習(xí)。這是一個不需要人為干預(yù)的學(xué)習(xí)過程,就像我們小時候?qū)W了基礎(chǔ)的數(shù)學(xué)知識后,可以自主地去推理、思考。阿爾法元的這種突破正是對人類固有思維模式的一個突破。
而開創(chuàng)這一能力背后的核心技術(shù)--深度學(xué)習(xí),早在2012年就登上了世界的舞臺。這一年,深度學(xué)習(xí)之父Hinton帶領(lǐng)團(tuán)隊在全球最知名的ImageNet機(jī)器視覺比賽上成功讓人工智能的計算正確率提升至85%,這一數(shù)字在2010為72%,2011年為74%。短短三年后,微軟研究院用了高達(dá)152層的神經(jīng)網(wǎng)絡(luò)讓正確率提升到了95.06%,跨過了人類視覺94.9%的壁壘??梢钥闯?,人工智能正在不斷創(chuàng)造奇跡。
人與人工智能學(xué)習(xí)的最后一個階段,我把它稱之為開創(chuàng)能力的階段。美國杜克大學(xué)人工智能專家陳怡然曾經(jīng)說過,她覺得人工智能最有趣的地方就是證明了人類經(jīng)驗由于樣本空間大小的限制,往往都收斂于局部而不自知,而人工智能學(xué)習(xí)則可以突破這個限制。
今天的人工智能已經(jīng)進(jìn)入到了一個自我學(xué)習(xí)的階段,這是一個全新的突破。通過阿爾法元的故事,我們得出,人類常常會因為自身的局限性進(jìn)而影響到機(jī)器學(xué)習(xí)的能力。其次,一個依靠外界學(xué)習(xí)的人工智能最多類似于一個腦子特別好使的人類,而未來需要的一定是更多具備自我開創(chuàng)能力的人工智能機(jī)器。
未來的十年是人工智能技術(shù)爆發(fā)的十年,未來的二十年,人工智能將被應(yīng)用進(jìn)更多商業(yè)化場景里逐步取代人類的簡單繁瑣的勞動,同時帶人類進(jìn)入一些人類無法超越的領(lǐng)域,所以這一切都還是剛剛開始,值得我們期待。