去年,在AlphaGo以4:1戰(zhàn)勝了李世石之后,AI技術就開始走進了人們的視線,它華麗的出現(xiàn)讓人對它更加的追捧?,F(xiàn)在機器人阿爾法狗下一代友又引起了關注,將會把AI推入一個全新的階段。
近日,阿爾法狗的下一代阿爾法元(AlphaZero)的出現(xiàn)再次引起了世人的關注。在此次對弈過程中,阿爾法元以100比0的戰(zhàn)績輕松擊敗阿爾法狗。阿爾法元的成功讓人工智能進入了一個全新的階段。
繼今年5月,機器人阿爾法狗(AlphaGo)在世界級三番棋人機大戰(zhàn)中戰(zhàn)勝了世界排名第一的中國棋手柯潔,近日,阿爾法狗的下一代阿爾法元(AlphaZero)的出現(xiàn)再次引起了世人的關注。在此次對弈過程中,阿爾法元以100比0的戰(zhàn)績輕松擊敗阿爾法狗。阿爾法元的成功讓人工智能進入了一個全新的階段。
我把人和機器的學習特征歸分為三個階段。第一階段即從外界汲取知識的學習階段。就像我們人要去學校上課,就是從老師、書本上汲取知識。人工智能機器人在這個階段也一樣。阿爾法狗為了打敗人類圍棋的世界冠軍,訓練期長達幾個月。在這段時間里,它需要基于上百萬種人類專業(yè)選手的下棋步驟來進行自我對弈的強化學習。另外一個案例,IBM基于“DeepQA” (深度開放域問答系統(tǒng)工程)技術所開發(fā)的醫(yī)療輔助機器人Watson,為了能更好地向醫(yī)生提供可供選擇的循證治療方案,它目前已經“學習”了腫瘤學研究領域的42種醫(yī)學期刊、臨床試驗的60多萬條醫(yī)療證據(jù)和200萬頁文本資料。
到了第二階段,就是人和人工智能的一個自我學習的階段。就在上周,《自然》雜志發(fā)表了一篇名為《Mastering the game of Go without human knowledge》的學術論文。文中提到,與阿爾法狗相比,阿爾法元不需要借助任何人類經驗知識,從零開始學習,完全靠自己強化學習和參悟。其中,最大的突破就是無監(jiān)督的深度學習。這是一個不需要人為干預的學習過程,就像我們小時候學了基礎的數(shù)學知識后,可以自主地去推理、思考。阿爾法元的這種突破正是對人類固有思維模式的一個突破。
而開創(chuàng)這一能力背后的核心技術--深度學習,早在2012年就登上了世界的舞臺。這一年,深度學習之父Hinton帶領團隊在全球最知名的ImageNet機器視覺比賽上成功讓人工智能的計算正確率提升至85%,這一數(shù)字在2010為72%,2011年為74%。短短三年后,微軟研究院用了高達152層的神經網絡讓正確率提升到了95.06%,跨過了人類視覺94.9%的壁壘??梢钥闯觯斯ぶ悄苷诓粩鄤?chuàng)造奇跡。
人與人工智能學習的最后一個階段,我把它稱之為開創(chuàng)能力的階段。美國杜克大學人工智能專家陳怡然曾經說過,她覺得人工智能最有趣的地方就是證明了人類經驗由于樣本空間大小的限制,往往都收斂于局部而不自知,而人工智能學習則可以突破這個限制。
今天的人工智能已經進入到了一個自我學習的階段,這是一個全新的突破。通過阿爾法元的故事,我們得出,人類常常會因為自身的局限性進而影響到機器學習的能力。其次,一個依靠外界學習的人工智能最多類似于一個腦子特別好使的人類,而未來需要的一定是更多具備自我開創(chuàng)能力的人工智能機器。
未來的十年是人工智能技術爆發(fā)的十年,未來的二十年,人工智能將被應用進更多商業(yè)化場景里逐步取代人類的簡單繁瑣的勞動,同時帶人類進入一些人類無法超越的領域,所以這一切都還是剛剛開始,值得我們期待。