“人機(jī)”大戰(zhàn)為何落敗?一張圖看懂“阿爾法狗”
“人機(jī)圍棋大戰(zhàn)”第一局已經(jīng)結(jié)束,如果你看完了整盤比賽的話,結(jié)果讓人很意外,因?yàn)樵诒荣愔欣钍朗欢日紦?jù)了90%的贏面,由于自己的心里發(fā)生變化,導(dǎo)致了幾個(gè)失誤的發(fā)生,最終失敗了。
除了李世石自身的因素外,這場人機(jī)大戰(zhàn),AlphaGo也表現(xiàn)出了超強(qiáng)的實(shí)力,為什么這么說?
相比象棋來說,圍棋下起來對機(jī)器來說更加困難,其深度學(xué)習(xí)能力要更強(qiáng),簡單來說深度學(xué)習(xí)就是指機(jī)器通過深度神經(jīng)網(wǎng)絡(luò),模擬人腦的機(jī)制來學(xué)習(xí)、判斷、決策。
而在跟李世石下棋之前,AlphaGo已經(jīng)集中學(xué)習(xí)了半年,比如谷歌給其輸入了3000萬步人類圍棋大師的走法,讓其自我對弈3000萬局,積累勝負(fù)經(jīng)驗(yàn),同時(shí)它還要在自我對弈的訓(xùn)練中形成全局觀,并對局面做出評估。
進(jìn)過上述深度學(xué)習(xí)后,AlphaGo展出出了強(qiáng)大的騾子選擇能力,當(dāng)然更可怕的是,隨著訓(xùn)練的證增加,AlphaGo還在進(jìn)步。
不管最終的結(jié)果是什么樣,就像谷歌說的那樣,這場“人機(jī)圍棋大戰(zhàn)”的最大贏家是人類。