最強 AlphaGo Zero 誕生 「自學3天」100比0 秒殺 AlphaGo

上一篇 / 下一篇   [推到 Facebook]  [推到Twitter]  2017-10-20 12:08:50

2017年5月,DeepMind公司創造的AlphaGo與圍棋世界冠軍柯潔在中國烏鎮對弈,以壓倒性的3:0勝出,人工智慧發展震驚全球。


不可思議的是,時隔不到半年,這個Google旗下的AI實驗室帶來更強大的AlphaGo Zero,它完全不需要倚靠人類的知識和指導,從零開始自我訓練,只花3天就100:0打敗舊版。


在過去,強大的人工智慧得依靠人類事前輸入大量資料,幫助它學習、訓練技能,Alpha Go成為圍棋大師前自然也不例外。近日DeepMind公司在《自然》 (Nature) 科學期刊上發表一篇學術論文〈不需要人類知識就稱霸圍棋〉 (Mastering the game of Go without human knowledge) ,展示了強化版的程式AlphaGo Zero,證明在全球最困難的棋藝競技中,人工智慧可以在沒有任何人類知識的基礎上,純粹靠自我學習成為制霸王者。

AlphaGo Zero代表從零開始,DeepMind開發團隊只輸入了基本的圍棋規則,剩下的時間它會自行下棋,記錄下每次的勝負決策、不斷學習,自己成為自己的老師,加上沒有人類的經驗和成規束縛,讓人工智慧突破舊有的知識限制,發展出新的弈棋策略,很快的達到登峰造極新境界。


AlphaGo Zero誕生後,只花了3天時間就贏了去年打敗李世乭的AlphaGo版本,局數勝負是毫無懸念的100:0。21天之後,AlphaGo Zero再度進化,能力超越了今年中打敗世界冠軍柯潔的AlphaGo Master版本;40天後,它完成了2900萬次的對戰學習,與過去最強的AlphaGo對弈,它的勝率來到90%,成為了至今最優秀的版本,也是歷史上最強的「圍棋棋手」。

DeepMind指出,他們不使用任何人類知識,AlphaGo Zero用上的是新的「強化學習」方法,透過神經網路和演算法結合,持續自我對弈練習幾百萬、幾千萬場,每次的更新都能增強、調整系統,用以預測下一步落子的方向和遊戲輸贏走勢。幾天時間內,AlphaGo Zero就從一塊純潔的白板,在上頭不斷揮灑、創造知識,很快勝過了人類累積千年的圍棋智慧。

TAG:

 

評分:0

我來說兩句

顯示全部

:loveliness: :handshake :victory: :funk: :time: :kiss: :call: :hug: :lol :'( :Q :L ;P :$ :P :o :@ :D :( :)

日曆

« 2019-10-16  
  12345
6789101112
13141516171819
20212223242526
2728293031  

數據統計

  • 訪問量: 91749
  • 日誌數: 54
  • 圖片數: 5
  • 影音數: 7
  • 建立時間: 2013-12-14
  • 更新時間: 2019-07-08

RSS訂閱

Open Toolbar
Gain More Traffic with SiteBro