[FB] 黃士傑 11/10人工智慧年會介紹AlphaGo Zero 開發過程 - Gossiping板

首頁(home) 上頁(↑) 下頁(↓) 末頁(end)

※ 本文為 MindOcean 轉寄自 ptt.cc 更新時間: 2017-10-20 11:01:19

看板 Gossiping

作者 jkkert (.....)
標題 [FB] 黃士傑 11/10人工智慧年會介紹AlphaGo Zero 開發過程
時間 Fri Oct 20 10:55:59 2017

ＦＢ卦點說明：（繁體中文 20 個字）
黃博士：
11月10日在人工智慧年會的演講，我也將介紹AlphaGo Zero的精彩故事。

(中略......)

AlphaGo Zero對戰Master達到近90%勝率，
成為有史以來AlphaGo棋力最強的版本。

ＦＢ連結：
https://goo.gl/kDKy99

ＦＢ內容：

大家好，我們很高興與大家分享AlphaGo的第2篇論文，非常榮幸AlphaGo團隊再次登上了
世界頂尖的《自然》雜誌。

11月10日在人工智慧年會的演講，我也將介紹AlphaGo Zero的精彩故事。

這篇論文介紹了AlphaGo Zero，也就是完全脫離人類知識的AlphaGo版本。主要成果如下
：

- AlphaGo Zero從零開始自我學習下圍棋。
- 僅僅36小時後，AlphaGo Zero靠著自我學習，就摸索出所有基本且重要的圍棋知識，達
到了與李世石九段對戰的AlphaGo v18的相同水平。
- 3天後，AlphaGo Zero對戰AlphaGo v18達到100%的勝率。
- 不斷進步的AlphaGo Zero達到了Master的水平。Master即年初在網路上達成60連勝的
AlphaGo版本。
- 40天後，AlphaGo Zero對戰Master達到近90%勝率，成為有史以來AlphaGo棋力最強的版
本。

雖然AlphaGo Zero沒有公開下過棋，
在論文中我們附上了AlphaGo Zero的80局棋
(選自不同階段的自我學習，https://goo.gl/Q7nUHS )，
供大家研究。

從圍棋技術的角度來說，AlphaGo Zero自學所發現的圍棋觀念，例如打劫、征子、棋形、
開局先下在角部，開局定式等等，絕大部分與人類的圍棋觀念是一致的，這也間接呼應了
人類幾千年以來圍棋研究的價值。

AlphaGo Zero的棋風特別好戰，並且也喜歡直接點33。
從論文內容來說，這主要是一篇強化學習的論文，關鍵技術在於強化學習訓練pipeline的
效能極大化。

針對這篇論文或AlphaGo想要提問的朋友，請參加明天的AlphaGo AMA，AlphaGo團隊的
David Silver與Julian Schrittwieser將在線以英文回答大家的問題。
https://goo.gl/Vo2qoZ

AMA: We are David Silver and Julian Schrittwieser from DeepMind’s AlphaGo team. Ask us anything. : MachineLearning

Hi everyone. We are David Silver (/u/David_Silver) and Julian Schrittwieser (/u/JulianSchrittwieser) from [DeepMind] ( We... ...

※ 臉書爆卦請用ＦＢ當標題，並附上２０繁體中文說明卦點，違者水桶一個月。

※ 注意！濫用ＦＢ爆卦視同鬧板文處理。

※ 記得要附上來源網址。

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.114.123.139
※ 文章代碼(AID): #1PwMN4nA (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1508468164.A.C4A.html

※ 編輯: jkkert (140.114.123.139), 10/20/2017 10:56:34

→ snowrain: 土條核廢料放你家(大誤)1F 10/20 10:57

→ chadmu: 分類啦2F 10/20 10:58

推 abc0922001: 對戰Master到90%，是怎樣...3F 10/20 10:58

※ 看板: Gossiping　文章推薦值: 0 目前人氣: 0 累積人氣: 678　

分享網址: 複製

DispBBS

回到看板(←)《Gossiping》

r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄同主題: =)首篇 [)上篇 ])下篇

回列表(←) 分享