Re: [新聞] AlphaGo下一步在哪傳將挑戰《星海爭霸》 - Gossiping板

首頁(home) 上頁(↑) 下頁(↓) 末頁(end)

※ 本文為 MindOcean 轉寄自 ptt.cc 更新時間: 2016-03-13 13:52:21

看板 Gossiping

作者 Verola (sometimes I love you)
標題 Re: [新聞] AlphaGo下一步在哪傳將挑戰《星海爭霸》
時間 Sun Mar 13 03:37:36 2016

※ 引述《pkyosx (Insomnia)》之銘言：
: : 老實說我覺得也可能是 SC2 沒打算把AI做得太強而已。
Alpha的強弱不是人類幫他設定的是他自己去學去領悟出來的
現在要測試的就是人工智慧的學習能力跟悟性
所以一開始什麼都不會教他看他能不能學會怎麼玩Game
: DeepMind 要做的可不是遊戲內建的 AI 系統
: 他要做的是 general purpose AI 也就是作為一個跟你我一樣起點的玩家
: 他們之前做的都是相對簡單的遊戲小蜜蜂打磚塊
: 他們架了攝影機對著電腦銀幕當做 AI 的眼睛
: 然後只給 AI 一個目標就是得高分
: https://youtu.be/0X-NdPtFKq0?t=1219

Public Lecture with Google DeepMind's Demis Hassabis - YouTube Watch the founder of Google DeepMind's Demis Hassabis' lecture about the future and capabilities of artificial intelligence. This video was filmed by IET TV....

https://youtu.be/V1eYniJ0Rnk 這個版本比較快

Google DeepMind's Deep Q-learning playing Atari Breakout - YouTube Google DeepMind created an artificial intelligence program using deep reinforcement learning that plays Atari games and improves itself to a superhuman level...

看這影片可以更理解AlphaGo是什麼跟DeepMind想要測試什麼
還有另一個影片是打超級馬利歐的

一開始Alpha什麼都不知道只知道他可以操作畫面目標是得高分

第一階段

他觀察回饋學會螢幕上的bar可以被他移動他的bar可以反彈球(光點)
學會那顆球會反彈回去打破磚塊學會如何不要game over

第二階段他觀察到打磚塊跟分數的關係搞懂這遊戲如何拿分數

第三階段他觀察到如何拿高分可以打很久都不會死

第四階段他找到秘技(在這遊戲不算bug)
把球打到磚塊背面去輕鬆拿高分

在這遊戲的例子中他進化到第四階段只花了4小時

: 如果他真的可以做到讓 AI 也是看著他的電腦銀幕然後操作鍵盤滑鼠
: (鍵盤滑鼠可能就直接打訊號了)
: 基本上等於又完成一個很重大的里程碑了
: 代表他不只可以應付簡單的環境連複雜的策略應對能力都有了

然後現在要把這個學習過程搬到星海上
超級瑪莉跟其他不少他已經破關過
圍棋他也算某種程度破關了(?)

推 signm: 終於有篇正解了，電腦ai做到的事不代表alpha知道03/13 01:23

星海AI是人寫的教AI怎麼作 Alpha一無所知要測的就是他如何去學習的過程

→ signm: 這跟微操沒關係，重點是要讓電腦思考，這有點難解釋03/13 01:25

用上面四階段套大概就是搞懂星海這遊戲怎玩怎麼贏怎麼變得很厲害

推 arnold3: 人類光是懂得開密技就不可能輸給ai了03/13 01:29
→ arnold3: 再不然去網站找破解黨總有辦法對付

你確定人類找秘技的速度會比Alpha快嗎
人類的優勢是數量多思考的人多以及可以透過網路傳遞知識經驗跟秘技

推 tetani: 要怎麼讓電腦知道目標? 萬一誤認成得低分呢?03/13 01:30

他都可以理解圍棋怎樣叫贏了

推 tetani: youtube裡面AI玩小遊戲練習到最後那已經不像人類了03/13 01:32

推 a2156700: 感覺只是時間的問題...03/13 01:34

推 wnglon: https://dotblogs.com.tw/allanyiin/2016/03/12/22221503/13 01:37

淺談Alpha Go所涉及的深度學習技術 | 尹相志Allan's blog - 點部落

介紹AlphaGo的技術原理，以及背後涉及到的類神經網路以及深度學習技術。 ...

推 signm: 到目前alpha玩的還是這種規則簡單遊戲要讓它學習更複雜所以03/13 01:39
→ signm: 才有這新聞
推 signm: 之前的討論是用電腦角度去看當然覺得穩贏

推 sadmonkey: 說實在把圍棋用圖形化理解是簡化問題，把玩遊戲用圖形03/13 02:13
→ sadmonkey: 化理解只是複雜化問題，只是對工程師出考題對解決人類
→ sadmonkey: 無法解決的問題沒有甚麼幫助

--
標題 Re: [問卦] 過年要如何叫不熟的親戚閉嘴? 看板《Gossiping》 (#1KurUyPF)
「怎麼這麼久沒回來阿？」「我這不是來了嗎？」
「要常常回來給我們看阿」「我不知道你要見我阿，你這不是見到了嗎？」
「趕快生小孩阿！人家阿花都已經生了一個了！」「那他生了一個，有沒有要生第二個？」
「有錢沒錢，結婚好過年嘛！」「你們的婚姻能維持這麼久，真不簡單！」
「ㄟ，你怎麼這樣說話？對長輩真沒禮貌！」「我把你們當人看，要教育你們！」

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.230.18.167
※ 文章代碼(AID): #1Mv704Pg (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1457811460.A.66A.html

推 kimifort: 還好AlphaGo桌面沒安裝PCMan 不然就讓他學會發一堆廢文1F 03/13 03:39

推 owenkuo: 那一天，人類想起了AlphaGo當年開始打敗人類的起點....2F 03/13 03:40

推 milkBK: 先看rp讓他知道採礦能造兵，造兵能打贏，3F 03/13 03:41
→ milkBK: 然後慢慢去模擬，最後發現最強其實是6d

推 GalLe5566: 領悟(X) 計算(O) 他只是單純算怎麼做勝率高5F 03/13 03:42

→ wnglon: https://dotblogs.com.tw/allanyiin/2016/03/12/2222156F 03/13 03:42

淺談Alpha Go所涉及的深度學習技術 | 尹相志Allan's blog - 點部落

介紹AlphaGo的技術原理，以及背後涉及到的類神經網路以及深度學習技術。 ...

→ wnglon: 阿發狗的原型別再誤導大眾了7F 03/13 03:43

推 dans: 那阿發狗能從八卦版計算出怎樣發廢文可以得最多噓嗎8F 03/13 03:43
→ dans: 我在廢文之道上已感力不從心希望藉由與阿發狗一戰得到靈感

→ wnglon: 你要用幾顆CPU去計算星海的最佳微操瘋了嗎你10F 03/13 03:44

推 hibbb: 其實應該是要讓阿法狗和電腦正常對戰個1000場再挑戰人類11F 03/13 03:45
→ hibbb: 然後由人類方狂放快攻戰術看看阿發狗到底會怎麼應對

→ leon80148: 如果只跟一般AI打，最後電腦應該只會每場都放大招吧13F 03/13 03:46

→ hibbb: 很明顯打正規無論是資源或微操阿發狗都強太多了14F 03/13 03:46

→ wnglon: 阿發狗是在對戰時跟自己對奕去找出機率較大的贏法15F 03/13 03:46
→ wnglon: 請問星海要怎樣算出最佳演算法?
→ wnglon: 麻煩看一下連結

推 godsparticle: 打一場星海要多久? 他可能學很慢18F 03/13 03:48

→ wnglon: 星海不是回合制沒辦法及時喔可能要計算個一分鐘19F 03/13 03:49
→ wnglon: 才能找到最佳解
→ wnglon: 鄉民臉腫了哈哈

→ leon80148: 理論上是可以的至於演算法要怎麼寫一般人怎會知道22F 03/13 03:51

→ wnglon: 繼續嘴砲沒關係23F 03/13 03:51

推 dans: 邊走邊算不就好了若要算出最佳解才能移動圍棋也不用玩了24F 03/13 03:52

→ wnglon: 起碼阿發狗概念目前絕對不能運用25F 03/13 03:52

→ DarkerDuck: alphago找出來的本來就不是最佳解，根本不用找最佳解26F 03/13 03:52

→ wnglon: 他是用2000多顆去計算的星海要幾顆?27F 03/13 03:52

→ DarkerDuck: alphago的架構是為圍棋特化的弱AI28F 03/13 03:53

→ leon80148: 在跟李40比賽之前也一堆人覺得阿發狗會被玩封阿...29F 03/13 03:53

→ wnglon: 口誤不好意思30F 03/13 03:53

→ dans: 邊走邊算不就好了？開局固定起手勢不就那幾個？31F 03/13 03:53

→ Enrollee: 我比較好奇為什麼有人會覺得阿發狗不會玩星海? XD32F 03/13 03:53

→ dans: 戰略遊戲的"定石"還比圍棋少開局多的是時間可以算33F 03/13 03:54

→ wnglon: 連結不就有解說了34F 03/13 03:54

→ Enrollee: 星海很難嗎? 坦白講連圍棋都能贏了，星海很難嗎?35F 03/13 03:54

→ leon80148: 圍棋複雜度也不低但阿髮狗證明他就是有辦法學起來36F 03/13 03:54

→ wnglon: 不是用學的怎麼有人還搞不懂37F 03/13 03:54

→ leon80148: 更何況在微操跟計算資源這方面電腦根本大勝好嗎38F 03/13 03:54

→ dans: 圍棋就是邊走邊算只是Google沒告訴你讀秒是內建限制的39F 03/13 03:54
→ dans: 根本不是算不出答案才搞到讀秒，而是永遠在規範時間內求解

→ wnglon: 圍棋是一瞬間算大量的走法才會用到2000顆CPU41F 03/13 03:56
→ wnglon: 這過程起碼也要一分鐘以上有看棋嗎

推 dans: 你確定是算答案花一分鐘，還是工程師告訴他每一步都有一分鐘43F 03/13 03:58
→ dans: 拿那時間來說計算過程要多久會不會太天真了，機器不會自己決

推 henry1234562: 這個機制就是學習實際上這alphago就會玩小遊戲45F 03/13 03:58

→ dans: 定計算時間，而是別人告訴他什麼時候可以用多少時間46F 03/13 03:58

推 wnglon: 你去看今天比賽電腦有哪一步是即時下的47F 03/13 03:59

→ leon80148: 最好電腦在算的過程就完全不會動按著S讓你A假的。48F 03/13 03:59

→ dans: 說不定阿發狗20秒就算完答案還上網跟初音聊了40秒的天49F 03/13 03:59

→ henry1234562: 電腦不需要即時下他有時間為啥要即時下50F 03/13 04:00

→ dans: 只因為主辦單位跟他說比賽前段要一分鐘才能落子，後段要30秒51F 03/13 04:00

→ henry1234562: 且實際上昨天alphago進讀秒時他就固定30秒一子52F 03/13 04:00

→ wnglon: 你去GO版看有推文已經完整解釋其演算法53F 03/13 04:00

→ henry1234562: 一秒都沒多用他早就計算完你也不知道54F 03/13 04:00

→ leon80148: 搞不好電腦發現在幾秒鐘下的時後贏的機率最高zzz55F 03/13 04:01

推 willy61615: 你看到平行世界的阿發狗喔阿發狗後段明明常出現30秒56F 03/13 04:01
→ willy61615: 之內一步的

→ dans: 有演算法有什麼用？會告訴我們Google給阿發狗設定幾秒落子嗎58F 03/13 04:01

推 grandwar: 說開作弊會贏的，你以為工程師不會預測你開作弊嗎？XD59F 03/13 04:02

→ wnglon: 你去看連結好嗎別再跟我辯這個看完再說這套理念能不能60F 03/13 04:02
→ wnglon: 用在星海

→ Enrollee: 基本上星海這種軍備競賽遊戲對阿發狗來說實在是簡單啦62F 03/13 04:02

→ Justisaac: 主要是要從程式計算的最佳化進化到圖型運算吧63F 03/13 04:02

→ leon80148: 奇怪捏一直提連結作啥，我看了連結還是覺得很厲害阿64F 03/13 04:03

→ Justisaac: 而且星海的問題是模擬上需要先解析遊戲程式.....65F 03/13 04:03

→ Enrollee: 推文就有鄉民說了連爆雪都辦得到何況是阿發狗66F 03/13 04:03

→ Justisaac: 不然無法像圍棋那樣一天下1000萬局....67F 03/13 04:03

推 henry1234562: 當然可以用在星海..你搞錯了一些東西68F 03/13 04:04
→ henry1234562: alphago 可不是每一場都從0開始重新計算

推 jinmin88: 訓練的核心應該都是同一套只是agent要特製化...70F 03/13 04:04

→ henry1234562: 是訓練了很久才到現在這程度這就是學71F 03/13 04:04

→ Justisaac: 無論如何跟圍棋比都還是慢太多需要更快的學習法吧72F 03/13 04:05

→ leon80148: 應該沒這麼複雜啦星海自己都有內建AI了73F 03/13 04:05

→ henry1234562: 能夠學打磚塊能學小蜜蜂當然能學星海74F 03/13 04:05

推 wnglon: 重點阿發狗根本是自對奕來計算勝率沒有所謂的學習75F 03/13 04:05

→ henry1234562: alphago 的勝率計算法包含過去對奕過的所有經驗76F 03/13 04:06

→ Justisaac: 前面我看那些遊戲是以小時計算來學習的77F 03/13 04:06

→ henry1234562: 而不是只從當下這局去算分支78F 03/13 04:06

→ leon80148: 即時戰略就是在比控兵,計算資源,偵查及部分博奕成分79F 03/13 04:06

→ Justisaac: 那轉換成星海不就變成要以幾萬小時來算了..80F 03/13 04:06

→ henry1234562: 會利用過去經驗就是學習81F 03/13 04:06

→ leon80148: 沒理由圍棋作的到星海作不到82F 03/13 04:07

推 grandwar: 你看完那篇怎麼會有他沒有學習的誤會？XD 只是他的學習83F 03/13 04:07

→ Enrollee: 圍棋阿法狗需要思考沒錯因為可以變動的變項太多84F 03/13 04:07

→ Justisaac: 就只是學習方式跟人很像不一樣其實都一樣85F 03/13 04:07

→ grandwar: 還在很初階的階段而已啊86F 03/13 04:07

→ henry1234562: 是電子遊戲就能加速且也能從錄像學習87F 03/13 04:07

→ Justisaac: 人也是try and error開始學習的~88F 03/13 04:07

→ leon80148: 星海一場通常不到20分鐘就打完了好嗎。這幾場圍棋都用89F 03/13 04:07
→ leon80148: 小時來算的

→ henry1234562: 當然以現在的程度要學多久不知道91F 03/13 04:07

→ Enrollee: 星海只要拼速度殺暴對方就好了人是快得過電腦的速度逆92F 03/13 04:08

→ Justisaac: 我在想設計小組是不是在嘗試不加速要怎麼加速學習93F 03/13 04:08

推 Cocochia: 經驗累積其實不就是學習嗎？94F 03/13 04:08

→ henry1234562: 我覺得只是沒有花時間去加速遊戲而已95F 03/13 04:08

推 jinmin88: 星海的學習難度應該比方塊阿馬力歐的難度多很多96F 03/13 04:09

→ grandwar: 電腦光用電子訊號控兵，你的速度絕對跟不上他啦97F 03/13 04:09

→ henry1234562: 畢竟重點是在驗證這個方式能不能有學習效果98F 03/13 04:09

→ Justisaac: 去加速遊戲其實就又跳入舊框架啦~99F 03/13 04:09
→ Justisaac: 現實世界是沒辦法加速的~ai勢必要面對這個問題~

→ Enrollee: 控兵跟生產單位的速度人怎麼跟電腦拼啦? 這有啥好戰的?101F 03/13 04:09

推 wnglon: 自對奕得來結果如果相同概念就在遊戲中模擬對戰102F 03/13 04:09

→ henry1234562: 不需要阿 AI在學習的過程不需要跟人類一樣103F 03/13 04:09

→ Justisaac: 你可以把電腦的控兵限制在使用滑鼠與鍵盤啊.....104F 03/13 04:09

→ grandwar: 應該要叫阿法狗只能用機械手控105F 03/13 04:10

→ Cocochia: 只是人類有想像力，可以抽象具體轉來轉去，電腦不行，或106F 03/13 04:10
→ Cocochia: 是需要更多CPU或其他組件來幫助。

→ Justisaac: 然後限制一下滑鼠移動的速度跟鍵盤和滑鼠鍵的點擊數108F 03/13 04:10
→ Justisaac: 不用機械手臂啦控制它能使用的操控指令就好不難

→ wnglon: 光是大局觀就有的想了就先到這邊了不多說110F 03/13 04:11

→ henry1234562: 只要操作是與玩家條件相同就好111F 03/13 04:11
→ henry1234562: 你也不需要多說因為你不懂學習

→ Justisaac: 挑戰即時戰略應該是ai侵入人類世界的第一步XD113F 03/13 04:12

→ wnglon: 276848說很清楚不多說也不指責114F 03/13 04:12

→ Justisaac: 從統計進化到時間序列哈哈115F 03/13 04:12

→ henry1234562: 會認為 CPU數量有影響表示你還停留在舊的觀念116F 03/13 04:12

→ leon80148: 我真的不是很清楚一篇被噓爆的文章是想清楚表達什麼117F 03/13 04:13

→ Justisaac: 我在想圍棋應該也有必勝法~阿法狗不知道找出來沒XD118F 03/13 04:14

→ henry1234562: alphago沒辦法找出必勝法吧119F 03/13 04:14

→ Justisaac: 不過他的思考模式不是窮舉法所以應該還沒吧0.0120F 03/13 04:14

→ henry1234562: 必勝法建立在能套用到"所有"步法都成立上121F 03/13 04:15
→ henry1234562: 圍棋的所有步法不可能用窮舉法搜完
→ henry1234562: alphago只能訓練到非常不容易輸而已

推 wnglon: 反正GO有人說電腦要自對奕需要大量運算而且要算好幾萬盤124F 03/13 04:16
→ wnglon: 才會用到2000多顆CPU

→ henry1234562: 自對奕的運算大部分不是在實際對弈時126F 03/13 04:17

→ wnglon: 不然很難短時間內完成這些動作127F 03/13 04:17

→ henry1234562: 而是自我對奕訓練時128F 03/13 04:17
→ henry1234562: alphago 已經練過上億場基於這些經驗才這麼強
→ henry1234562: 並不是在對奕當時才計算這些場次來找勝率

→ wnglon: 但你要對手下一步棋你才能計算下一步哪可能馬上算好131F 03/13 04:18

→ Justisaac: 不過光是可以把不同棋局的經驗拿來用我覺得就是里程碑132F 03/13 04:18

→ henry1234562: 不需要馬上圍棋本來就有思考時間133F 03/13 04:18

→ Justisaac: 畢竟每盤棋局都不同.....134F 03/13 04:18

→ wnglon: 難道你感覺不出昨天的比賽 AI花的時間有忽快忽慢135F 03/13 04:19

→ henry1234562: 且alphago又不是對手還沒下就沒再計算136F 03/13 04:19
→ henry1234562: 你對學習的定義有點狹隘
→ henry1234562: 並不是學習好之後就應該要不用計算的下每一步
→ henry1234562: 只要過去的經驗會讓下一次計算更正確就是學習

推 Enrollee: Alphago玩星海有什麼好慢的 XD 反正他就是要殺爆對手啊140F 03/13 04:20

→ Justisaac: 慢是為了讓他跟人類比賽~141F 03/13 04:20

我覺得跟人類比賽正是重點之前的小遊戲都是面對有固定AI的電腦
很容易被Alpha找出破解之道
圍棋開始對手換成人類
所以預測人類對手的棋步變成重點
星海應該重點也是在這邊
如何從人類對手可觀測到的動向預測人類對手的下一步下下步動向
並進而思考採取相對應策略回應人類對手
這都是在把人工智慧導入博奕格局的訓練
以後還可以拓展到類似的其他人類博奕賽局...

→ wnglon: 你說的點還是很有問題..142F 03/13 04:20

→ henry1234562: alphago實際對奕花的思考時間並不是啥重點143F 03/13 04:20

→ wnglon: 反正我也不是專業你去GO版討論吧144F 03/13 04:21

→ Justisaac: 而且很有可能手速會影響戰術甚至影響戰略~145F 03/13 04:21

推 Cocochia: 我知道你說的，我說的是如果要讓電腦思考方式跟人腦一樣146F 03/13 04:21

→ henry1234562: 他這段時間確實就是在計算這就相當於人類的思考147F 03/13 04:21

→ Cocochia: 的話，比如抽像具體轉換，視覺（電眼）轉為思考（AlghaG148F 03/13 04:21
→ Cocochia: O)這種比較複雜層次的東西。

→ henry1234562: 人類下棋也是預想接下來對奕狀況選擇最好的150F 03/13 04:21
→ henry1234562: alphago做的事情完全一樣只是規模不一樣

推 dryadg27724: 推152F 03/13 04:22

→ henry1234562: alphago用的三種方法第三種就是各種局面的勝率153F 03/13 04:22
→ henry1234562: 自我對奕是第二種用來修正他自己的步法

→ Cocochia: 因為AlphaGO可以計算勝率，卻無法分辨何者是棋子，何者155F 03/13 04:23
→ Cocochia: 是石頭，所以需要別的組件幫助他。

→ henry1234562: 這我保留能自我對奕跟讀棋譜應該是能分辨棋子157F 03/13 04:25

→ Justisaac: 抽象概念電腦好像有點難理解語言學不好也是這原因158F 03/13 04:25

→ henry1234562: 不過是指人類的五感這種分辨那自然還不行159F 03/13 04:25

→ Justisaac: 圍棋其實他不用分辨棋子啊~用座標系理解就好160F 03/13 04:26
→ Justisaac: 要轉換到星海就真的是需要圖型辨識能力了
→ Justisaac: 除非作弊去讀記憶體可是我覺得這就失去突破點...

→ henry1234562: 就跟學打磚塊一樣163F 03/13 04:27
→ henry1234562: 實際上學得會打磚塊還學會怎麼輕鬆拿高分

推 Cocochia: 哦？ AlphaGO有圖像分辨能力是嗎？太驚人了！165F 03/13 04:27

→ henry1234562: 所以我認為辨識不太是大問題166F 03/13 04:28

→ Cocochia: 原來是我誤會了。167F 03/13 04:28

推 HTCtriple2: 圖像辨識已經是很普遍的技術了......168F 03/13 04:29

→ Justisaac: 普遍的技術不一定代表阿法狗有裝啊XD169F 03/13 04:30

→ henry1234562: 那就不太是需要討論的問題..170F 03/13 04:30

→ Justisaac: 也不一定代表阿法狗有圖像學習的能力~171F 03/13 04:30
→ Justisaac: 圖像思考跟數學計算差距其實很大~

→ henry1234562: 我認為看過打磚塊影片很難認為沒圖像學習能力173F 03/13 04:31
→ henry1234562: 就已經玩過打磚塊馬莉歐小蜜蜂等小遊戲了
→ henry1234562: 這些也都是即時的怎麼看都有學習能力

→ jinmin88: 圖形辨識對google來說根本小case..看人家無人車做得多好176F 03/13 04:32

→ Justisaac: 打磚塊那個學習就我看起來應該是更簡單的學習法177F 03/13 04:32

打那些遊戲好像沒有用圖象辨識來理解簡化成一堆參數就好
https://youtu.be/qv6UVOQ0F44

MarI/O - Machine Learning for Video Games - YouTube
MarI/O is a program made of neural networks and genetic algorithms that kicks butt at Super Mario World. Source Code: "NEAT" Pap...

→ leon80148: 阿髮狗裝圖像辨識能力是要幹嘛? 他就是設計來學下圍棋178F 03/13 04:32

→ henry1234562: 而且發表會有講輸入就只有要求alphago拿高分179F 03/13 04:32

→ jinmin88: 這應該也是deepmind加入google能夠馬上享受到的好處吧180F 03/13 04:32

推 HTCtriple2: 沒有裝就裝啊圖像辨識很一般的技術 = =181F 03/13 04:32

圖像辨識本身也是一種深度學習學習分辨什麼是貓什麼是狗

→ Justisaac: 很可能只是讀分數與操控間的關聯而已....182F 03/13 04:32

→ henry1234562: 其他操作法甚至打磚塊規則都沒給183F 03/13 04:32

→ Justisaac: 不用規則啊左右移+分數多寡就能學習了184F 03/13 04:33

→ henry1234562: 你看他的操作很明顯他知道哪個是球185F 03/13 04:33

→ jinmin88: 我猜阿發狗應該是透過圖像辨識吃入大量的網路上的棋譜186F 03/13 04:34

→ Justisaac: 該給的資訊給一給剩下就是怎樣高分而已啦~187F 03/13 04:34

→ henry1234562: 給的資訊只有拿高分其他都沒給阿...188F 03/13 04:35

→ Justisaac: 吃棋譜進去最後也是轉成數位啊0.0189F 03/13 04:35

→ henry1234562: 發表會就說了190F 03/13 04:35

→ Justisaac: 我說的資訊是指球速橫棒移動磚塊位置這些..191F 03/13 04:35

→ leon80148: 想太多棋譜一定要圖像嗎... 棋譜要數據化很容易吧192F 03/13 04:35

→ henry1234562: 懷疑有沒有圖像技術真的是沒啥意義193F 03/13 04:35

→ Justisaac: 不讀進去他連棒子在哪都不知道怎麼玩XD194F 03/13 04:35

→ henry1234562: 因為沒有就給就好這並不是很難的技術195F 03/13 04:36

→ leon80148: 對阿搞錯重點了重點在於他核心的機器學習能力196F 03/13 04:36

→ Justisaac: 我只是好奇他們找不找得到縮短學習時間的方法而已~197F 03/13 04:36

→ henry1234562: 能讀取到的資訊自然就能利用來學習198F 03/13 04:37

→ leon80148: 其它技術層面的東西可以在另外克服199F 03/13 04:37

→ Justisaac: 打磚塊要學4小時的話星海學起來效率就太差了200F 03/13 04:37

四小時是發現很多人不知道的秘技 2小時他就玩的比大多數人類好了

→ henry1234562: 四小時不重要因為這要縮短太容易了201F 03/13 04:37
→ henry1234562: 是從0開始學習才是要學四小時

→ Justisaac: 嗯?這容易的話下棋就都不用思考時間了203F 03/13 04:38

→ henry1234562: 這兩者一點關係都沒有..我不知道你怎麼連結的204F 03/13 04:38

→ Justisaac: 玩星海也是從0開始啊萬一要學10萬小時那不是太沒效率205F 03/13 04:38

→ henry1234562: 沒人規定你要從0開始阿..206F 03/13 04:38

→ Justisaac: 你要他怎麼不是從0開始XD207F 03/13 04:39

→ henry1234562: 實際上 alphago學圍棋就不是從0開始208F 03/13 04:39
→ henry1234562: 而是先讀了一堆棋譜學會人類是怎麼下才開始

→ Justisaac: 他是從零也不是從零~最終還是ai要搞懂勝率啊~210F 03/13 04:39

→ henry1234562: 同理星海 alphago不需要從0開始學操作跟戰術211F 03/13 04:40
→ henry1234562: 完全可以直接給現有的操作跟戰術在讓他自己升級
→ henry1234562: 是否有基礎戰術理解對學習時間縮短絕對很有效
→ henry1234562: 這就是我說的要縮短學習時間方法太多
→ henry1234562: 沒必要每個都像打磚塊一樣一開始連要接球都不知道
→ henry1234562: alphago 從0開始到知道要接球可是花了300場

→ Justisaac: 整體聽起來比較像給工程師的挑戰不是阿法狗的挑戰XD217F 03/13 04:42

→ henry1234562: 但從知道接球到知道最好戰法只花500場218F 03/13 04:43

→ Justisaac: 怎麼分析讓阿法狗搞懂星海才是大問題XD219F 03/13 04:43

→ henry1234562: 如果你一開始就告訴alphago要接球他就省下一半時間220F 03/13 04:43

→ Justisaac: 終究是要花時間學習~只是學習的是工程師~XD221F 03/13 04:43

※ 編輯: Verola (36.230.18.167), 03/13/2016 04:45:50

→ leon80148: 學習的不是工程師工程師設計出邏輯和演算法電腦執行222F 03/13 04:45
→ leon80148: 然後想辦法完成任務並學習

推 m80126colin: 某 w 說自己不是專業剛剛還跳針那麼久，藉由建立過去224F 03/13 04:47
→ m80126colin: 經驗來縮短計算時間，那麼建立的過程不就是「學習」

→ leon80148: 這其實已經很不容易了。226F 03/13 04:47

→ m80126colin: ？那是我們心態不對，學習總要往「最佳化」前進，但227F 03/13 04:47
→ m80126colin: 是阿法狗告訴我們，你每次局部取最優，未必能達到全
→ m80126colin: 局最優，人類只是把這個世界簡化成 greedy 的模型罷
→ m80126colin: 了。

推 mainline: 總算出現了水準文不過某w是不是理解錯誤以至於看起來231F 03/13 04:56
→ mainline: 像來亂的

推 chungyiju: AlphaGo加油努力學習吧~233F 03/13 04:59

推 m80126colin: 太小看自動化以及人工智慧取代未來的要小心沒有做準234F 03/13 05:00
→ m80126colin: 備的衝擊

推 Cocochia: 感謝原波解說，我的圖像辨識正是那個意思。236F 03/13 05:01

推 dryadg27724: 有超級馬利的影片嗎？237F 03/13 05:52

推 Xenosaga: 這樣看來下圍棋只是阿發狗的起點而已238F 03/13 05:56

推 farmerlu: A.I. 同修推 +p239F 03/13 05:58

→ Xenosaga: 最終目標最少是基礎的人工智能自我學習分析240F 03/13 05:58
→ Xenosaga: 至少可以取代無塵室生產線那些行屍走肉的麥肝作業員
→ Xenosaga: 你把工廠環境跟生產參數輸入之後它可以做到世界末日
→ Xenosaga: 只要沒有大問題出現他還可以自我校正
→ Xenosaga: 一整座液晶螢幕生產線大概只要1名工程師跟保全就可以了
推 Xenosaga: 希望不要發展得太快這會造成人類社會革命

→ Verola: https://youtu.be/qv6UVOQ0F44246F 03/13 06:16

MarI/O - Machine Learning for Video Games - YouTube
MarI/O is a program made of neural networks and genetic algorithms that kicks butt at Super Mario World. Source Code: "NEAT" Pap...

推 fucigniz: 樓樓上和這篇都想太多了做一個自我校正的機器那廠商247F 03/13 06:48
→ fucigniz: 要賺啥? 還有 alphago 根本不能稱之為思考他一開始還是
→ fucigniz: 要有人餵牠棋局他只是用快速有效率的方式整理考古題
→ fucigniz: 自我對弈也不過就是在驗證考古題的準確率。大家應該都
→ fucigniz: 知道靠自己求解一個題目和收集考古題的差別。
→ fucigniz: 最簡單的就是為什麼這麼多厲害的工程師卻選擇把投資
→ fucigniz: 程式放出去賣而不是靠它賺錢? 棋局能被破解本來就是遲
→ fucigniz: 早的事因為它在有限時間內母體是固定的今天把圍棋規則
→ fucigniz: 改得更複雜它就不能適應了第二它所吃的數據與輸贏有
→ fucigniz: 關今天如果把它改在一個隨機斷電的環境它有可能下一半
→ fucigniz: 就被切斷, 它最後是無法統計到輸贏的。而真實世界的問題
→ fucigniz: 多半是像後者那樣複雜。
推 fucigniz: alphago能贏的關鍵, 在於這遊戲下的每一子, 最後都會對
→ fucigniz: 應到某些答案至於真實世界你的數據可能與答案完全無關

推 Jimmywin: 塞魯...261F 03/13 07:07

推 harry886901: 吵回合制的話，他玩爐石不是超強262F 03/13 07:10

推 fucigniz: 而工程師的功用就是當一個問題變簡單要去創造更多問題263F 03/13 07:17

推 herculex: alphago不去限制他的手速，怎麼跟他玩264F 03/13 07:20

推 fucigniz: 很簡單, 你只要改變遊戲規則就可以。265F 03/13 07:22
→ fucigniz: alphago 在和人對弈的時候某些情況會突然斷電或改變
→ fucigniz: 遊戲規則, 甚至明明贏要讓它輸讓他無法直線判斷方向

推 dbalruke: 事實上是把規則改得更複雜，他還是能適應，至少適應的比268F 03/13 07:25
→ dbalruke: 人類快，人工智能有個重點，他不一定要像神一樣完美，他
→ dbalruke: 只要比人類強一點點，就有價值了，google 無人車也有可
→ dbalruke: 能出車禍，但比人類好太多了。我比較好奇的是，人類是否
→ dbalruke: 可以靠向alphago學習，最終破解圍棋這個遊戲

推 fucigniz: alphago的思維還很像台灣高中生他並不懂獨立思考273F 03/13 07:27
→ fucigniz: 它是從考古題海裡找出怎麼走靠統計判斷勝率
→ fucigniz: 現在的AI還是只能這樣人類與其擔心AI 不如擔心有沒有
→ fucigniz: 激進的納粹份子二十年內害人機器可能連小學生都能做
推 fucigniz: 我認為人類該做的事是放棄圍棋去做更重要的事
→ fucigniz: 這證明了圍棋是一個靠題海+計算就能攻克的遊戲
→ fucigniz: 棋手不應該浪費他優秀的腦袋在這個遊戲上面

推 tiuseensii: 嗯，田徑球類活動都可以廢了，人類不應該浪費力氣在低280F 03/13 07:48
→ tiuseensii: 智商勞動上

推 fucigniz: 教會程式玩遊戲, 其實也是人類能想得出來的範疇罷了282F 03/13 07:48
→ fucigniz: 因為遊戲可以給他立即的贏、輸反饋所以他不用思考為什
→ fucigniz: 麼就是一直暴力try就有答案然而人類的厲害在於小數據
→ fucigniz: 如果AI玩一個遊戲每做完一個動作要冷凍10分鐘未必就能
→ fucigniz: 贏過人類 ... 不需要靠贏輸反饋也能判斷局面才叫思考
→ fucigniz: 同理如果人類只懂得砍題目靠經驗判斷對錯卻不思考
→ fucigniz: 這種就是高中生的學習方式很快就會被機器所取代
推 fucigniz: 我認為真正的AI還沒有開始現在的AI只是思想的擴充驗證

推 virgonelson: 推樓上290F 03/13 08:03

推 transcend789: 我希望單人遊戲的AI強ㄧ點不要耍智障291F 03/13 08:07

推 MasCat: 有點強292F 03/13 08:19

→ deerdriver: F大根本不懂圍棋才會得出這樣的結論吧293F 03/13 08:25

推 m2488663: 照某人邏輯來生活人生應該比工蟻還慘294F 03/13 08:34

推 nanako81240: 推295F 03/13 08:35

推 yudofu: 你知道教會機械思考思考要花多少智慧嗎？又是粗暴的人類至296F 03/13 08:50
→ yudofu: 上論，這才是沒思考的代表吧

推 Cefilos: 在這裡的鄕民算哪根蔥啊，還評斷值不值得花時間投入，當298F 03/13 08:58
→ Cefilos: 真笑死人。自卑過頭變自大嗎?

→ ringtweety: 西洋棋早就被攻破了可是都還是有棋手阿300F 03/13 09:19

→ zainc: 給阿發go pcman可以觀察它如何學會發廢文~301F 03/13 09:31

推 gfneo: 之前才看某玩家自己寫的AI玩魔界村(FC),這過程很有趣XDDD302F 03/13 09:50

推 eric20: 笑了303F 03/13 09:55

推 Cybermark: AlphaGO最恐怖的一點,是不像深藍一樣暴衝,而是慢慢推敲304F 03/13 10:33
→ Cybermark: ;如果它下一場變成輸局,人類真的要想想它是真輸,還是
→ Cybermark: 怕插頭被拔掉

推 wtao: 推宗師烏龍307F 03/13 10:33

→ jumpdodo: 可以叫阿法狗幫練線上遊戲嗎308F 03/13 10:36

推 TSbb: 一堆人搞不懂超好笑的 XD309F 03/13 11:00

推 Jupiter1129: 推...310F 03/13 11:23

推 j3: 重點是它有'被設定'以分數當目標人類不需要人類還會自己找311F 03/13 11:30
→ j3: 當然這是目前的情況若它會自己找目標就變天網了

推 lozupomelo: 推313F 03/13 11:56

推 SHIU0315: @@314F 03/13 12:09

推 AbbeyJien: 推315F 03/13 12:10

推 AMAGICIAN: 李40:生而為人，我很抱歉316F 03/13 12:29

推 Windcws9Z: 完了完了要變天網了317F 03/13 12:37

噓 gncn: 推文一堆裝懂的腦殘..... 台灣的民眾素質阿....318F 03/13 13:48

※ 看板: Gossiping　文章推薦值: 1 目前人氣: 0 累積人氣: 2558　

分享網址: 複製

DispBBS

(￣︶￣)ｂ win2000ps2 說讚！

1樓時間: 2016-03-13 14:33:07 (台灣)

→

tty1

　 03-13 14:33 TW

沒上過AI的不要裝模作樣出來人笑了啦

2樓時間: 2016-03-13 17:01:07 (台灣)

→

b7118405

　 03-13 17:01 TW

以前是遇到狀況人類教電腦怎麼處理，現在是人類給電腦規則，電腦去處理，以後會不會是讓電腦去發現環境，然後製造規則，再去處理。

3樓時間: 2016-03-13 17:22:44 (台灣)

→

APPA

　 (編輯過) TW

人類跟機器比? 比啥洨? 完全無俚頭!
機器是人類設計的邏輯處理與經驗選擇系統
就像下棋, 人類無法對付龐大棋譜的記憶,與邏輯系統對決! 棋譜都是人類設計的經驗與邏輯累積,累積了幾萬個選擇與對策
下棋只是全部侷限在一個棋格子框架下,這是最簡易的範圍
沒有複雜的參數,
機器就是機器,只是對你的抉擇反應下個步驟,是對付你錯誤的選擇罷了!
人類單然無法跟這款的比賽比!  但是機器能夠打戰, 指揮人類武器對抗,生死戰嗎?
機器做的決定,也無法打贏人類,因為機器指揮人類作戰
就算是機器人,也是全身都是致命的弱點
無法計算出人類的各種參數,還包括無可預測的人類意志力 對藝術創作,請問Google 能夠發明藝術AI?
機器可以跟人類比賽藝術創作嗎?  呸! 也是無俚頭!

4樓時間: 2016-03-14 02:27:37 (美國)

→

zoo

　 03-14 02:27 US

我只擔心AI學會把妹後把全世界的妹;都把走,人類就滅亡了.

5樓時間: 2016-03-14 09:15:34 (台灣)

→

aspeed

　 03-14 09:15 TW

還需要比嗎 光不用按鍵盤滑鼠就穩贏了好嗎 你一秒能按幾個兵種生產

回到看板(←)《Gossiping》

r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄同主題: =)首篇 [)上篇 ])下篇

回列表(←) 分享