※ 本文為 MindOcean 轉寄自 ptt.cc 更新時間: 2016-03-13 13:52:21
看板 Gossiping
作者 標題 Re: [新聞] AlphaGo下一步在哪 傳將挑戰《星海爭霸》
時間 Sun Mar 13 03:37:36 2016
※ 引述《pkyosx (Insomnia)》之銘言:
: : 老實說我覺得也可能是 SC2 沒打算把AI做得太強而已。
Alpha的強弱不是人類幫他設定的 是他自己去學去領悟出來的
現在要測試的就是人工智慧的學習能力跟悟性
所以一開始什麼都不會教他 看他能不能學會怎麼玩Game
: DeepMind 要做的可不是遊戲內建的 AI 系統
: 他要做的是 general purpose AI 也就是作為一個跟你我一樣起點的玩家
: 他們之前做的都是相對簡單的遊戲 小蜜蜂 打磚塊
: 他們架了攝影機 對著電腦銀幕 當做 AI 的眼睛
: 然後只給 AI 一個目標 就是得高分
: https://youtu.be/0X-NdPtFKq0?t=1219
Public Lecture with Google DeepMind's Demis Hassabis - YouTube Watch the founder of Google DeepMind's Demis Hassabis' lecture about the future and capabilities of artificial intelligence. This video was filmed by IET TV....
Google DeepMind's Deep Q-learning playing Atari Breakout - YouTube Google DeepMind created an artificial intelligence program using deep reinforcement learning that plays Atari games and improves itself to a superhuman level...
看這影片可以更理解AlphaGo是什麼跟DeepMind想要測試什麼
還有另一個影片是打超級馬利歐的
一開始Alpha什麼都不知道 只知道他可以操作畫面 目標是得高分
第一階段
他觀察回饋 學會螢幕上的bar可以被他移動 他的bar可以反彈球(光點)
學會那顆球會反彈回去打破磚塊 學會如何不要game over
第二階段 他觀察到打磚塊跟分數的關係 搞懂這遊戲如何拿分數
學會那顆球會反彈回去打破磚塊 學會如何不要game over
第二階段 他觀察到打磚塊跟分數的關係 搞懂這遊戲如何拿分數
第三階段 他觀察到如何拿高分 可以打很久都不會死
第四階段 他找到秘技(在這遊戲不算bug)
把球打到磚塊背面去 輕鬆拿高分
在這遊戲的例子中 他進化到第四階段 只花了4小時
: 如果他真的可以做到讓 AI 也是看著他的電腦銀幕 然後操作鍵盤滑鼠
: (鍵盤滑鼠可能就直接打訊號了)
: 基本上等於又完成一個很重大的里程碑了
: 代表他不只可以應付簡單的環境 連複雜的策略應對能力都有了
然後現在要把這個學習過程搬到星海上
超級瑪莉跟其他不少他已經破關過
圍棋他也算某種程度破關了(?)
推 : 終於有篇正解了,電腦ai做到的事不代表alpha知道03/13 01:23
星海AI是人寫的教AI怎麼作 Alpha一無所知 要測的就是他如何去學習的過程→ : 這跟微操沒關係,重點是要讓電腦思考,這有點難解釋03/13 01:25
用上面四階段套 大概就是搞懂星海這遊戲怎玩 怎麼贏 怎麼變得很厲害推 : 人類光是懂得開密技就不可能輸給ai了03/13 01:29
→ : 再不然去網站找破解黨總有辦法對付
你確定 人類找秘技的速度會比Alpha快嗎→ : 再不然去網站找破解黨總有辦法對付
人類的優勢是數量多 思考的人多 以及可以透過網路傳遞知識經驗跟秘技
推 : 要怎麼讓電腦知道目標? 萬一誤認成得低分呢?03/13 01:30
他都可以理解圍棋怎樣叫贏了推 : youtube裡面AI玩小遊戲 練習到最後 那已經不像人類了03/13 01:32
推 : 感覺只是時間的問題...03/13 01:34
推 : 到目前alpha玩的還是這種規則簡單遊戲要讓它學習更複雜所以03/13 01:39
→ : 才有這新聞
推 : 之前的討論是用電腦角度去看當然覺得穩贏
→ : 才有這新聞
推 : 之前的討論是用電腦角度去看當然覺得穩贏
推 : 說實在把圍棋用圖形化理解是簡化問題,把玩遊戲用圖形03/13 02:13
→ : 化理解只是複雜化問題,只是對工程師出考題對解決人類
→ : 無法解決的問題沒有甚麼幫助
→ : 化理解只是複雜化問題,只是對工程師出考題對解決人類
→ : 無法解決的問題沒有甚麼幫助
--
標題 Re: [問卦] 過年要如何叫不熟的親戚閉嘴? 看板《Gossiping》 (#1KurUyPF)
「怎麼這麼久沒回來阿?」 「我這不是來了嗎?」
「要常常回來給我們看阿」 「我不知道你要見我阿,你這不是見到了嗎?」
「趕快生小孩阿!人家阿花都已經生了一個了!」「那他生了一個,有沒有要生第二個?」
「有錢沒錢,結婚好過年嘛!」 「你們的婚姻能維持這麼久,真不簡單!」
「ㄟ,你怎麼這樣說話?對長輩真沒禮貌!」 「我把你們當人看,要教育你們!」
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.230.18.167
※ 文章代碼(AID): #1Mv704Pg (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1457811460.A.66A.html
推 : 還好AlphaGo桌面沒安裝PCMan 不然就讓他學會發一堆廢文1F 03/13 03:39
推 : 那一天,人類想起了AlphaGo當年開始打敗人類的起點....2F 03/13 03:40
推 : 先看rp讓他知道採礦能造兵,造兵能打贏,3F 03/13 03:41
→ : 然後慢慢去模擬,最後發現最強其實是6d
→ : 然後慢慢去模擬,最後發現最強其實是6d
推 : 領悟(X) 計算(O) 他只是單純算怎麼做勝率高5F 03/13 03:42
→ : 阿發狗的原型 別再誤導大眾了7F 03/13 03:43
推 : 那阿發狗能從八卦版計算出怎樣發廢文可以得最多噓嗎8F 03/13 03:43
→ : 我在廢文之道上已感力不從心 希望藉由與阿發狗一戰得到靈感
→ : 我在廢文之道上已感力不從心 希望藉由與阿發狗一戰得到靈感
→ : 你要用幾顆CPU去計算星海的最佳微操 瘋了嗎你10F 03/13 03:44
推 : 其實應該是要讓阿法狗和電腦正常對戰個1000場再挑戰人類11F 03/13 03:45
→ : 然後由人類方狂放快攻戰術看看阿發狗到底會怎麼應對
→ : 然後由人類方狂放快攻戰術看看阿發狗到底會怎麼應對
→ : 如果只跟一般AI打,最後電腦應該只會每場都放大招吧13F 03/13 03:46
→ : 很明顯打正規無論是資源或微操阿發狗都強太多了14F 03/13 03:46
→ : 阿發狗是在對戰時跟自己對奕 去找出機率較大的贏法15F 03/13 03:46
→ : 請問星海要怎樣算出最佳演算法?
→ : 麻煩看一下連結
→ : 請問星海要怎樣算出最佳演算法?
→ : 麻煩看一下連結
推 : 打一場星海要多久? 他可能學很慢18F 03/13 03:48
→ : 星海不是回合制 沒辦法及時喔 可能要計算個一分鐘19F 03/13 03:49
→ : 才能找到最佳解
→ : 鄉民臉腫了 哈哈
→ : 才能找到最佳解
→ : 鄉民臉腫了 哈哈
→ : 理論上是可以的 至於演算法要怎麼寫一般人怎會知道22F 03/13 03:51
→ : 繼續嘴砲沒關係23F 03/13 03:51
推 : 邊走邊算不就好了 若要算出最佳解才能移動 圍棋也不用玩了24F 03/13 03:52
→ : 起碼阿發狗概念目前絕對不能運用25F 03/13 03:52
→ : alphago找出來的本來就不是最佳解,根本不用找最佳解26F 03/13 03:52
→ : 他是用2000多顆去計算的 星海要幾顆?27F 03/13 03:52
→ : alphago的架構是為圍棋特化的弱AI28F 03/13 03:53
→ : 在跟李40比賽之前也一堆人覺得阿發狗會被玩封阿...29F 03/13 03:53
→ : 口誤 不好意思30F 03/13 03:53
→ : 邊走邊算不就好了?開局固定起手勢不就那幾個?31F 03/13 03:53
→ : 我比較好奇 為什麼有人會覺得阿發狗不會玩星海? XD32F 03/13 03:53
→ : 戰略遊戲的"定石"還比圍棋少 開局多的是時間可以算33F 03/13 03:54
→ : 連結不就有解說了34F 03/13 03:54
→ : 星海很難嗎? 坦白講 連圍棋都能贏了,星海很難嗎?35F 03/13 03:54
→ : 圍棋複雜度也不低 但阿髮狗證明他就是有辦法學起來36F 03/13 03:54
→ : 不是用學的 怎麼有人還搞不懂37F 03/13 03:54
→ : 更何況在微操跟計算資源這方面 電腦根本大勝好嗎38F 03/13 03:54
→ : 圍棋就是邊走邊算 只是Google沒告訴你讀秒是內建限制的39F 03/13 03:54
→ : 根本不是算不出答案才搞到讀秒,而是永遠在規範時間內求解
→ : 根本不是算不出答案才搞到讀秒,而是永遠在規範時間內求解
→ : 圍棋是一瞬間算大量的走法才會用到2000顆CPU41F 03/13 03:56
→ : 這過程起碼也要一分鐘以上 有看棋嗎
→ : 這過程起碼也要一分鐘以上 有看棋嗎
推 : 你確定是算答案花一分鐘,還是工程師告訴他每一步都有一分鐘43F 03/13 03:58
→ : 拿那時間來說計算過程要多久會不會太天真了,機器不會自己決
→ : 拿那時間來說計算過程要多久會不會太天真了,機器不會自己決
推 : 這個機制就是學習 實際上這alphago就會玩小遊戲45F 03/13 03:58
→ : 定計算時間,而是別人告訴他什麼時候可以用多少時間46F 03/13 03:58
推 : 你去看今天比賽 電腦有哪一步是即時下的47F 03/13 03:59
→ : 最好電腦在算的過程就完全不會動按著S讓你A假的。48F 03/13 03:59
→ : 說不定阿發狗20秒就算完答案還上網跟初音聊了40秒的天49F 03/13 03:59
→ : 電腦不需要即時下 他有時間為啥要即時下50F 03/13 04:00
→ : 只因為主辦單位跟他說比賽前段要一分鐘才能落子,後段要30秒51F 03/13 04:00
→ : 且實際上昨天alphago進讀秒時 他就固定30秒一子52F 03/13 04:00
→ : 你去GO版看 有推文已經完整解釋其演算法53F 03/13 04:00
→ : 一秒都沒多用 他早就計算完你也不知道54F 03/13 04:00
→ : 搞不好電腦發現在幾秒鐘下的時後贏的機率最高zzz55F 03/13 04:01
推 : 你看到平行世界的阿發狗喔 阿發狗後段明明常出現30秒56F 03/13 04:01
→ : 之內一步的
→ : 之內一步的
→ : 有演算法有什麼用?會告訴我們Google給阿發狗設定幾秒落子嗎58F 03/13 04:01
推 : 說開作弊會贏的,你以為工程師不會預測你開作弊嗎?XD59F 03/13 04:02
→ : 你去看連結好嗎 別再跟我辯這個 看完再說這套理念能不能60F 03/13 04:02
→ : 用在星海
→ : 用在星海
→ : 基本上星海這種軍備競賽遊戲 對阿發狗來說實在是簡單啦62F 03/13 04:02
→ : 主要是要從程式計算的最佳化進化到圖型運算吧63F 03/13 04:02
→ : 奇怪捏 一直提連結作啥,我看了連結還是覺得很厲害阿64F 03/13 04:03
→ : 而且星海的問題是模擬上需要先解析遊戲程式.....65F 03/13 04:03
→ : 推文就有鄉民說了 連爆雪都辦得到 何況是阿發狗66F 03/13 04:03
→ : 不然無法像圍棋那樣一天下1000萬局....67F 03/13 04:03
推 : 當然可以用在星海..你搞錯了一些東西68F 03/13 04:04
→ : alphago 可不是每一場都從0開始重新計算
→ : alphago 可不是每一場都從0開始重新計算
推 : 訓練的核心應該都是同一套 只是agent要特製化...70F 03/13 04:04
→ : 是訓練了很久才到現在這程度 這就是學71F 03/13 04:04
→ : 無論如何跟圍棋比都還是慢太多 需要更快的學習法吧72F 03/13 04:05
→ : 應該沒這麼複雜啦 星海自己都有內建AI了73F 03/13 04:05
→ : 能夠學打磚塊 能學小蜜蜂 當然能學星海74F 03/13 04:05
推 : 重點阿發狗根本是自對奕來計算勝率 沒有所謂的學習75F 03/13 04:05
→ : alphago 的勝率計算法包含過去對奕過的所有經驗76F 03/13 04:06
→ : 前面我看那些遊戲是以小時計算來學習的77F 03/13 04:06
→ : 而不是只從當下這局去算分支78F 03/13 04:06
→ : 即時戰略就是在比控兵,計算資源,偵查及部分博奕成分79F 03/13 04:06
→ : 那轉換成星海不就變成要以幾萬小時來算了..80F 03/13 04:06
→ : 會利用過去經驗 就是學習81F 03/13 04:06
→ : 沒理由圍棋作的到星海作不到82F 03/13 04:07
推 : 你看完那篇怎麼會有他沒有學習的誤會?XD 只是他的學習83F 03/13 04:07
→ : 圍棋阿法狗需要思考沒錯 因為可以變動的變項太多84F 03/13 04:07
→ : 就只是學習方式跟人很像不一樣 其實都一樣85F 03/13 04:07
→ : 還在很初階的階段而已啊86F 03/13 04:07
→ : 是電子遊戲就能加速 且也能從錄像學習87F 03/13 04:07
→ : 人也是try and error開始學習的~88F 03/13 04:07
→ : 星海一場通常不到20分鐘就打完了好嗎。這幾場圍棋都用89F 03/13 04:07
→ : 小時來算的
→ : 小時來算的
→ : 當然以現在的程度要學多久不知道91F 03/13 04:07
→ : 星海只要拼速度殺暴對方就好了 人是快得過電腦的速度逆92F 03/13 04:08
→ : 我在想設計小組是不是在嘗試不加速要怎麼加速學習93F 03/13 04:08
推 : 經驗累積其實不就是學習嗎?94F 03/13 04:08
→ : 我覺得只是沒有花時間去加速遊戲而已95F 03/13 04:08
推 : 星海的學習難度應該比方塊阿 馬力歐的難度多很多96F 03/13 04:09
→ : 電腦光用電子訊號控兵,你的速度絕對跟不上他啦97F 03/13 04:09
→ : 畢竟重點是在驗證這個方式能不能有學習效果98F 03/13 04:09
→ : 去加速遊戲其實就又跳入舊框架啦~99F 03/13 04:09
→ : 現實世界是沒辦法加速的~ai勢必要面對這個問題~
→ : 現實世界是沒辦法加速的~ai勢必要面對這個問題~
→ : 控兵跟生產單位的速度 人怎麼跟電腦拼啦? 這有啥好戰的?101F 03/13 04:09
推 : 自對奕得來結果 如果相同概念就在遊戲中模擬對戰102F 03/13 04:09
→ : 不需要阿 AI在學習的過程不需要跟人類一樣103F 03/13 04:09
→ : 你可以把電腦的控兵限制在使用滑鼠與鍵盤啊.....104F 03/13 04:09
→ : 應該要叫阿法狗只能用機械手控105F 03/13 04:10
→ : 只是人類有想像力,可以抽象具體轉來轉去,電腦不行,或106F 03/13 04:10
→ : 是需要更多CPU或其他組件來幫助。
→ : 是需要更多CPU或其他組件來幫助。
→ : 然後限制一下滑鼠移動的速度跟鍵盤和滑鼠鍵的點擊數108F 03/13 04:10
→ : 不用機械手臂啦 控制它能使用的操控指令就好 不難
→ : 不用機械手臂啦 控制它能使用的操控指令就好 不難
→ : 光是大局觀就有的想了 就先到這邊了 不多說110F 03/13 04:11
→ : 只要操作是與玩家條件相同就好111F 03/13 04:11
→ : 你也不需要多說 因為你不懂學習
→ : 你也不需要多說 因為你不懂學習
→ : 挑戰即時戰略應該是ai侵入人類世界的第一步XD113F 03/13 04:12
→ : 276848說很清楚 不多說 也不指責114F 03/13 04:12
→ : 從統計進化到時間序列 哈哈115F 03/13 04:12
→ : 會認為 CPU數量有影響 表示你還停留在舊的觀念116F 03/13 04:12
→ : 我真的不是很清楚一篇被噓爆的文章是想清楚表達什麼117F 03/13 04:13
→ : 我在想圍棋應該也有必勝法~阿法狗不知道找出來沒XD118F 03/13 04:14
→ : alphago沒辦法找出必勝法吧119F 03/13 04:14
→ : 不過他的思考模式不是窮舉法 所以應該還沒吧0.0120F 03/13 04:14
→ : 必勝法建立在能套用到"所有"步法都成立上121F 03/13 04:15
→ : 圍棋的所有步法不可能用窮舉法搜完
→ : alphago只能訓練到非常不容易輸而已
→ : 圍棋的所有步法不可能用窮舉法搜完
→ : alphago只能訓練到非常不容易輸而已
推 : 反正GO有人說電腦要自對奕 需要大量運算 而且要算好幾萬盤124F 03/13 04:16
→ : 才會用到2000多顆CPU
→ : 才會用到2000多顆CPU
→ : 自對奕的運算大部分不是在實際對弈時126F 03/13 04:17
→ : 不然很難短時間內完成這些動作127F 03/13 04:17
→ : 而是自我對奕訓練時128F 03/13 04:17
→ : alphago 已經練過上億場 基於這些經驗才這麼強
→ : 並不是在對奕當時才計算這些場次來找勝率
→ : alphago 已經練過上億場 基於這些經驗才這麼強
→ : 並不是在對奕當時才計算這些場次來找勝率
→ : 但你要對手下一步棋 你才能計算下一步 哪可能馬上算好131F 03/13 04:18
→ : 不過光是可以把不同棋局的經驗拿來用我覺得就是里程碑132F 03/13 04:18
→ : 不需要馬上 圍棋本來就有思考時間133F 03/13 04:18
→ : 畢竟每盤棋局都不同.....134F 03/13 04:18
→ : 難道你感覺不出昨天的比賽 AI花的時間有忽快忽慢135F 03/13 04:19
→ : 且alphago又不是對手還沒下就沒再計算136F 03/13 04:19
→ : 你對學習的定義有點狹隘
→ : 並不是 學習好之後 就應該要不用計算的下每一步
→ : 只要過去的經驗 會讓下一次計算更正確 就是學習
→ : 你對學習的定義有點狹隘
→ : 並不是 學習好之後 就應該要不用計算的下每一步
→ : 只要過去的經驗 會讓下一次計算更正確 就是學習
推 : Alphago玩星海有什麼好慢的 XD 反正他就是要殺爆對手啊140F 03/13 04:20
→ : 慢是為了讓他跟人類比賽~141F 03/13 04:20
我覺得跟人類比賽正是重點 之前的小遊戲都是面對有固定AI的電腦很容易被Alpha找出破解之道
圍棋開始對手換成人類
所以預測人類對手的棋步變成重點
星海應該重點也是在這邊
如何從人類對手可觀測到的動向 預測人類對手的下一步 下下步動向
並進而思考採取相對應策略 回應人類對手
這都是在把人工智慧導入博奕格局的訓練
以後還可以拓展到類似的其他人類博奕賽局...
→ : 你說的點還是很有問題..142F 03/13 04:20
→ : alphago實際對奕花的思考時間並不是啥重點143F 03/13 04:20
→ : 反正我也不是專業 你去GO版討論吧144F 03/13 04:21
→ : 而且很有可能手速會影響戰術甚至影響戰略~145F 03/13 04:21
推 : 我知道你說的,我說的是如果要讓電腦思考方式跟人腦一樣146F 03/13 04:21
→ : 他這段時間確實就是在計算 這就相當於人類的思考147F 03/13 04:21
→ : 的話,比如抽像具體轉換,視覺(電眼)轉為思考(AlghaG148F 03/13 04:21
→ : O)這種比較複雜層次的東西。
→ : O)這種比較複雜層次的東西。
→ : 人類下棋 也是預想接下來對奕狀況 選擇最好的150F 03/13 04:21
→ : alphago做的事情完全一樣 只是規模不一樣
→ : alphago做的事情完全一樣 只是規模不一樣
推 : 推152F 03/13 04:22
→ : alphago用的三種方法 第三種就是各種局面的勝率153F 03/13 04:22
→ : 自我對奕是第二種 用來修正他自己的步法
→ : 自我對奕是第二種 用來修正他自己的步法
→ : 因為AlphaGO可以計算勝率,卻無法分辨何者是棋子,何者155F 03/13 04:23
→ : 是石頭,所以需要別的組件幫助他。
→ : 是石頭,所以需要別的組件幫助他。
→ : 這我保留 能自我對奕跟讀棋譜 應該是能分辨棋子157F 03/13 04:25
→ : 抽象概念電腦好像有點難理解 語言學不好也是這原因158F 03/13 04:25
→ : 不過是指人類的五感 這種分辨那自然還不行159F 03/13 04:25
→ : 圍棋其實他不用分辨棋子啊~用座標系理解就好160F 03/13 04:26
→ : 要轉換到星海就真的是需要圖型辨識能力了
→ : 除非作弊去讀記憶體 可是我覺得這就失去突破點...
→ : 要轉換到星海就真的是需要圖型辨識能力了
→ : 除非作弊去讀記憶體 可是我覺得這就失去突破點...
→ : 就跟學打磚塊一樣163F 03/13 04:27
→ : 實際上學得會打磚塊 還學會怎麼輕鬆拿高分
→ : 實際上學得會打磚塊 還學會怎麼輕鬆拿高分
推 : 哦? AlphaGO有圖像分辨能力是嗎? 太驚人了!165F 03/13 04:27
→ : 所以我認為辨識不太是大問題166F 03/13 04:28
→ : 原來是我誤會了。167F 03/13 04:28
推 : 圖像辨識已經是很普遍的技術了......168F 03/13 04:29
→ : 普遍的技術不一定代表阿法狗有裝啊XD169F 03/13 04:30
→ : 那就不太是需要討論的問題..170F 03/13 04:30
→ : 也不一定代表阿法狗有圖像學習的能力~171F 03/13 04:30
→ : 圖像思考跟數學計算差距其實很大~
→ : 圖像思考跟數學計算差距其實很大~
→ : 我認為 看過打磚塊影片 很難認為沒圖像學習能力173F 03/13 04:31
→ : 就已經玩過打磚塊 馬莉歐 小蜜蜂等小遊戲了
→ : 這些也都是即時的 怎麼看都有學習能力
→ : 就已經玩過打磚塊 馬莉歐 小蜜蜂等小遊戲了
→ : 這些也都是即時的 怎麼看都有學習能力
→ : 圖形辨識對google來說根本小case..看人家無人車做得多好176F 03/13 04:32
→ : 打磚塊那個學習就我看起來應該是更簡單的學習法177F 03/13 04:32
打那些遊戲好像沒有用圖象辨識來理解 簡化成一堆參數就好https://youtu.be/qv6UVOQ0F44
MarI/O - Machine Learning for Video Games - YouTube
MarI/O is a program made of neural networks and genetic algorithms that kicks butt at Super Mario World. Source Code: "NEAT" Pap...
MarI/O is a program made of neural networks and genetic algorithms that kicks butt at Super Mario World. Source Code: "NEAT" Pap...
→ : 阿髮狗裝圖像辨識能力是要幹嘛? 他就是設計來學下圍棋178F 03/13 04:32
→ : 而且發表會有講 輸入就只有要求alphago拿高分179F 03/13 04:32
→ : 這應該也是deepmind加入google能夠馬上享受到的好處吧180F 03/13 04:32
推 : 沒有裝就裝啊 圖像辨識很一般的技術 = =181F 03/13 04:32
圖像辨識本身也是一種深度學習 學習分辨什麼是貓什麼是狗→ : 很可能只是讀分數與操控間的關聯而已....182F 03/13 04:32
→ : 其他操作法甚至打磚塊規則都沒給183F 03/13 04:32
→ : 不用規則啊 左右移+分數多寡就能學習了184F 03/13 04:33
→ : 你看他的操作 很明顯他知道哪個是球185F 03/13 04:33
→ : 我猜阿發狗應該是透過圖像辨識吃入大量的網路上的棋譜186F 03/13 04:34
→ : 該給的資訊給一給 剩下就是怎樣高分而已啦~187F 03/13 04:34
→ : 給的資訊只有 拿高分 其他都沒給阿...188F 03/13 04:35
→ : 吃棋譜進去最後也是轉成數位啊0.0189F 03/13 04:35
→ : 發表會就說了190F 03/13 04:35
→ : 我說的資訊是指 球速 橫棒移動 磚塊位置這些..191F 03/13 04:35
→ : 想太多 棋譜一定要圖像嗎... 棋譜要數據化很容易吧192F 03/13 04:35
→ : 懷疑有沒有圖像技術真的是沒啥意義193F 03/13 04:35
→ : 不讀進去他連棒子在哪都不知道怎麼玩XD194F 03/13 04:35
→ : 因為 沒有就給就好 這並不是很難的技術195F 03/13 04:36
→ : 對阿 搞錯重點了 重點在於他核心的機器學習能力196F 03/13 04:36
→ : 我只是好奇他們找不找得到縮短學習時間的方法而已~197F 03/13 04:36
→ : 能讀取到的資訊自然就能利用來學習198F 03/13 04:37
→ : 其它技術層面的東西可以在另外克服199F 03/13 04:37
→ : 打磚塊要學4小時的話 星海學起來效率就太差了200F 03/13 04:37
四小時是發現很多人不知道的秘技 2小時他就玩的比大多數人類好了→ : 四小時不重要 因為這要縮短太容易了201F 03/13 04:37
→ : 是從0開始學習 才是要學四小時
→ : 是從0開始學習 才是要學四小時
→ : 嗯?這容易的話下棋就都不用思考時間了203F 03/13 04:38
→ : 這兩者一點關係都沒有..我不知道你怎麼連結的204F 03/13 04:38
→ : 玩星海也是從0開始啊 萬一要學10萬小時那不是太沒效率205F 03/13 04:38
→ : 沒人規定你要從0開始阿..206F 03/13 04:38
→ : 你要他怎麼不是從0開始XD207F 03/13 04:39
→ : 實際上 alphago學圍棋就不是從0開始208F 03/13 04:39
→ : 而是先讀了一堆棋譜 學會人類是怎麼下 才開始
→ : 而是先讀了一堆棋譜 學會人類是怎麼下 才開始
→ : 他是從零也不是從零~最終還是ai要搞懂勝率啊~210F 03/13 04:39
→ : 同理星海 alphago不需要從0開始學操作跟戰術211F 03/13 04:40
→ : 完全可以直接給現有的操作跟戰術 在讓他自己升級
→ : 是否有基礎戰術理解 對學習時間縮短絕對很有效
→ : 這就是我說的 要縮短學習時間方法太多
→ : 沒必要每個都像打磚塊一樣 一開始連要接球都不知道
→ : alphago 從0開始到知道要接球可是花了300場
→ : 完全可以直接給現有的操作跟戰術 在讓他自己升級
→ : 是否有基礎戰術理解 對學習時間縮短絕對很有效
→ : 這就是我說的 要縮短學習時間方法太多
→ : 沒必要每個都像打磚塊一樣 一開始連要接球都不知道
→ : alphago 從0開始到知道要接球可是花了300場
→ : 整體聽起來比較像給工程師的挑戰 不是阿法狗的挑戰XD217F 03/13 04:42
→ : 但從知道接球到知道最好戰法 只花500場218F 03/13 04:43
→ : 怎麼分析讓阿法狗搞懂星海才是大問題XD219F 03/13 04:43
→ : 如果你一開始就告訴alphago要接球 他就省下一半時間220F 03/13 04:43
→ : 終究是要花時間學習~只是學習的是工程師~XD221F 03/13 04:43
※ 編輯: Verola (36.230.18.167), 03/13/2016 04:45:50→ : 學習的不是工程師 工程師設計出邏輯和演算法電腦執行222F 03/13 04:45
→ : 然後想辦法完成任務並學習
→ : 然後想辦法完成任務並學習
推 : 某 w 說自己不是專業剛剛還跳針那麼久,藉由建立過去224F 03/13 04:47
→ : 經驗來縮短計算時間,那麼建立的過程不就是「學習」
→ : 經驗來縮短計算時間,那麼建立的過程不就是「學習」
→ : 這其實已經很不容易了。226F 03/13 04:47
→ : ?那是我們心態不對,學習總要往「最佳化」前進,但227F 03/13 04:47
→ : 是阿法狗告訴我們,你每次局部取最優,未必能達到全
→ : 局最優,人類只是把這個世界簡化成 greedy 的模型罷
→ : 了。
→ : 是阿法狗告訴我們,你每次局部取最優,未必能達到全
→ : 局最優,人類只是把這個世界簡化成 greedy 的模型罷
→ : 了。
推 : 總算出現了水準文 不過某w是不是理解錯誤 以至於看起來231F 03/13 04:56
→ : 像來亂的
→ : 像來亂的
推 : AlphaGo加油努力學習吧~233F 03/13 04:59
推 : 太小看自動化以及人工智慧取代未來的要小心沒有做準234F 03/13 05:00
→ : 備的衝擊
→ : 備的衝擊
推 : 感謝原波解說,我的圖像辨識正是那個意思。236F 03/13 05:01
推 : 有超級馬利的影片嗎?237F 03/13 05:52
推 : 這樣看來下圍棋只是阿發狗的起點而已238F 03/13 05:56
推 : A.I. 同修推 +p239F 03/13 05:58
→ : 最終目標最少是基礎的人工智能 自我學習 分析240F 03/13 05:58
→ : 至少可以取代無塵室生產線那些行屍走肉的麥肝作業員
→ : 你把工廠環境跟生產參數輸入之後 它可以做到世界末日
→ : 只要沒有大問題出現 他還可以自我校正
→ : 一整座液晶螢幕生產線 大概只要1名工程師跟保全就可以了
推 : 希望不要發展得太快 這會造成人類社會革命
→ : 至少可以取代無塵室生產線那些行屍走肉的麥肝作業員
→ : 你把工廠環境跟生產參數輸入之後 它可以做到世界末日
→ : 只要沒有大問題出現 他還可以自我校正
→ : 一整座液晶螢幕生產線 大概只要1名工程師跟保全就可以了
推 : 希望不要發展得太快 這會造成人類社會革命
MarI/O - Machine Learning for Video Games - YouTube
MarI/O is a program made of neural networks and genetic algorithms that kicks butt at Super Mario World. Source Code: "NEAT" Pap...
MarI/O is a program made of neural networks and genetic algorithms that kicks butt at Super Mario World. Source Code: "NEAT" Pap...
推 : 樓樓上和這篇都想太多了 做一個自我校正的機器 那廠商247F 03/13 06:48
→ : 要賺啥? 還有 alphago 根本不能稱之為思考 他一開始還是
→ : 要有人餵牠棋局 他只是用快速有效率的方式整理考古題
→ : 自我對弈 也不過就是在驗證考古題的準確率。大家應該都
→ : 知道靠自己求解一個題目 和收集考古題的差別。
→ : 最簡單的就是 為什麼這麼多厲害的工程師 卻選擇把投資
→ : 程式放出去賣 而不是靠它賺錢? 棋局能被破解本來就是遲
→ : 早的事 因為它在有限時間內母體是固定的 今天把圍棋規則
→ : 改得更複雜 它就不能適應了 第二 它所吃的數據與輸贏有
→ : 關 今天如果把它改在一個隨機斷電的環境 它有可能下一半
→ : 就被切斷, 它最後是無法統計到輸贏的。而真實世界的問題
→ : 多半是像後者那樣複雜。
推 : alphago能贏的關鍵, 在於這遊戲下的每一子, 最後都會對
→ : 應到某些答案 至於真實世界 你的數據可能與答案完全無關
→ : 要賺啥? 還有 alphago 根本不能稱之為思考 他一開始還是
→ : 要有人餵牠棋局 他只是用快速有效率的方式整理考古題
→ : 自我對弈 也不過就是在驗證考古題的準確率。大家應該都
→ : 知道靠自己求解一個題目 和收集考古題的差別。
→ : 最簡單的就是 為什麼這麼多厲害的工程師 卻選擇把投資
→ : 程式放出去賣 而不是靠它賺錢? 棋局能被破解本來就是遲
→ : 早的事 因為它在有限時間內母體是固定的 今天把圍棋規則
→ : 改得更複雜 它就不能適應了 第二 它所吃的數據與輸贏有
→ : 關 今天如果把它改在一個隨機斷電的環境 它有可能下一半
→ : 就被切斷, 它最後是無法統計到輸贏的。而真實世界的問題
→ : 多半是像後者那樣複雜。
推 : alphago能贏的關鍵, 在於這遊戲下的每一子, 最後都會對
→ : 應到某些答案 至於真實世界 你的數據可能與答案完全無關
推 : 塞魯...261F 03/13 07:07
推 : 吵回合制的話,他玩爐石不是超強262F 03/13 07:10
推 : 而工程師的功用就是 當一個問題變簡單 要去創造更多問題263F 03/13 07:17
推 : alphago不去限制他的手速,怎麼跟他玩264F 03/13 07:20
推 : 很簡單, 你只要改變遊戲規則就可以。265F 03/13 07:22
→ : alphago 在和人對弈的時候 某些情況會突然斷電 或改變
→ : 遊戲規則, 甚至明明贏要讓它輸 讓他無法直線判斷方向
→ : alphago 在和人對弈的時候 某些情況會突然斷電 或改變
→ : 遊戲規則, 甚至明明贏要讓它輸 讓他無法直線判斷方向
推 : 事實上是把規則改得更複雜,他還是能適應,至少適應的比268F 03/13 07:25
→ : 人類快,人工智能有個重點,他不一定要像神一樣完美,他
→ : 只要比人類強一點點,就有價值了,google 無人車也有可
→ : 能出車禍,但比人類好太多了。我比較好奇的是,人類是否
→ : 可以靠向alphago學習,最終破解圍棋這個遊戲
→ : 人類快,人工智能有個重點,他不一定要像神一樣完美,他
→ : 只要比人類強一點點,就有價值了,google 無人車也有可
→ : 能出車禍,但比人類好太多了。我比較好奇的是,人類是否
→ : 可以靠向alphago學習,最終破解圍棋這個遊戲
推 : alphago的思維還很像台灣高中生 他並不懂獨立思考273F 03/13 07:27
→ : 它是從考古題海裡找出怎麼走 靠統計判斷勝率
→ : 現在的AI還是只能這樣 人類與其擔心AI 不如擔心有沒有
→ : 激進的納粹份子 二十年內 害人機器可能連小學生都能做
推 : 我認為 人類該做的事 是放棄圍棋 去做更重要的事
→ : 這證明了圍棋是一個靠題海+計算 就能攻克的遊戲
→ : 棋手不應該浪費他優秀的腦袋在這個遊戲上面
→ : 它是從考古題海裡找出怎麼走 靠統計判斷勝率
→ : 現在的AI還是只能這樣 人類與其擔心AI 不如擔心有沒有
→ : 激進的納粹份子 二十年內 害人機器可能連小學生都能做
推 : 我認為 人類該做的事 是放棄圍棋 去做更重要的事
→ : 這證明了圍棋是一個靠題海+計算 就能攻克的遊戲
→ : 棋手不應該浪費他優秀的腦袋在這個遊戲上面
推 : 嗯,田徑球類活動都可以廢了,人類不應該浪費力氣在低280F 03/13 07:48
→ : 智商勞動上
→ : 智商勞動上
推 : 教會程式玩遊戲, 其實也是人類能想得出來的範疇罷了282F 03/13 07:48
→ : 因為遊戲可以給他立即的贏、輸 反饋 所以他不用思考為什
→ : 麼 就是一直暴力try就有答案 然而 人類的厲害在於小數據
→ : 如果AI玩一個遊戲 每做完一個動作要冷凍10分鐘 未必就能
→ : 贏過人類 ... 不需要靠贏輸反饋也能判斷局面 才叫思考
→ : 同理 如果人類只懂得砍題目 靠經驗判斷對錯 卻不思考
→ : 這種就是高中生的學習方式 很快就會被機器所取代
推 : 我認為真正的AI還沒有開始 現在的AI只是思想的擴充驗證
→ : 因為遊戲可以給他立即的贏、輸 反饋 所以他不用思考為什
→ : 麼 就是一直暴力try就有答案 然而 人類的厲害在於小數據
→ : 如果AI玩一個遊戲 每做完一個動作要冷凍10分鐘 未必就能
→ : 贏過人類 ... 不需要靠贏輸反饋也能判斷局面 才叫思考
→ : 同理 如果人類只懂得砍題目 靠經驗判斷對錯 卻不思考
→ : 這種就是高中生的學習方式 很快就會被機器所取代
推 : 我認為真正的AI還沒有開始 現在的AI只是思想的擴充驗證
推 : 推樓上290F 03/13 08:03
推 : 我希望單人遊戲的AI強ㄧ點 不要耍智障291F 03/13 08:07
推 : 有點強292F 03/13 08:19
→ : F大根本不懂圍棋才會得出這樣的結論吧293F 03/13 08:25
推 : 照某人邏輯來生活 人生應該比工蟻還慘294F 03/13 08:34
推 : 推295F 03/13 08:35
推 : 你知道教會機械思考思考要花多少智慧嗎?又是粗暴的人類至296F 03/13 08:50
→ : 上論,這才是沒思考的代表吧
→ : 上論,這才是沒思考的代表吧
推 : 在這裡的鄕民算哪根蔥啊,還評斷值不值得花時間投入,當298F 03/13 08:58
→ : 真笑死人。自卑過頭變自大嗎?
→ : 真笑死人。自卑過頭變自大嗎?
→ : 西洋棋早就被攻破了 可是都還是有棋手阿300F 03/13 09:19
→ : 給阿發go pcman可以觀察它如何學會發廢文~301F 03/13 09:31
推 : 之前才看某玩家自己寫的AI玩魔界村(FC),這過程很有趣XDDD302F 03/13 09:50
推 : 笑了303F 03/13 09:55
推 : AlphaGO最恐怖的一點,是不像深藍一樣暴衝,而是慢慢推敲304F 03/13 10:33
→ : ;如果它下一場變成輸局,人類真的要想想它是真輸,還是
→ : 怕插頭被拔掉
→ : ;如果它下一場變成輸局,人類真的要想想它是真輸,還是
→ : 怕插頭被拔掉
推 : 推宗師烏龍307F 03/13 10:33
→ : 可以叫阿法狗幫練線上遊戲嗎308F 03/13 10:36
推 : 一堆人搞不懂超好笑的 XD309F 03/13 11:00
推 : 推...310F 03/13 11:23
推 : 重點是它有'被設定'以分數當目標 人類不需要 人類還會自己找311F 03/13 11:30
→ : 當然這是目前的情況 若它會自己找目標 就變天網了
→ : 當然這是目前的情況 若它會自己找目標 就變天網了
推 : 推313F 03/13 11:56
推 : @@314F 03/13 12:09
推 : 推315F 03/13 12:10
推 : 李40:生而為人,我很抱歉316F 03/13 12:29
推 : 完了 完了 要變天網了317F 03/13 12:37
噓 : 推文一堆裝懂的腦殘..... 台灣的民眾素質阿....318F 03/13 13:48
--
※ 看板: Gossiping 文章推薦值: 1 目前人氣: 0 累積人氣: 2558
( ̄︶ ̄)b win2000ps2 說讚!
2樓 時間: 2016-03-13 17:01:07 (台灣)
→
03-13 17:01 TW
以前是遇到狀況人類教電腦怎麼處理,現在是人類給電腦規則,電腦去處理,以後會不會是讓電腦去發現環境,然後製造規則,再去處理。
3樓 時間: 2016-03-13 17:22:44 (台灣)
→
(編輯過) TW
人類跟機器比? 比啥洨? 完全無俚頭! 機器是人類設計的邏輯處理與經驗選擇系統 就像下棋, 人類無法對付龐大棋譜的記憶,與邏輯系統對決!棋譜都是人類設計的經驗與邏輯累積,累積了幾萬個選擇與對策 下棋只是全部侷限在一個棋格子框架下,這是最簡易的範圍 沒有複雜的參數, 機器就是機器,只是對你的抉擇反應下個步驟,是對付你錯誤的選擇罷了! 人類單然無法跟這款的比賽比!但是機器能夠打戰, 指揮人類武器對抗,生死戰嗎? 機器做的決定,也無法打贏人類,因為機器指揮人類作戰 就算是機器人,也是全身都是致命的弱點 無法計算出人類的各種參數,還包括無可預測的人類意志力對藝術創作,請問Google 能夠發明藝術AI? 機器可以跟人類比賽藝術創作嗎? 呸! 也是無俚頭!
回列表(←)
分享