顯示廣告
隱藏 ✕
※ 本文為 MindOcean 轉寄自 ptt.cc 更新時間: 2016-03-13 13:52:21
看板 Gossiping
作者 Verola (sometimes I love you)
標題 Re: [新聞] AlphaGo下一步在哪 傳將挑戰《星海爭霸》
時間 Sun Mar 13 03:37:36 2016


※ 引述《pkyosx (Insomnia)》之銘言:
: : 老實說我覺得也可能是 SC2 沒打算把AI做得太強而已。
    Alpha的強弱不是人類幫他設定的 是他自己去學去領悟出來的
    現在要測試的就是人工智慧的學習能力跟悟性
    所以一開始什麼都不會教他  看他能不能學會怎麼玩Game
: DeepMind 要做的可不是遊戲內建的 AI 系統
: 他要做的是 general purpose AI 也就是作為一個跟你我一樣起點的玩家
: 他們之前做的都是相對簡單的遊戲 小蜜蜂 打磚塊
: 他們架了攝影機 對著電腦銀幕 當做 AI 的眼睛
: 然後只給 AI 一個目標 就是得高分
: https://youtu.be/0X-NdPtFKq0?t=1219
Public Lecture with Google DeepMind's Demis Hassabis - YouTube Watch the founder of Google DeepMind's Demis Hassabis' lecture about the future and capabilities of artificial intelligence. This video was filmed by IET TV....

 
  https://youtu.be/V1eYniJ0Rnk  這個版本比較快
Google DeepMind's Deep Q-learning playing Atari Breakout - YouTube Google DeepMind created an artificial intelligence program using deep reinforcement learning that plays Atari games and improves itself to a superhuman level...

 

  看這影片可以更理解AlphaGo是什麼跟DeepMind想要測試什麼
  還有另一個影片是打超級馬利歐的

  一開始Alpha什麼都不知道  只知道他可以操作畫面  目標是得高分

  第一階段
  他觀察回饋  學會螢幕上的bar可以被他移動 他的bar可以反彈球(光點)
              學會那顆球會反彈回去打破磚塊  學會如何不要game over

  第二階段   他觀察到打磚塊跟分數的關係  搞懂這遊戲如何拿分數


  第三階段   他觀察到如何拿高分  可以打很久都不會死

  第四階段   他找到秘技(在這遊戲不算bug)
             把球打到磚塊背面去  輕鬆拿高分


  在這遊戲的例子中  他進化到第四階段 只花了4小時

: 如果他真的可以做到讓 AI 也是看著他的電腦銀幕 然後操作鍵盤滑鼠
: (鍵盤滑鼠可能就直接打訊號了)
: 基本上等於又完成一個很重大的里程碑了
: 代表他不只可以應付簡單的環境 連複雜的策略應對能力都有了

  然後現在要把這個學習過程搬到星海上
  超級瑪莉跟其他不少他已經破關過
  圍棋他也算某種程度破關了(?)

signm: 終於有篇正解了,電腦ai做到的事不代表alpha知道03/13 01:23
  星海AI是人寫的教AI怎麼作  Alpha一無所知 要測的就是他如何去學習的過程
signm: 這跟微操沒關係,重點是要讓電腦思考,這有點難解釋03/13 01:25
  用上面四階段套 大概就是搞懂星海這遊戲怎玩 怎麼贏 怎麼變得很厲害
arnold3: 人類光是懂得開密技就不可能輸給ai了03/13 01:29
arnold3: 再不然去網站找破解黨總有辦法對付
  你確定  人類找秘技的速度會比Alpha快嗎
  人類的優勢是數量多  思考的人多  以及可以透過網路傳遞知識經驗跟秘技
tetani: 要怎麼讓電腦知道目標? 萬一誤認成得低分呢?03/13 01:30
  他都可以理解圍棋怎樣叫贏了
tetani: youtube裡面AI玩小遊戲 練習到最後 那已經不像人類了03/13 01:32
a2156700: 感覺只是時間的問題...03/13 01:34
淺談Alpha Go所涉及的深度學習技術 | 尹相志Allan's blog - 點部落
[圖]
[圖]
[圖]
介紹AlphaGo的技術原理,以及背後涉及到的類神經網路以及深度學習技術。 ...

 
signm: 到目前alpha玩的還是這種規則簡單遊戲要讓它學習更複雜所以03/13 01:39
signm: 才有這新聞
signm: 之前的討論是用電腦角度去看當然覺得穩贏
sadmonkey: 說實在把圍棋用圖形化理解是簡化問題,把玩遊戲用圖形03/13 02:13
sadmonkey: 化理解只是複雜化問題,只是對工程師出考題對解決人類
sadmonkey: 無法解決的問題沒有甚麼幫助

--
 標題  Re: [問卦] 過年要如何叫不熟的親戚閉嘴?     看板《Gossiping》 (#1KurUyPF)
「怎麼這麼久沒回來阿?」                                    「我這不是來了嗎?」
「要常常回來給我們看阿」              「我不知道你要見我阿,你這不是見到了嗎?」
「趕快生小孩阿!人家阿花都已經生了一個了!」「那他生了一個,有沒有要生第二個?」
「有錢沒錢,結婚好過年嘛!」              「你們的婚姻能維持這麼久,真不簡單!」
「ㄟ,你怎麼這樣說話?對長輩真沒禮貌!」        「我把你們當人看,要教育你們!」

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.230.18.167
※ 文章代碼(AID): #1Mv704Pg (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1457811460.A.66A.html
kimifort: 還好AlphaGo桌面沒安裝PCMan  不然就讓他學會發一堆廢文1F 03/13 03:39
owenkuo: 那一天,人類想起了AlphaGo當年開始打敗人類的起點....2F 03/13 03:40
milkBK: 先看rp讓他知道採礦能造兵,造兵能打贏,3F 03/13 03:41
milkBK: 然後慢慢去模擬,最後發現最強其實是6d
GalLe5566: 領悟(X) 計算(O) 他只是單純算怎麼做勝率高5F 03/13 03:42
淺談Alpha Go所涉及的深度學習技術 | 尹相志Allan's blog - 點部落
[圖]
[圖]
[圖]
介紹AlphaGo的技術原理,以及背後涉及到的類神經網路以及深度學習技術。 ...

 
wnglon: 阿發狗的原型 別再誤導大眾了7F 03/13 03:43
dans: 那阿發狗能從八卦版計算出怎樣發廢文可以得最多噓嗎8F 03/13 03:43
dans: 我在廢文之道上已感力不從心  希望藉由與阿發狗一戰得到靈感
wnglon: 你要用幾顆CPU去計算星海的最佳微操 瘋了嗎你10F 03/13 03:44
hibbb: 其實應該是要讓阿法狗和電腦正常對戰個1000場再挑戰人類11F 03/13 03:45
hibbb: 然後由人類方狂放快攻戰術看看阿發狗到底會怎麼應對
leon80148: 如果只跟一般AI打,最後電腦應該只會每場都放大招吧13F 03/13 03:46
hibbb: 很明顯打正規無論是資源或微操阿發狗都強太多了14F 03/13 03:46
wnglon: 阿發狗是在對戰時跟自己對奕 去找出機率較大的贏法15F 03/13 03:46
wnglon: 請問星海要怎樣算出最佳演算法?
wnglon: 麻煩看一下連結
godsparticle: 打一場星海要多久? 他可能學很慢18F 03/13 03:48
wnglon: 星海不是回合制 沒辦法及時喔 可能要計算個一分鐘19F 03/13 03:49
wnglon: 才能找到最佳解
wnglon: 鄉民臉腫了 哈哈
leon80148: 理論上是可以的 至於演算法要怎麼寫一般人怎會知道22F 03/13 03:51
wnglon: 繼續嘴砲沒關係23F 03/13 03:51
dans: 邊走邊算不就好了  若要算出最佳解才能移動  圍棋也不用玩了24F 03/13 03:52
wnglon: 起碼阿發狗概念目前絕對不能運用25F 03/13 03:52
DarkerDuck: alphago找出來的本來就不是最佳解,根本不用找最佳解26F 03/13 03:52
wnglon: 他是用2000多顆去計算的 星海要幾顆?27F 03/13 03:52
DarkerDuck: alphago的架構是為圍棋特化的弱AI28F 03/13 03:53
leon80148: 在跟李40比賽之前也一堆人覺得阿發狗會被玩封阿...29F 03/13 03:53
wnglon: 口誤 不好意思30F 03/13 03:53
dans: 邊走邊算不就好了?開局固定起手勢不就那幾個?31F 03/13 03:53
Enrollee: 我比較好奇 為什麼有人會覺得阿發狗不會玩星海? XD32F 03/13 03:53
dans: 戰略遊戲的"定石"還比圍棋少  開局多的是時間可以算33F 03/13 03:54
wnglon: 連結不就有解說了34F 03/13 03:54
Enrollee: 星海很難嗎? 坦白講 連圍棋都能贏了,星海很難嗎?35F 03/13 03:54
leon80148: 圍棋複雜度也不低  但阿髮狗證明他就是有辦法學起來36F 03/13 03:54
wnglon: 不是用學的 怎麼有人還搞不懂37F 03/13 03:54
leon80148: 更何況在微操跟計算資源這方面  電腦根本大勝好嗎38F 03/13 03:54
dans: 圍棋就是邊走邊算  只是Google沒告訴你讀秒是內建限制的39F 03/13 03:54
dans: 根本不是算不出答案才搞到讀秒,而是永遠在規範時間內求解
wnglon: 圍棋是一瞬間算大量的走法才會用到2000顆CPU41F 03/13 03:56
wnglon: 這過程起碼也要一分鐘以上 有看棋嗎
dans: 你確定是算答案花一分鐘,還是工程師告訴他每一步都有一分鐘43F 03/13 03:58
dans: 拿那時間來說計算過程要多久會不會太天真了,機器不會自己決
henry1234562: 這個機制就是學習  實際上這alphago就會玩小遊戲45F 03/13 03:58
dans: 定計算時間,而是別人告訴他什麼時候可以用多少時間46F 03/13 03:58
wnglon: 你去看今天比賽 電腦有哪一步是即時下的47F 03/13 03:59
leon80148: 最好電腦在算的過程就完全不會動按著S讓你A假的。48F 03/13 03:59
dans: 說不定阿發狗20秒就算完答案還上網跟初音聊了40秒的天49F 03/13 03:59
henry1234562: 電腦不需要即時下 他有時間為啥要即時下50F 03/13 04:00
dans: 只因為主辦單位跟他說比賽前段要一分鐘才能落子,後段要30秒51F 03/13 04:00
henry1234562: 且實際上昨天alphago進讀秒時 他就固定30秒一子52F 03/13 04:00
wnglon: 你去GO版看 有推文已經完整解釋其演算法53F 03/13 04:00
henry1234562: 一秒都沒多用 他早就計算完你也不知道54F 03/13 04:00
leon80148: 搞不好電腦發現在幾秒鐘下的時後贏的機率最高zzz55F 03/13 04:01
willy61615: 你看到平行世界的阿發狗喔 阿發狗後段明明常出現30秒56F 03/13 04:01
willy61615: 之內一步的
dans: 有演算法有什麼用?會告訴我們Google給阿發狗設定幾秒落子嗎58F 03/13 04:01
grandwar: 說開作弊會贏的,你以為工程師不會預測你開作弊嗎?XD59F 03/13 04:02
wnglon: 你去看連結好嗎 別再跟我辯這個 看完再說這套理念能不能60F 03/13 04:02
wnglon: 用在星海
Enrollee: 基本上星海這種軍備競賽遊戲 對阿發狗來說實在是簡單啦62F 03/13 04:02
Justisaac: 主要是要從程式計算的最佳化進化到圖型運算吧63F 03/13 04:02
leon80148: 奇怪捏 一直提連結作啥,我看了連結還是覺得很厲害阿64F 03/13 04:03
Justisaac: 而且星海的問題是模擬上需要先解析遊戲程式.....65F 03/13 04:03
Enrollee: 推文就有鄉民說了 連爆雪都辦得到 何況是阿發狗66F 03/13 04:03
Justisaac: 不然無法像圍棋那樣一天下1000萬局....67F 03/13 04:03
henry1234562: 當然可以用在星海..你搞錯了一些東西68F 03/13 04:04
henry1234562: alphago 可不是每一場都從0開始重新計算
jinmin88: 訓練的核心應該都是同一套 只是agent要特製化...70F 03/13 04:04
henry1234562: 是訓練了很久才到現在這程度 這就是學71F 03/13 04:04
Justisaac: 無論如何跟圍棋比都還是慢太多 需要更快的學習法吧72F 03/13 04:05
leon80148: 應該沒這麼複雜啦  星海自己都有內建AI了73F 03/13 04:05
henry1234562: 能夠學打磚塊 能學小蜜蜂 當然能學星海74F 03/13 04:05
wnglon: 重點阿發狗根本是自對奕來計算勝率 沒有所謂的學習75F 03/13 04:05
henry1234562: alphago 的勝率計算法包含過去對奕過的所有經驗76F 03/13 04:06
Justisaac: 前面我看那些遊戲是以小時計算來學習的77F 03/13 04:06
henry1234562: 而不是只從當下這局去算分支78F 03/13 04:06
leon80148: 即時戰略就是在比控兵,計算資源,偵查及部分博奕成分79F 03/13 04:06
Justisaac: 那轉換成星海不就變成要以幾萬小時來算了..80F 03/13 04:06
henry1234562: 會利用過去經驗 就是學習81F 03/13 04:06
leon80148: 沒理由圍棋作的到星海作不到82F 03/13 04:07
grandwar: 你看完那篇怎麼會有他沒有學習的誤會?XD 只是他的學習83F 03/13 04:07
Enrollee: 圍棋阿法狗需要思考沒錯 因為可以變動的變項太多84F 03/13 04:07
Justisaac: 就只是學習方式跟人很像不一樣  其實都一樣85F 03/13 04:07
grandwar: 還在很初階的階段而已啊86F 03/13 04:07
henry1234562: 是電子遊戲就能加速 且也能從錄像學習87F 03/13 04:07
Justisaac: 人也是try and error開始學習的~88F 03/13 04:07
leon80148: 星海一場通常不到20分鐘就打完了好嗎。這幾場圍棋都用89F 03/13 04:07
leon80148: 小時來算的
henry1234562: 當然以現在的程度要學多久不知道91F 03/13 04:07
Enrollee: 星海只要拼速度殺暴對方就好了 人是快得過電腦的速度逆92F 03/13 04:08
Justisaac: 我在想設計小組是不是在嘗試不加速要怎麼加速學習93F 03/13 04:08
Cocochia: 經驗累積其實不就是學習嗎?94F 03/13 04:08
henry1234562: 我覺得只是沒有花時間去加速遊戲而已95F 03/13 04:08
jinmin88: 星海的學習難度應該比方塊阿 馬力歐的難度多很多96F 03/13 04:09
grandwar: 電腦光用電子訊號控兵,你的速度絕對跟不上他啦97F 03/13 04:09
henry1234562: 畢竟重點是在驗證這個方式能不能有學習效果98F 03/13 04:09
Justisaac: 去加速遊戲其實就又跳入舊框架啦~99F 03/13 04:09
Justisaac: 現實世界是沒辦法加速的~ai勢必要面對這個問題~
Enrollee: 控兵跟生產單位的速度 人怎麼跟電腦拼啦? 這有啥好戰的?101F 03/13 04:09
wnglon: 自對奕得來結果 如果相同概念就在遊戲中模擬對戰102F 03/13 04:09
henry1234562: 不需要阿 AI在學習的過程不需要跟人類一樣103F 03/13 04:09
Justisaac: 你可以把電腦的控兵限制在使用滑鼠與鍵盤啊.....104F 03/13 04:09
grandwar: 應該要叫阿法狗只能用機械手控105F 03/13 04:10
Cocochia: 只是人類有想像力,可以抽象具體轉來轉去,電腦不行,或106F 03/13 04:10
Cocochia: 是需要更多CPU或其他組件來幫助。
Justisaac: 然後限制一下滑鼠移動的速度跟鍵盤和滑鼠鍵的點擊數108F 03/13 04:10
Justisaac: 不用機械手臂啦 控制它能使用的操控指令就好  不難
wnglon: 光是大局觀就有的想了 就先到這邊了 不多說110F 03/13 04:11
henry1234562: 只要操作是與玩家條件相同就好111F 03/13 04:11
henry1234562: 你也不需要多說 因為你不懂學習
Justisaac: 挑戰即時戰略應該是ai侵入人類世界的第一步XD113F 03/13 04:12
wnglon: 276848說很清楚 不多說 也不指責114F 03/13 04:12
Justisaac: 從統計進化到時間序列  哈哈115F 03/13 04:12
henry1234562: 會認為 CPU數量有影響 表示你還停留在舊的觀念116F 03/13 04:12
leon80148: 我真的不是很清楚一篇被噓爆的文章是想清楚表達什麼117F 03/13 04:13
Justisaac: 我在想圍棋應該也有必勝法~阿法狗不知道找出來沒XD118F 03/13 04:14
henry1234562: alphago沒辦法找出必勝法吧119F 03/13 04:14
Justisaac: 不過他的思考模式不是窮舉法 所以應該還沒吧0.0120F 03/13 04:14
henry1234562: 必勝法建立在能套用到"所有"步法都成立上121F 03/13 04:15
henry1234562: 圍棋的所有步法不可能用窮舉法搜完
henry1234562: alphago只能訓練到非常不容易輸而已
wnglon: 反正GO有人說電腦要自對奕 需要大量運算 而且要算好幾萬盤124F 03/13 04:16
wnglon: 才會用到2000多顆CPU
henry1234562: 自對奕的運算大部分不是在實際對弈時126F 03/13 04:17
wnglon: 不然很難短時間內完成這些動作127F 03/13 04:17
henry1234562: 而是自我對奕訓練時128F 03/13 04:17
henry1234562: alphago 已經練過上億場 基於這些經驗才這麼強
henry1234562: 並不是在對奕當時才計算這些場次來找勝率
wnglon: 但你要對手下一步棋 你才能計算下一步 哪可能馬上算好131F 03/13 04:18
Justisaac: 不過光是可以把不同棋局的經驗拿來用我覺得就是里程碑132F 03/13 04:18
henry1234562: 不需要馬上 圍棋本來就有思考時間133F 03/13 04:18
Justisaac: 畢竟每盤棋局都不同.....134F 03/13 04:18
wnglon: 難道你感覺不出昨天的比賽 AI花的時間有忽快忽慢135F 03/13 04:19
henry1234562: 且alphago又不是對手還沒下就沒再計算136F 03/13 04:19
henry1234562: 你對學習的定義有點狹隘
henry1234562: 並不是 學習好之後 就應該要不用計算的下每一步
henry1234562: 只要過去的經驗 會讓下一次計算更正確 就是學習
Enrollee: Alphago玩星海有什麼好慢的 XD 反正他就是要殺爆對手啊140F 03/13 04:20
Justisaac: 慢是為了讓他跟人類比賽~141F 03/13 04:20
   我覺得跟人類比賽正是重點  之前的小遊戲都是面對有固定AI的電腦
   很容易被Alpha找出破解之道
   圍棋開始對手換成人類
   所以預測人類對手的棋步變成重點
   星海應該重點也是在這邊
   如何從人類對手可觀測到的動向  預測人類對手的下一步  下下步動向
   並進而思考採取相對應策略  回應人類對手
   這都是在把人工智慧導入博奕格局的訓練
   以後還可以拓展到類似的其他人類博奕賽局...
wnglon: 你說的點還是很有問題..142F 03/13 04:20
henry1234562: alphago實際對奕花的思考時間並不是啥重點143F 03/13 04:20
wnglon: 反正我也不是專業 你去GO版討論吧144F 03/13 04:21
Justisaac: 而且很有可能手速會影響戰術甚至影響戰略~145F 03/13 04:21
Cocochia: 我知道你說的,我說的是如果要讓電腦思考方式跟人腦一樣146F 03/13 04:21
henry1234562: 他這段時間確實就是在計算 這就相當於人類的思考147F 03/13 04:21
Cocochia: 的話,比如抽像具體轉換,視覺(電眼)轉為思考(AlghaG148F 03/13 04:21
Cocochia: O)這種比較複雜層次的東西。
henry1234562: 人類下棋 也是預想接下來對奕狀況 選擇最好的150F 03/13 04:21
henry1234562: alphago做的事情完全一樣 只是規模不一樣
dryadg27724: 推152F 03/13 04:22
henry1234562: alphago用的三種方法 第三種就是各種局面的勝率153F 03/13 04:22
henry1234562: 自我對奕是第二種 用來修正他自己的步法
Cocochia: 因為AlphaGO可以計算勝率,卻無法分辨何者是棋子,何者155F 03/13 04:23
Cocochia: 是石頭,所以需要別的組件幫助他。
henry1234562: 這我保留 能自我對奕跟讀棋譜 應該是能分辨棋子157F 03/13 04:25
Justisaac: 抽象概念電腦好像有點難理解 語言學不好也是這原因158F 03/13 04:25
henry1234562: 不過是指人類的五感 這種分辨那自然還不行159F 03/13 04:25
Justisaac: 圍棋其實他不用分辨棋子啊~用座標系理解就好160F 03/13 04:26
Justisaac: 要轉換到星海就真的是需要圖型辨識能力了
Justisaac: 除非作弊去讀記憶體  可是我覺得這就失去突破點...
henry1234562: 就跟學打磚塊一樣163F 03/13 04:27
henry1234562: 實際上學得會打磚塊 還學會怎麼輕鬆拿高分
Cocochia: 哦? AlphaGO有圖像分辨能力是嗎? 太驚人了!165F 03/13 04:27
henry1234562: 所以我認為辨識不太是大問題166F 03/13 04:28
Cocochia: 原來是我誤會了。167F 03/13 04:28
HTCtriple2: 圖像辨識已經是很普遍的技術了......168F 03/13 04:29
Justisaac: 普遍的技術不一定代表阿法狗有裝啊XD169F 03/13 04:30
henry1234562: 那就不太是需要討論的問題..170F 03/13 04:30
Justisaac: 也不一定代表阿法狗有圖像學習的能力~171F 03/13 04:30
Justisaac: 圖像思考跟數學計算差距其實很大~
henry1234562: 我認為 看過打磚塊影片 很難認為沒圖像學習能力173F 03/13 04:31
henry1234562: 就已經玩過打磚塊 馬莉歐 小蜜蜂等小遊戲了
henry1234562: 這些也都是即時的 怎麼看都有學習能力
jinmin88: 圖形辨識對google來說根本小case..看人家無人車做得多好176F 03/13 04:32
Justisaac: 打磚塊那個學習就我看起來應該是更簡單的學習法177F 03/13 04:32
   打那些遊戲好像沒有用圖象辨識來理解  簡化成一堆參數就好
   https://youtu.be/qv6UVOQ0F44
MarI/O - Machine Learning for Video Games - YouTube
MarI/O is a program made of neural networks and genetic algorithms that kicks butt at Super Mario World. Source Code:  "NEAT" Pap...

 
leon80148: 阿髮狗裝圖像辨識能力是要幹嘛? 他就是設計來學下圍棋178F 03/13 04:32
henry1234562: 而且發表會有講 輸入就只有要求alphago拿高分179F 03/13 04:32
jinmin88: 這應該也是deepmind加入google能夠馬上享受到的好處吧180F 03/13 04:32
HTCtriple2: 沒有裝就裝啊 圖像辨識很一般的技術 = =181F 03/13 04:32
   圖像辨識本身也是一種深度學習  學習分辨什麼是貓什麼是狗
Justisaac: 很可能只是讀分數與操控間的關聯而已....182F 03/13 04:32
henry1234562: 其他操作法甚至打磚塊規則都沒給183F 03/13 04:32
Justisaac: 不用規則啊  左右移+分數多寡就能學習了184F 03/13 04:33
henry1234562: 你看他的操作 很明顯他知道哪個是球185F 03/13 04:33
jinmin88: 我猜阿發狗應該是透過圖像辨識吃入大量的網路上的棋譜186F 03/13 04:34
Justisaac: 該給的資訊給一給 剩下就是怎樣高分而已啦~187F 03/13 04:34
henry1234562: 給的資訊只有 拿高分 其他都沒給阿...188F 03/13 04:35
Justisaac: 吃棋譜進去最後也是轉成數位啊0.0189F 03/13 04:35
henry1234562: 發表會就說了190F 03/13 04:35
Justisaac: 我說的資訊是指 球速 橫棒移動 磚塊位置這些..191F 03/13 04:35
leon80148: 想太多 棋譜一定要圖像嗎... 棋譜要數據化很容易吧192F 03/13 04:35
henry1234562: 懷疑有沒有圖像技術真的是沒啥意義193F 03/13 04:35
Justisaac: 不讀進去他連棒子在哪都不知道怎麼玩XD194F 03/13 04:35
henry1234562: 因為 沒有就給就好 這並不是很難的技術195F 03/13 04:36
leon80148: 對阿 搞錯重點了  重點在於他核心的機器學習能力196F 03/13 04:36
Justisaac: 我只是好奇他們找不找得到縮短學習時間的方法而已~197F 03/13 04:36
henry1234562: 能讀取到的資訊自然就能利用來學習198F 03/13 04:37
leon80148: 其它技術層面的東西可以在另外克服199F 03/13 04:37
Justisaac: 打磚塊要學4小時的話  星海學起來效率就太差了200F 03/13 04:37
   四小時是發現很多人不知道的秘技 2小時他就玩的比大多數人類好了
henry1234562: 四小時不重要 因為這要縮短太容易了201F 03/13 04:37
henry1234562: 是從0開始學習 才是要學四小時
Justisaac: 嗯?這容易的話下棋就都不用思考時間了203F 03/13 04:38
henry1234562: 這兩者一點關係都沒有..我不知道你怎麼連結的204F 03/13 04:38
Justisaac: 玩星海也是從0開始啊  萬一要學10萬小時那不是太沒效率205F 03/13 04:38
henry1234562: 沒人規定你要從0開始阿..206F 03/13 04:38
Justisaac: 你要他怎麼不是從0開始XD207F 03/13 04:39
henry1234562: 實際上 alphago學圍棋就不是從0開始208F 03/13 04:39
henry1234562: 而是先讀了一堆棋譜 學會人類是怎麼下 才開始
Justisaac: 他是從零也不是從零~最終還是ai要搞懂勝率啊~210F 03/13 04:39
henry1234562: 同理星海 alphago不需要從0開始學操作跟戰術211F 03/13 04:40
henry1234562: 完全可以直接給現有的操作跟戰術 在讓他自己升級
henry1234562: 是否有基礎戰術理解 對學習時間縮短絕對很有效
henry1234562: 這就是我說的 要縮短學習時間方法太多
henry1234562: 沒必要每個都像打磚塊一樣 一開始連要接球都不知道
henry1234562: alphago 從0開始到知道要接球可是花了300場
Justisaac: 整體聽起來比較像給工程師的挑戰 不是阿法狗的挑戰XD217F 03/13 04:42
henry1234562: 但從知道接球到知道最好戰法 只花500場218F 03/13 04:43
Justisaac: 怎麼分析讓阿法狗搞懂星海才是大問題XD219F 03/13 04:43
henry1234562: 如果你一開始就告訴alphago要接球 他就省下一半時間220F 03/13 04:43
Justisaac: 終究是要花時間學習~只是學習的是工程師~XD221F 03/13 04:43
※ 編輯: Verola (36.230.18.167), 03/13/2016 04:45:50
leon80148: 學習的不是工程師  工程師設計出邏輯和演算法電腦執行222F 03/13 04:45
leon80148: 然後想辦法完成任務並學習
m80126colin: 某 w 說自己不是專業剛剛還跳針那麼久,藉由建立過去224F 03/13 04:47
m80126colin: 經驗來縮短計算時間,那麼建立的過程不就是「學習」
leon80148: 這其實已經很不容易了。226F 03/13 04:47
m80126colin: ?那是我們心態不對,學習總要往「最佳化」前進,但227F 03/13 04:47
m80126colin: 是阿法狗告訴我們,你每次局部取最優,未必能達到全
m80126colin: 局最優,人類只是把這個世界簡化成 greedy 的模型罷
m80126colin: 了。
mainline: 總算出現了水準文 不過某w是不是理解錯誤 以至於看起來231F 03/13 04:56
mainline: 像來亂的
chungyiju: AlphaGo加油努力學習吧~233F 03/13 04:59
m80126colin: 太小看自動化以及人工智慧取代未來的要小心沒有做準234F 03/13 05:00
m80126colin: 備的衝擊
Cocochia: 感謝原波解說,我的圖像辨識正是那個意思。236F 03/13 05:01
dryadg27724: 有超級馬利的影片嗎?237F 03/13 05:52
Xenosaga: 這樣看來下圍棋只是阿發狗的起點而已238F 03/13 05:56
farmerlu: A.I. 同修推                                       +p239F 03/13 05:58
Xenosaga: 最終目標最少是基礎的人工智能 自我學習 分析240F 03/13 05:58
Xenosaga: 至少可以取代無塵室生產線那些行屍走肉的麥肝作業員
Xenosaga: 你把工廠環境跟生產參數輸入之後 它可以做到世界末日
Xenosaga: 只要沒有大問題出現 他還可以自我校正
Xenosaga: 一整座液晶螢幕生產線 大概只要1名工程師跟保全就可以了
Xenosaga: 希望不要發展得太快 這會造成人類社會革命
MarI/O - Machine Learning for Video Games - YouTube
MarI/O is a program made of neural networks and genetic algorithms that kicks butt at Super Mario World. Source Code:  "NEAT" Pap...

 
fucigniz: 樓樓上和這篇都想太多了 做一個自我校正的機器 那廠商247F 03/13 06:48
fucigniz: 要賺啥? 還有 alphago 根本不能稱之為思考 他一開始還是
fucigniz: 要有人餵牠棋局 他只是用快速有效率的方式整理考古題
fucigniz: 自我對弈 也不過就是在驗證考古題的準確率。大家應該都
fucigniz: 知道靠自己求解一個題目 和收集考古題的差別。
fucigniz: 最簡單的就是 為什麼這麼多厲害的工程師 卻選擇把投資
fucigniz: 程式放出去賣 而不是靠它賺錢? 棋局能被破解本來就是遲
fucigniz: 早的事 因為它在有限時間內母體是固定的 今天把圍棋規則
fucigniz: 改得更複雜 它就不能適應了 第二 它所吃的數據與輸贏有
fucigniz: 關 今天如果把它改在一個隨機斷電的環境 它有可能下一半
fucigniz: 就被切斷, 它最後是無法統計到輸贏的。而真實世界的問題
fucigniz: 多半是像後者那樣複雜。
fucigniz: alphago能贏的關鍵, 在於這遊戲下的每一子, 最後都會對
fucigniz: 應到某些答案 至於真實世界 你的數據可能與答案完全無關
Jimmywin: 塞魯...261F 03/13 07:07
harry886901: 吵回合制的話,他玩爐石不是超強262F 03/13 07:10
fucigniz: 而工程師的功用就是 當一個問題變簡單 要去創造更多問題263F 03/13 07:17
herculex: alphago不去限制他的手速,怎麼跟他玩264F 03/13 07:20
fucigniz: 很簡單, 你只要改變遊戲規則就可以。265F 03/13 07:22
fucigniz: alphago 在和人對弈的時候 某些情況會突然斷電 或改變
fucigniz: 遊戲規則, 甚至明明贏要讓它輸 讓他無法直線判斷方向
dbalruke: 事實上是把規則改得更複雜,他還是能適應,至少適應的比268F 03/13 07:25
dbalruke: 人類快,人工智能有個重點,他不一定要像神一樣完美,他
dbalruke: 只要比人類強一點點,就有價值了,google 無人車也有可
dbalruke: 能出車禍,但比人類好太多了。我比較好奇的是,人類是否
dbalruke: 可以靠向alphago學習,最終破解圍棋這個遊戲
fucigniz: alphago的思維還很像台灣高中生 他並不懂獨立思考273F 03/13 07:27
fucigniz: 它是從考古題海裡找出怎麼走 靠統計判斷勝率
fucigniz: 現在的AI還是只能這樣 人類與其擔心AI 不如擔心有沒有
fucigniz: 激進的納粹份子 二十年內 害人機器可能連小學生都能做
fucigniz: 我認為 人類該做的事 是放棄圍棋 去做更重要的事
fucigniz: 這證明了圍棋是一個靠題海+計算 就能攻克的遊戲
fucigniz: 棋手不應該浪費他優秀的腦袋在這個遊戲上面
tiuseensii: 嗯,田徑球類活動都可以廢了,人類不應該浪費力氣在低280F 03/13 07:48
tiuseensii: 智商勞動上
fucigniz: 教會程式玩遊戲, 其實也是人類能想得出來的範疇罷了282F 03/13 07:48
fucigniz: 因為遊戲可以給他立即的贏、輸 反饋 所以他不用思考為什
fucigniz: 麼 就是一直暴力try就有答案 然而 人類的厲害在於小數據
fucigniz: 如果AI玩一個遊戲 每做完一個動作要冷凍10分鐘 未必就能
fucigniz: 贏過人類 ... 不需要靠贏輸反饋也能判斷局面 才叫思考
fucigniz: 同理 如果人類只懂得砍題目 靠經驗判斷對錯 卻不思考
fucigniz: 這種就是高中生的學習方式 很快就會被機器所取代
fucigniz: 我認為真正的AI還沒有開始 現在的AI只是思想的擴充驗證
virgonelson: 推樓上290F 03/13 08:03
transcend789: 我希望單人遊戲的AI強ㄧ點 不要耍智障291F 03/13 08:07
MasCat: 有點強292F 03/13 08:19
deerdriver: F大根本不懂圍棋才會得出這樣的結論吧293F 03/13 08:25
m2488663: 照某人邏輯來生活 人生應該比工蟻還慘294F 03/13 08:34
nanako81240: 推295F 03/13 08:35
yudofu: 你知道教會機械思考思考要花多少智慧嗎?又是粗暴的人類至296F 03/13 08:50
yudofu: 上論,這才是沒思考的代表吧
Cefilos: 在這裡的鄕民算哪根蔥啊,還評斷值不值得花時間投入,當298F 03/13 08:58
Cefilos: 真笑死人。自卑過頭變自大嗎?
ringtweety: 西洋棋早就被攻破了 可是都還是有棋手阿300F 03/13 09:19
zainc: 給阿發go pcman可以觀察它如何學會發廢文~301F 03/13 09:31
gfneo: 之前才看某玩家自己寫的AI玩魔界村(FC),這過程很有趣XDDD302F 03/13 09:50
eric20: 笑了303F 03/13 09:55
Cybermark: AlphaGO最恐怖的一點,是不像深藍一樣暴衝,而是慢慢推敲304F 03/13 10:33
Cybermark: ;如果它下一場變成輸局,人類真的要想想它是真輸,還是
Cybermark: 怕插頭被拔掉
wtao: 推宗師烏龍307F 03/13 10:33
jumpdodo: 可以叫阿法狗幫練線上遊戲嗎308F 03/13 10:36
TSbb: 一堆人搞不懂超好笑的 XD309F 03/13 11:00
Jupiter1129: 推...310F 03/13 11:23
j3: 重點是它有'被設定'以分數當目標 人類不需要 人類還會自己找311F 03/13 11:30
j3:  當然這是目前的情況 若它會自己找目標 就變天網了
lozupomelo: 推313F 03/13 11:56
SHIU0315: @@314F 03/13 12:09
AbbeyJien: 推315F 03/13 12:10
AMAGICIAN: 李40:生而為人,我很抱歉316F 03/13 12:29
Windcws9Z: 完了 完了 要變天網了317F 03/13 12:37
gncn: 推文一堆裝懂的腦殘.....  台灣的民眾素質阿....318F 03/13 13:48

--
※ 看板: Gossiping 文章推薦值: 1 目前人氣: 0 累積人氣: 2558 
作者 Verola 的最新發文:
  • +32 Re: [情報]日亞馬遜 SoundPEATS 耳機優惠 - Lifeismoney 板
    作者: 101.10.93.253 (台灣) 2021-11-30 12:12:03
    美亞的 Tozo NC2 回到39.99了,但是沒關係, 日亞的 Tozo NC2 現在只要 3635 = 872 NTD Tozo T12 3181 = 763 Tozo T10 2481 = 59 …
    55F 32推
  • +159 Re: [新聞] 日媒分析台灣對抗疫情績優 專家:不依賴 - Gossiping 板
    作者: 223.140.18.71 (台灣) 2020-03-07 07:23:48
    就以你所說 李文亮12月30日快1800 吹哨 當起點, 然後台灣不到24小時內,12月31日, 就已經啟動邊境檢疫。 從12月30開始算的話,台灣更是快到不可思議吧? 防武漢肺炎疫情 疾管署擬派員 …
    291F 166推 7噓
  • +60 Re: [閒聊] 張無忌的主力輸出是哪招? - C_Chat 板
    作者: 220.133.70.76 (台灣) 2018-12-02 15:34:47
    當你這樣問時,你對戰鬥的思考已經跟張無忌是完全不同的 XD 張無忌是金庸群俠中,大概可算是排名第一的反戰分子, 標榜的就是「愛與非暴力」 XD 所以張無忌從來就不愛戰鬥,更不會去想"如何輸出 …
    148F 60推
  • +60 [閒聊] 只有神知道的結局 有什麼不好嗎? - C_Chat 板
    作者: 220.133.70.76 (台灣) 2018-09-10 07:35:40
    一路爬文看到不少人抱怨沒天理、各種股災, 不過千尋結局不好嗎? 是不是一部分因為代入主角心理,所以覺得不喜歡千尋, 剛好我從頭到尾都非常討厭桂木,覺得他配千尋很合理啊~ 因為其他女主角桂木一個都配不上 …
    116F 63推 3噓
  • +43 [閒聊] 犬夜叉桔梗這麼受歡迎 是不是因為歌好聽 - C_Chat 板
    作者: 220.133.70.76 (台灣) 2018-08-25 00:30:30
    今天剛好點到犬夜叉中桔梗的配樂,各種回憶紛紛湧出, 真是各種心酸落淚啊QQ 桔梗應該是高橋老師筆下最多人喜愛的角色之一了, 除了悲劇坎坷的人生(&再生),外表冰清玉潔內心熾熱如火, 強大的前女 …
    66F 45推 2噓
點此顯示更多發文記錄
分享網址: 複製 已複製
( ̄︶ ̄)b win2000ps2 說讚!
1樓 時間: 2016-03-13 14:33:07 (台灣)
  03-13 14:33 TW
沒上過AI的不要裝模作樣出來人笑了啦
2樓 時間: 2016-03-13 17:01:07 (台灣)
  03-13 17:01 TW
以前是遇到狀況人類教電腦怎麼處理,現在是人類給電腦規則,電腦去處理,以後會不會是讓電腦去發現環境,然後製造規則,再去處理。
3樓 時間: 2016-03-13 17:22:44 (台灣)
     (編輯過) TW
人類跟機器比? 比啥洨? 完全無俚頭!
機器是人類設計的邏輯處理與經驗選擇系統
就像下棋, 人類無法對付龐大棋譜的記憶,與邏輯系統對決!
棋譜都是人類設計的經驗與邏輯累積,累積了幾萬個選擇與對策 下棋只是全部侷限在一個棋格子框架下,這是最簡易的範圍 沒有複雜的參數, 機器就是機器,只是對你的抉擇反應下個步驟,是對付你錯誤的選擇罷了! 人類單然無法跟這款的比賽比!
但是機器能夠打戰, 指揮人類武器對抗,生死戰嗎? 機器做的決定,也無法打贏人類,因為機器指揮人類作戰 就算是機器人,也是全身都是致命的弱點 無法計算出人類的各種參數,還包括無可預測的人類意志力
對藝術創作,請問Google 能夠發明藝術AI? 機器可以跟人類比賽藝術創作嗎? 呸! 也是無俚頭!
4樓 時間: 2016-03-14 02:27:37 (美國)
  03-14 02:27 US
我只擔心AI學會把妹後把全世界的妹;都把走,人類就滅亡了.
5樓 時間: 2016-03-14 09:15:34 (台灣)
  03-14 09:15 TW
還需要比嗎 光不用按鍵盤滑鼠就穩贏了好嗎 你一秒能按幾個兵種生產
r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇