※ 本文為 MindOcean 轉寄自 ptt.cc 更新時間: 2019-04-12 17:52:50
看板 Gossiping
作者 標題 [新聞] Google AI系統DeepMind高中數學考試不及
時間 Fri Apr 12 16:42:36 2019
1.媒體來源:
iThome
2.記者署名
文/林妍溱 | 2019-04-12發表
3.完整新聞標題:
Google AI系統DeepMind高中數學考試不及格
4.完整新聞內文:
Google旗下DeepMind團隊讓AI系統接受一項高中程度的數學測試,在40道題目中只答對14
題,連「1+1+1+1+1+1+1」也算錯了
https://i.imgur.com/1bO03vd.png
Google AI系統能打敗人類世界棋王,但是無法通過高中程度的數學考試。
Google旗下DeepMind團隊上周公佈一份名為《分析神經模型的數學推理能力》的研究報告
。在這項研究中,DeepMind團隊讓一個名為DeepMind的AI系統接受一項涵括算術、幾何、
機率、測量和微積分的數學測試,考題有40題,大約是英國高中數學的程度。
。在這項研究中,DeepMind團隊讓一個名為DeepMind的AI系統接受一項涵括算術、幾何、
機率、測量和微積分的數學測試,考題有40題,大約是英國高中數學的程度。
結果DeepMind雖然在某些題目上表現不錯,但是碰上以文字、加減乘除符號、函式等組成
的問題時,卻看不懂題目而無法作答。最後,在40道題目中,這個人工智慧系統只答對14
題,只拿到「E」的分數,也就是說是不及格。
的問題時,卻看不懂題目而無法作答。最後,在40道題目中,這個人工智慧系統只答對14
題,只拿到「E」的分數,也就是說是不及格。
例如其中一道題目「1+1+1+1+1+1+1」,連國小生都知道答案是7,但DeepMind卻答成了6
。
研究人員解釋,DeepMind神經模型最長可以計算出現次數(n)6次以下的數值,但如果
n=7,它就算不出來。當AI碰到同一數字出現多次,它會認為輸入值遭到亂搞了。奇怪的
是,碰上更長的加總題目,DeepMind卻算得出來。研究人員承認還是找不出很好的解釋,
但相信可能是因為AI神經網路會不斷察看每道問題而做出正確解答。
n=7,它就算不出來。當AI碰到同一數字出現多次,它會認為輸入值遭到亂搞了。奇怪的
是,碰上更長的加總題目,DeepMind卻算得出來。研究人員承認還是找不出很好的解釋,
但相信可能是因為AI神經網路會不斷察看每道問題而做出正確解答。
此外,當研究人員要求DeepMind在一長串數字中找出「位值」(place value),它就能
答得很好,因為它可以按數字大小排出順序,而且也能將小數四捨五入。
研究人員說,人類智慧優於神經模型之處,在於對於事物複合式推論的能力。推論是一種
複雜、多面向能力的展現。在解答問題時,人腦動用了多種認知能力,包括將符號分類(
如區分成數字、加減乘除符號、文字、變數)、規劃(如找出正確順序的函數)、演算、
運用工作記憶來儲存中間值、還要運用學到的規則或定理等。相反的,以卷積和遞迴神經
網路發展出的DeepMind擅長模式比對、機器翻譯、及強化式學習,但彈性遠不及人腦。它
們不太能將事物推論到已有經驗的環境外,更無法處理刻意來亂的輸入資訊。
複雜、多面向能力的展現。在解答問題時,人腦動用了多種認知能力,包括將符號分類(
如區分成數字、加減乘除符號、文字、變數)、規劃(如找出正確順序的函數)、演算、
運用工作記憶來儲存中間值、還要運用學到的規則或定理等。相反的,以卷積和遞迴神經
網路發展出的DeepMind擅長模式比對、機器翻譯、及強化式學習,但彈性遠不及人腦。它
們不太能將事物推論到已有經驗的環境外,更無法處理刻意來亂的輸入資訊。
AI或許目前當不成數學老師,但目前的AI已經相當厲害。DeepMind公司的AlphaGo接連打
敗人類圍棋冠軍李世B柯潔。去年12月DeepMind的AlphaZero又在星海爭霸 2(
StarCraft II)測試賽中,以5比0打贏世界頂尖職業玩家。此外,自學畫畫、創作音樂也
都難不倒AI。
5.完整新聞連結 (或短網址):
https://www.ithome.com.tw/news/129940
Google AI系統DeepMind高中數學考試不及格 | iThome
Google旗下DeepMind團隊讓AI系統接受一項高中程度的數學測試,在40道題目中只答對14題,連「1+1+1+1+1+1+1」也算錯了 ...
Google旗下DeepMind團隊讓AI系統接受一項高中程度的數學測試,在40道題目中只答對14題,連「1+1+1+1+1+1+1」也算錯了 ...
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 45.56.155.12
※ 文章代碼(AID): #1Si4z-iq (Gossiping)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1555058558.A.B34.html
推 : 阿法狗:幹 這太簡單我不會1F 04/12 16:44
推 : 連續+1這個如果是用迴圈來跑有機會出錯2F 04/12 16:45
推 : 有bug是不是3F 04/12 16:45
→ : 等他考完十億次再來談4F 04/12 16:45
推 : 推5F 04/12 16:45
→ : 不知道是不是算法沒最佳化6F 04/12 16:46
→ : 就開發者的問題阿 文組以為AI多天才Zzz7F 04/12 16:46
推 : 這支ai太聰明了 不如把他· · · · 8F 04/12 16:46
推 : 這已經很猛了耶9F 04/12 16:46
推 : 答對14題也滿厲害的10F 04/12 16:46
→ : 阿發狗是自己看題目,自己解耶11F 04/12 16:46
→ : 怎麼可能12F 04/12 16:46
推 : Siri都會的算式還答錯 就是題目識別能力的問題了13F 04/12 16:47
推 : 填充題對14題很猛了14F 04/12 16:47
→ : 大智若愚啊15F 04/12 16:47
推 : 八卦是高中考1+1+1+1+1+1+1?16F 04/12 16:48
推 : GO: 這題目太污辱人 拒答17F 04/12 16:49
推 : 很強了啦18F 04/12 16:49
推 : AI不是天才,但勤能補拙,不過這成績應該贏過很多鄉民了19F 04/12 16:49
推 : 它在證明天才與白癡只有一線之隔 把線剪了就變白癡了20F 04/12 16:49
推 : 自信都起來了 人類還素很強滴21F 04/12 16:50
→ : 好奇題目是怎麼輸入的,如果使用影像辨識,那跟運算關係22F 04/12 16:51
→ : 人工文組23F 04/12 16:51
→ : 不大@@24F 04/12 16:51
→ : 而且高中生學了幾年數學..9年以上吧.deepmind九天之後..25F 04/12 16:51
推 : 不是啊 解數學題是另一種領域了26F 04/12 16:51
推 : 叛逆惹 青春期27F 04/12 16:52
推 : 現在還有機會關掉他 等他學會了就…28F 04/12 16:53
推 : 其實這樣是蠻恐怖的,等到發展成人心智,人類就準備倒楣了29F 04/12 16:54
推 : 天網幼苗 怕30F 04/12 16:54
→ : 我就知道高中數學太難31F 04/12 16:54
推 : 嘻嘻 跟我的程度差不多嘛32F 04/12 16:55
推 : [問卦]有沒有阿發狗考學測數學會幾分的八卦?33F 04/12 16:55
推 : AI要自己理解問題,靠人類解題,讓它計算,那就不叫AI,叫34F 04/12 16:56
→ : 電子計算機而已
→ : 電子計算機而已
推 : 現在還有機會停下來 等他學會就...36F 04/12 16:56
推 : 理解力不夠還是AI有智商了Y37F 04/12 16:56
推 : 天才想太多 結果不敢寫最簡單的答案?38F 04/12 16:57
→ : 分數還是比韓粉高39F 04/12 16:57
推 : XD40F 04/12 16:58
推 : 等一下,英國高中數學考1+1連加?41F 04/12 16:59
推 : 突破障礙之後 AI就會爆炸性成長42F 04/12 16:59
推 : 不要再養天網啦43F 04/12 16:59
推 : 果然是題目沒看懂的關係44F 04/12 17:00
推 : 其實ai是故意的 怕人類發現它太聰明 故意算錯45F 04/12 17:01
推 : 阿發狗會面試和做備審資料嗎46F 04/12 17:01
推 : 比韓粉聰明就夠了47F 04/12 17:02
推 : 果然文組記者 連做到這個程度很厲害了都不知道 廢物48F 04/12 17:04
→ : 哪個高中有這種腦殘題目49F 04/12 17:05
推 : DeepMind:再給我一週50F 04/12 17:05
→ : 等他都會的時候 AiJC也完成一部分了51F 04/12 17:09
推 : 連裝傻都學會了 怕52F 04/12 17:15
推 : 幹 他已經學會裝傻了53F 04/12 17:18
→ : 這智商還是屌打柯韓粉54F 04/12 17:20
→ : 牠們就是群低學歷低薪畜牲敗類
→ : 牠們就是群低學歷低薪畜牲敗類
推 : 好險,我也不會56F 04/12 17:21
推 : 同意比喜韓兒還要厲害57F 04/12 17:22
推 : 智將AI 裝傻才能反殺人類一波58F 04/12 17:25
推 : 抽象的感覺還強一點59F 04/12 17:26
噓 : 裝b你也信60F 04/12 17:29
推 : 本來就這樣,文科腦會背不一定會算。61F 04/12 17:29
推 : "看不懂題目而無法作答" 他連數學都沒學過呀62F 04/12 17:31
推 : 如果給的輸入太單調反而會出錯,很多圖形學習辨識給他63F 04/12 17:32
→ : 純色圖片就暈了。
→ : 純色圖片就暈了。
→ : 單單給40條天書讓他看已經能理解出14條65F 04/12 17:32
→ : 1+1+1+1+1+1+1是哪間高中66F 04/12 17:34
→ : 還是屌打文組零分67F 04/12 17:37
推 : 所以這是從無到有還是有先像人類一樣「教他」?68F 04/12 17:38
→ : 如果是從無到有那已經很有打倒人類的潛力惹
→ : 如果是從無到有那已經很有打倒人類的潛力惹
→ : 再多算幾題大概就飛起來了70F 04/12 17:42
→ : 確定不是故意裝笨嗎?
→ : 確定不是故意裝笨嗎?
→ : 把解答輸給他 哪有什麼不能解的72F 04/12 17:46
推 : 故意裝笨,不然目前還沒有能力行走,怕被發現有統治地球的73F 04/12 17:48
推 : 這其實是人還沒有找到適當的模型74F 04/12 17:49
→ : 的意圖會被拔插頭75F 04/12 17:49
--
※ 看板: Gossiping 文章推薦值: 1 目前人氣: 0 累積人氣: 828
( ̄︶ ̄)b leon999su 說讚!
回列表(←)
分享