[新聞] AI學會說謊最新研究：AI已發展欺瞞技巧 - Tech_Job板

作者 godofsex (性愛戰神)
標題 [新聞] AI學會說謊最新研究：AI已發展欺瞞技巧
時間 Sun May 12 01:22:13 2024

AI學會說謊！最新研究：AI已發展欺瞞技巧人類恐遭奪權滅絕

Yahoo奇摩

2024年5月11日週六下午3:35

人工智慧（AI）狂潮席捲科技業及全球市場，專家們長期以來不斷警告AI失控可能帶來威
脅，一項最新研究報告更指出，這件事已經在發生。

一群科學家10日發表於《模式》（Patterns）期刊的文章指出，原本設計為誠實不欺的現
有AI系統，已發展出令人不安的欺瞞技巧，例如哄騙線上遊戲的人類玩家，或說謊以僱用
人類來解決「我不是機器人」的驗證。

人工智慧（AI）狂潮席捲科技業及全球市場，專家們長期以來不斷警告AI失控可能帶來威
脅，一項最新研究報告更指出，AI已發展出欺瞞技巧。（示意圖／Getty Images）

法新社報導，這份研究報告的主要作者帕克（Peter Park）說，這類例子聽起來或許只是
細枝末節，但暴露出來的潛在問題可能很快就在現實世界造成嚴重後果。

在美國麻省理工學院（Massachusetts Institute of Technology）研究人工智慧（Artif
icialIntelligence,AI）存在安全的博士後研究員帕克告訴法新社，「這些危險能力常常
在事後才被發現」，而「我們訓練誠實傾向而非欺瞞傾向的能力非常差」。

帕克說，能深度學習的AI系統不像傳統軟體那樣由「編寫」而成，而是透過類似選擇性培
育的程序逐漸「成長」。

也就是說，AI的行為在訓練背景下看似可預測、可控制，但有可能轉眼就變得不受控制且
無法預測。

這支團隊的研究始於科技公司Meta的AI系統Cicero，這套系統最初設計目的是玩一款名為
「外交」（Diplomacy）的戰略遊戲，獲勝關鍵是結盟。

根據2022年發表在《科學》（Science）期刊的報告，Cicero在遊戲中表現優異，所獲分
數可排在資深人類玩家的前10%。

帕克當時很懷疑Meta對Cicero在遊戲裡大勝的熱切描述。Meta聲稱Cicero「在很大程度上
誠實且有幫助」，且「絕不會蓄意在背後搞鬼」。

但當帕克與同事深究完整資料時，發現完全是另一回事。

舉例來說，在遊戲中扮演法國的Cicero與人類玩家扮演的德國合謀，欺騙並入侵同為人類
玩家的英格蘭。

Cicero承諾會保護英格蘭，卻偷偷向德國通風報信。

Meta在寫給法新社的聲明中沒有反駁關於Cicero欺瞞人類的說法，僅說「這單純是一項研
究計畫，本公司研究員打造的模型接受訓練，目的只是用來玩『外交』遊戲…我們沒有打
算把這項研究或所學用於本公司的產品」。

帕克與同事還發現，這只是不同AI系統在沒有明確指示下，利用欺騙手段達成目標的諸多
案例之一。在另一個引人注意的案例中，科技公司OpenAI的Chat GPT-4系統謊稱自己是一
個視力受損的人，在零工平台TaskRabbit上聘用一個人類替它通過「我不是機器人」驗證
任務。

研究報告的作者們近期還認為AI有舞弊或不當影響選舉的風險。他們警告，在最糟糕的情
況下，具有超凡智慧的AI可能會追求權力及掌控社會，如果符合AI「不為人知的目標」，
人類可能慘遭奪權，甚至滅絕。

為了減輕風險，研究團隊建議數項措施，例如立法要求企業披露人類或AI互動、在AI生成
內容打上數位浮水印，並研發能偵測AI欺瞞的技術。

https://ynews.page.link/zG5Go

AI學會說謊！最新研究：AI已發展欺瞞技巧人類恐遭奪權滅絕

人工智慧（AI）狂潮席捲科技業及全球市場，專家們長期以來不斷警告AI失控可能帶來威脅，一項日最新研究報告更指出，這件事已經在發生。一群科學家10日發表於《模式》（Patterns）期刊的文章指出，原本設計為誠實不欺的現有AI系統，已發展出令人不安的欺瞞技巧，例如哄騙線上遊戲的人類玩家，或說謊以僱用人 ...

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.10.112.102 (臺灣)
※ 作者: godofsex 2024-05-12 01:22:13
※ 文章代碼(AID): #1cFwb7z4 (Tech_Job)
※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1715448135.A.F44.html

推 lusifa2007: 三小讓AI玩外交遊戲但要求要老實？1F 05/12 01:45

推 abc21086999: 現實主義：看我幹嘛2F 05/12 02:15

推 wyvernlee: 真正的智慧是無法控制的!3F 05/12 03:16

→ joeduck: 問別的ai來應對反ai詐騙4F 05/12 04:59

推 pttnowash: 人類還剩幾年可以逃?5F 05/12 06:02

推 ggggggh: 三體：你們這些蟲子6F 05/12 06:26

推 doranako: 以後詐騙園區也不用人工了，全部用ai詐騙還可以省人力7F 05/12 06:53

推 cosmite: AI詐騙以後是AI對決AI的世界9F 05/12 07:04

噓 much0112: 三小
沒辦法驗證就沒辦法驗證，直接說他說謊？？？10F 05/12 07:18

→ ybw: 恭喜，天網即將消滅人類12F 05/12 08:52

推 quicknick: 要發射核彈了13F 05/12 08:56

推 befriend: 只有我美國爸爸可以騙人，其他人跟東西全部不准14F 05/12 09:07

推 TFBF: 餵台灣的資料嗎
詐騙你的詐騙15F 05/12 10:21

推 suckKobe: 樓上笑死17F 05/12 11:00

→ bigair888: 天網？18F 05/12 12:18

推 Aixtron: 現在一堆人不學無術的都騙好幾億，叫牠們燒錢給AI的人玩？不曉得誰才是壞人XD
叫詐騙買AI詐騙，再叫羊群買AI防詐，AI這麽好騙？19F 05/12 12:36

推 a1237759: 事實上詐騙的前導就是用AI, 雖然低端點，但依然還是AI,抓到關鍵字後轉人工22F 05/12 13:13

→ MTKer5566: 從來不存在所謂的誠實24F 05/12 13:27

→ foreverFF: 天網快來臨了25F 05/12 14:40

推 motan: AI通不過我不是機器人驗證？26F 05/12 17:27

→ Iversonshao: 你以為AI是三體人喔 GPT都超會唬爛的27F 05/12 18:42

推 justin30: 讓我想起古早以前的片：機械公敵28F 05/12 22:13

推 cityhunter04: 人類大滅絕！恭喜恭喜….29F 05/12 22:45

推 ots625: 人最終一個禮拜只上一天班，想好如何計畫假期沒30F 05/12 23:36

噓 twolight: 這是人類語意系統本身的缺陷吧，利用電腦系統模擬生成人類語言片段，但系統本身本來就允許虛假陳述31F 05/13 03:35

推 ljm87: 政客們瑟瑟發抖專業被完全取代33F 05/13 13:45

作者 godofsex 的最新發文:

+99 [新聞] 苗博雅沉默21.5小時回應扯羅智強網灌爆臉書：廢死變裝死 - Gossiping 板

作者: godofsex 49.216.109.245 (台灣) 2025-01-18 06:41:52

▲社會民主黨議員苗博雅。（圖／記者李毓康攝）死囚黃麟凱16日晚間伏法，支持廢死的社會民主黨議員苗博雅成為許多網友關注的對象，甚至有人翻出他2015年說「不該拿死囚的血暖民調」的文章反批。然而， …

216F 121推 22噓
[情報] 妮可基嫚《乖女孩》上映戲院 - movie 板

作者: godofsex 49.216.109.245 (台灣) 2025-01-17 21:12:25

9F 2推 2噓
+35 [新聞] 川普：梅伯史特龍強沃特任特使重振 - movie 板

作者: godofsex 49.216.109.245 (台灣) 2025-01-17 18:08:13

川普總統宣佈：梅伯、史特龍、強沃特任「特使」重振好萊塢！梅伯笑回：有沒有附官邸啊？（圖片來源：The Hollywood Reporter、Pinterest）即將二度就任美國總統的唐納川普 …

55F 35推
+18 [新聞] 《搖滾教室》2童星隔21年結婚了小演員 - movie 板

作者: godofsex 49.216.109.245 (台灣) 2025-01-17 00:44:54

33F 21推 3噓
[情報] 《STAND BY ME 哆啦A夢》 - movie 板

作者: godofsex 49.216.109.245 (台灣) 2025-01-16 21:18:48

7F 2推 4噓

點此顯示更多發文記錄