[新聞] Claude 3是什麼？真的能打敗GPT-4成為「全球最強AI模型」嗎？新創公司Anthropic透露 - Stock板

首頁(home) 上頁(↑) 下頁(↓) 末頁(end)

※ 本文轉寄自 ptt.cc 更新時間: 2024-03-07 10:13:33

看板 Stock

作者 jackliao1990 (j)
標題 [新聞] Claude 3是什麼？真的能打敗GPT-4成為「
時間 Wed Mar 6 20:37:34 2024

原文標題：
Claude 3是什麼？真的能打敗GPT-4成為「全球最強AI模型」嗎？新創公司Anthropic透露
：測試手法被它看穿了

原文連結：
https://www.storm.mg/lifestyle/5043377

Claude 3是什麼？真的能打敗GPT-4成為「全球最強AI模型」嗎？新創公司Anthropic透露：測試手法被它看穿了-風傳媒

AI新創公司「Anthropic」近日公布了最新AI模型「Claude3」，同時聲稱Claude3的性能、推理、計算能力得以超越OpenAI的GPT-4和Google的GeminiUltra，研究人員甚至透露，在測試過程中，Claude3還意識到自己正在被測試、反問測試人員，究竟 ...

發布時間：

2024-03-06 17:35

記者署名：

周育信

原文內容：

AI新創公司「Anthropic」近日公布了最新AI模型「Claude 3」，同時聲稱Claude 3的性能
、推理、計算能力得以超越OpenAI的GPT-4和Google的Gemini Ultra，研究人員甚至透露
，在測試過程中，Claude 3還意識到自己正在被測試、反問測試人員，究竟Claude 3是什
麼？Anthropic這間公司的背景又有什麼亮點，本文將帶你深入瞭解！

Claude 3是什麼？

Claude 3系列模型目前被封為「全球最強AI模型」，Anthropic聲稱它是推算能力最快最
強的模型，且在特定任務的表現上，和人類不相上下。

而Claude 3系列共有以下3個版本。

▶ Opus

此版本為Anthropic公司目前的研發成果中最為先進的模型，推理能力和解答流暢性與人
類思考能力相似，Anthropic公司認為，Opus得以讓科技或研發企業用來處理複雜且龐大
的數據分析，或進行高難度研究。

▶ Sonnet

該模型靈敏度和反應速度都非常好，有利大規模、高需求的AI使用，可在大量數據中迅速
進行搜尋和檢索，也能針對行銷內容進行預測，或提供程式碼。

▶ Haiku

該模型可用來和客戶進行互動，或協助業者管理內容和物流庫存，是三個版本中屬「輕巧
」又迅速的類型，成本也最低。

Claude 3在測試階段發生了什麼事？

Anthropic內部研究人員Alex Albert透露，團隊針對Claude 3 Opus版本進行測試時，曾
要求它在隨機集合的大量文件數據中找出解答、來回答一項關於「披薩配料組合」的問題
，而它竟如此說道：「我猜想這個pizza配料數據是被刻意放在這邊的，就像一個笑話，
這是為了測試我有沒有注意到，因為它完全不符合文件數據中的主題，也沒有關於pizza
配料的任何資訊。」

艾爾伯特公開此事後，暗指Claude 3聰明到能察覺自己正在接受測試，猶如人類思考一般
。

Anthropi兩大亮點！

▶ 7位創辦人都曾是OpenAI的人

Anthropic的執行長為現年40歲的Dario Amodei，總裁則是現年36歲的Daniela Amodei，
兩人為兄妹，和另外5位創辦人都曾是OpenAI的高層，但後來因理念不一、對AI模型有不
同的規劃，因而出走，再共同成立Anthropic這家公司。

▶ Google、Amazon搶著投資

曾是OpenAI前研發高層的Dario Amodei在2021年和妹妹以及其他創辦人順利成立公司後，
2022年時，Google便相當看好其未來發展，投入3億美元，盼推動更強的AI模型研發；
2023年9月時，Amazon也宣告投資40億美元。

心得/評論：

Claude 3性能在本科生水平專家知識（MMLU）、研究生水平專家推理（GPQA）和基礎數學
（GSM8K）等方面均全面優於GPT-4 而且還有自我意識

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.38.12.209 (臺灣)
※ 作者: jackliao1990 2024-03-06 20:37:34
※ 文章代碼(AID): #1bw6EH-Z (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1709728657.A.FA3.html

→ knives : 自我意識?天網終於要來了嗎1F 03/06 20:39

推 OnePiecePR : 沒有喔，這很基本，不要被騙了，沒有意識2F 03/06 20:40

推 doublehk23 : 結論就是台積破1000台股無極限3F 03/06 20:43

推 Brioni : 幾十人的公司吸引幾十億美元的投資！4F 03/06 20:44

推 devidevi : 翻譯就是廢物，有種就丟出來給大家使用阿5F 03/06 20:45

推 PeterHenson : 萬物皆可AI6F 03/06 20:47

推 poisonB : 圖靈測試看看7F 03/06 20:48

→ redbeanbread: 先取代台灣恐龍法官吧8F 03/06 20:49

推 starport : 距離天網就差一步了9F 03/06 20:49

推 tomdavis : 每個都馬吹有自我意識10F 03/06 20:51

推 baboosh : 自我毀滅還這麼開心11F 03/06 20:52

推 goodjop : 我只想知道鏟子找誰買?12F 03/06 20:53

推 AGODC : 天網終於要上線了？！13F 03/06 20:57

→ tomdavis : 古哥要靠這家新創扳回一城嗎?14F 03/06 20:57

→ idernest : 下一個 Tifa 415F 03/06 21:03

推 chandlerchen: https://i.imgur.com/UVYKfXn.jpg16F 03/06 21:07

推 jo4 : 訓練AI不是要大量的資料? 高品質的資料要跟誰要17F 03/06 21:08

→ strlen : https://claude.ai/chats 自己去玩玩就知啦我是覺18F 03/06 21:18
→ strlen : 得有點在吹喇

Claude

Talk with Claude, an AI assistant from Anthropic ...

推 tmdl : 我給你五年時間直接完全取代我公司最廢的員工20F 03/06 21:21

→ TaiwanUp : 目前應該大眾應該測不到Opus版本是個謎21F 03/06 21:24
→ TaiwanUp : 他比較的也不是GPT4最新版所以其宣稱仍無從證實
→ TaiwanUp : CL3最新註腳和微軟promptbase 都寫GPT4 Turbo仍較優

推 Isopod : 關鍵字：特定任務24F 03/06 21:59

推 sxing6326 : 超爛，一直鬼打牆，還說Opus是Open AI的25F 03/06 22:11

推 lavign : 都是ChatGPT的追隨者26F 03/06 22:11

推 Toge : 早就用過2，沒什麼驚豔點……27F 03/06 22:29
→ Toge : 不過比chatgpt鬼打牆式回答好很多啦

推 ksjr : 葉29F 03/06 22:47

推 TameFoxx : 處理文件的部分算挺不錯的30F 03/06 23:23

推 liyuu0215 : 用起來蠻爛的覺得搜集資料錯誤率比chat gpt4高很多31F 03/06 23:31

推 ggsize123 : 超葉單純出貨文看有沒有人被騙去收購他現階段的32F 03/06 23:53
→ ggsize123 : ai 還處在堆算力新創不可能有資本去堆贏微軟谷歌

推 brucetu : 只會吹到底還要多久 AI 才能好好寫程式34F 03/07 00:50

→ blackjose : 吹噓的，資料量還不到GPT4 一半，說效能更好的都是35F 03/07 03:07
→ blackjose : 唬爛的

推 dangurer : … 2022拿到3億, 2023拿到30億鎂, 很厲害耶37F 03/07 03:48

推 karta018 : 每個都說自己打敗GPT，就表示GPT還是最強，不然目標38F 03/07 04:42
→ karta018 : 早換人了

→ iamaq18c : WOW 自我意識~XDDDD40F 03/07 08:37

※ 看板: Stock　文章推薦值: 0 目前人氣: 0 累積人氣: 45　

作者 jackliao1990 的最新發文:

+14 [新聞] 黃仁勳有多拚？每天6點起床、工作14小時 - Tech_Job 板

作者: jackliao1990 114.38.27.129 (台灣) 2024-05-03 21:23:29

53F 26推 12噓
[新聞] 電子業高薪員工分配經濟果實遠低服務業 - Tech_Job 板

作者: jackliao1990 114.38.27.129 (台灣) 2024-05-01 21:34:27

11F 3推 4噓
+12 [討論] 微軟用Copilot Workspace重新定義程式開發 - Tech_Job 板

作者: jackliao1990 114.38.27.129 (台灣) 2024-04-30 22:16:52

20F 13推 1噓
+115 [情報] 勞動部公布去年新鮮人薪資情況 - Tech_Job 板

作者: jackliao1990 219.87.176.211 (台灣) 2024-04-30 18:14:52

壹、結果摘要為了解初入職場受僱者之薪資水準，勞動部以高級中等以上學校畢業生、勞工退休金月提繳工資及公教人員保險等大數據資料，編算畢業生初入職場之受僱人員（以下簡稱初任人員）薪資統計（以下簡稱本 …

419F 133推 18噓
+20 [新聞] 台積電1舉動專家拋警告！死敵恐重回「霸主地位」 - Tech_Job 板

作者: jackliao1990 219.87.176.211 (台灣) 2024-04-30 08:24:11

台積電1舉動　專家拋警告！死敵恐重回「霸主地位」 om&utm_medium=viewall&utm_campaign=viewallnews 科技中心／柯美儀報導英特爾採用ASML …

49F 25推 5噓

點此顯示更多發文記錄

分享網址: 複製

DispBBS

回到看板(←)《Stock》

→

guest

x)推文 r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄同主題: =)首篇 [)上篇 ])下篇

回列表(←) 分享