[新聞] 史丹福大學AI團隊抄襲中國大模型 - Tech_Job板

作者 KotoriCute (乙醯胺酚)
標題 [新聞] 史丹福大學AI團隊抄襲中國大模型
時間 Tue Jun 4 16:45:50 2024

史丹福大學AI團隊抄襲中國大模型曝光後全網刪庫終道歉收場

https://bit.ly/4c6lYd0

網傳史丹佛大學AI團隊抄襲、「套殼」中國國産大模型成果，引起業界高度關注和熱議。目前，涉事的史丹佛學生已公開正式道歉。史丹福大學的一個研究團隊在5月29日發布Llama3-V項目，宣稱僅需500美元就 ...

網傳史丹佛大學AI團隊抄襲、「套殼」中國國産大模型成果，引起業界高度關注和熱議。目
前，涉事的史丹佛學生已公開正式道歉。

史丹福大學的一個研究團隊在5月29日發布Llama3-V項目，宣稱僅需500美元就能訓練出一個
SOTA（State of the Art，即最先進的）多模態大模型，效果比肩GPT-4V、Gemini Ultra、
Claude Opus等，但模型小100倍。

公開信息顯示，Llama3-V團隊的其中兩位作者 Siddharth Sharma 與 Aksh Garg 是史丹福
大學計算機系的本科生，曾發表過數篇機器學習相關的論文。

名校背景，特斯拉、SpaceX等大廠經歷的成員，再加上號稱足以「改變現狀」的研究成果，
Llama3-V受到了相當程度的關注。Llama3-V不僅在社交媒體上迅速躥紅，還一度沖上了Hugg
ingFace趨勢榜（機器學習領域中較有影響力的平台，其趨勢榜一定程度反映出模型的流行
度）的首頁。

然而，沒過幾天，一位網民發現，Llama3-V的模型結構和代碼與出自清華系明星創業公司面
壁智能的MiniCPM-Llama3-V 2.5幾乎一模一樣，只是變量名有所變化。

網民在面壁智能GitHub的項目下放出了證據。這些證據包括：Llama3-V的模型架構和代碼與
MiniCPM-Llama3-V 2.5幾乎完全相同，僅有一些變量名和格式化的差异；Llama3-V使用了Mi
niCPM-Llama3-V 2.5的分詞器（tokenizer），並且連同MiniCPM-Llama3-V 2.5定義的特殊
符號也出現在了Llama3-V中；將從HuggingFace下載的Llama3-V模型權重中的變量名改成Min
iCPM-Llama3-V 2.5的，模型可以用MiniCPM-V代碼成功運行。

網民為什麽不直接質疑Llama3-V，而是在面壁智能GitHub的項目下進行爆料？事實上，網民

此前於6月2日在Llama3-V頁面上提出的質疑，不過很快便被Llama3-V的作者已經删除了。

為此，提出質疑的網民被激怒暴走，跑到了 MiniCPM-V 的 Github 頁面進行事件還原，提
醒面壁智能團隊關注此事。

在MiniCPM-Llama3-V 2.5團隊收到提醒後也迅速作出反應，於是一個新的證據出現。

面壁智能的MiniCPM-Llama3-V 2.5項目具有獨特的功能，如識別清華簡——一種罕見的中國
古代文字。

公開資料顯示，清華簡是清華大學於2008年7月收藏的一批戰國竹簡，為戰國中晚期文物。M
iniCPM-Llama3-V 2.5團隊透露，識別清華簡是MiniCPM-Llama3-V 2.5的一項實驗功能，訓
練圖像是最近從出土文物中掃描並由MiniCPM-Llama3-V 2.5團隊標注，且尚未公開發布。

Llama3-V模型居然也可以識別「清華簡」。兩個模型在識別的表現上，正確的結果上基本一

致，錯誤的情况也頗為相似。

鑒於這些結果，MiniCPM-Llama3-V 2.5團隊表示，很難用巧合來解釋這種不尋常的相似性，
希望Llama3-V的作者能够對這個問題給出官方解釋。相信這對開源社區的共同利益很重要。

當網民拋出三大事實質疑後，Llama3-V的做法是——不回應直接删除網民評論。

目前，Llama3-V 的 GitHub 項目主頁已顯示為「404」，HuggingFace上Llama3-V項目也已
經不可見，在作者社交媒體賬號上也找不到此前宣傳 Llama3-V 的內容。

6月3日，Llama3-V團隊成員Aksh Garg在社交媒體上發文回應了質疑。但隨後不久這條回應
便被删除。

Llama3-V在未公開的實驗性特徵上與MiniCPM-Llama3-V 2.5表現出高度相似的行為，這些特
徵是根據MiniCPM-Llama3-V 2.5團隊內部數據訓練的。

面對抄襲的質疑，史丹福團隊最初辯稱，他們的工作早於面壁智能的MiniCPM，只是使用了
他們的tokenizer。

另據媒體消息，面壁智能聯合創始人兼CEO李大海在朋友圈回應說「深表遺憾」，這也是一
種「受到國際團隊認可的方式」，並呼籲大家共建開放、合作、有信任的社區環境。

面壁智能首席科學家、清華大學長聘副教授劉知遠表示，人工智能的飛速發展離不開全球算
法、數據與模型的開源共享，讓人們始終可以站在SOTA的肩上持續前進。面壁開源的MiniCP
M-Llama3-V 2.5 就用了最新的Llama3作為語言模型基座。而開源共享的基石是對開源協議
的遵守，對其他貢獻者的信任，對前人成果的尊重和致敬，Llama3-V團隊無疑嚴重破壞了這
一點。他們在受到質疑後已在Huggingface删庫，該團隊三人中的兩位也只是史丹福大學本
科生，未來還有很長的路，如果知錯能改，善莫大焉。

北京面壁智能科技有限責任公司成立於2022年8月，今年4月，面壁智能完成新一輪數億元融
資，由華為哈勃領投，春華創投、北京市人工智能産業投資基金等跟投，知乎作為戰略股東
持續跟投支持。今年2月，面壁智能發布開源模型MiniCPM後，又推出MiniCPM 2系列端側模
型。李大海表示，推動大模型在端側的落地是面壁目前的重點工作之一。

據第一財經報道，在最新的進展中，史丹福Llama3-V團隊的兩位作者Siddharth Sharma和 A
ksh Garg在社交平台上就這一學術不端行為向面壁MiniCPM團隊正式道歉，並表示會將Llama
3-V模型悉數撤下。

另外，史丹福人工智能實驗室主任Christopher David Manning也發文譴責這一抄襲行為，
並對MiniCPM這一中國開源模型表示贊揚。

Manning寫道，「怎能不為自己的錯誤買單！清華大學自然語言處理實驗室做出了很棒的開
源工作，有力推動科學發展。」

Manning還痛斥道：「所謂『真正做到之前，假裝你做到了』是矽谷的無耻産物。」Manning
引用的這句流行語「Fake it before you make it」，一度盛行於矽谷的初創圈和科技公司
，被不少創業者奉為圭臬。

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.204.25.200 (臺灣)
※ 作者: KotoriCute 2024-06-04 16:45:50
※ 文章代碼(AID): #1cNjH040 (Tech_Job)
※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1717490752.A.100.html

※ 同主題文章:

[新聞] 史丹福大學AI團隊抄襲中國大模型

06-04 16:45 KotoriCute

Re: [新聞] 史丹福大學AI團隊抄襲中國大模型

06-05 21:03 soufon

※ 編輯: KotoriCute (123.204.25.200 臺灣), 06/04/2024 16:46:28

推 psychic: 反了?1F 06/04 16:48

推 WenliYang: 中國的AI實力很猛的2F 06/04 16:55

推 ab4daa: 可憐哪3F 06/04 17:02

推 jizzyui: 64不一樣4F 06/04 17:24

推 Ron51320: 幾十億人口隨便也能養出天才咩5F 06/04 17:28

推 lovebridget: 民主的抄襲能叫抄襲麼? 這什麼通敵賣國新聞6F 06/04 17:43

→ yunf: 真可恥耶念到史丹佛還這樣代表說美國的升學機制也要檢討這些學生祖宗18代都要拿出來檢討為什麼會有這種現象？台大作弊就算了畢竟在全世界排名還不到50 但史丹佛也作弊難怪現在世界上假貨那麼多詐騙那麼多！7F 06/04 17:44

※ Vanced:轉錄至看板 Gossiping 06/04 17:50

噓 hobnob: 26新聞公正度有待考察12F 06/04 17:54

推 EPIRB406: 中文大模型對岸還是比較強13F 06/04 18:00

→ DrTech: 史丹福大學的人都出來道歉了還有人說：公正度待考察。一定是假的。逢中必反啦14F 06/04 18:14

噓 justdoit: 他國事務16F 06/04 18:17

→ zonppp: 這新聞來源是？17F 06/04 18:27

推 u7451519: 未來會不會各種不同領域AI互相訓練來訓練去，搞個AI自動訓練鏈啊
也不需要人類了18F 06/04 18:29

→ RumiManiac: https://tinyurl.com/fs5yd4xf 作者的道歉聲明21F 06/04 18:35

推 motherlay: Stanford還要抄襲可憐哪22F 06/04 18:46

推 good5755: 作者是兩個在史丹福讀書的大學生？23F 06/04 18:47

推 owen5566: Github上都刪了，目前好像內鬥中24F 06/04 18:52

→ lingerptt: a nice wakeup call,台灣民代也是25F 06/04 18:53

→ owen5566: 目前推到的那個感覺像中東裔？穆斯塔之類的26F 06/04 18:55

推 Bugquan: 說是兩邊都是undergraduate的樣子，然後Stanford
那邊是兩個阿拉伯兩個印度人，所以才這麼雷27F 06/04 18:58

推 j0958322080: 在某些人眼中中國還在黑暗時代啊29F 06/04 19:06

推 owen5566: 原來如此XD30F 06/04 19:06

推 coffeedemon: 中國的大模型跟軟體應用進步其實超快31F 06/04 19:32

推 spirit119: 印度人阿不意外32F 06/04 19:42

推 Vanced: 需求多使用者多迭代很快的33F 06/04 19:47

推 pponywong: 新聞是真的 reddit有講到34F 06/04 19:59

→ LinuxKernel: 台灣根本看不到車尾燈…35F 06/04 20:04

推 Csongs: 中國的信用程度會讓人覺得反過來吧,除非史丹佛學生也是中國人
原來有程式碼比對36F 06/04 20:16

作者 KotoriCute 的最新發文:

+17 [新聞] 「室內裝修商」得標炸藥採購案？福麥公司5年前曾捲入借牌風波 - Gossiping 板

作者: KotoriCute 125.228.187.140 (台灣) 2025-12-11 11:51:43

32F 18推 1噓
+11 [新聞] 日歌手「挺一中」北京順利開唱日藝人恐被迫表態 - Gossiping 板

作者: KotoriCute 111.82.28.198 (台灣) 2025-12-07 18:25:34

43F 16推 5噓
+6 [新聞] 台積電洩密案檢方追加起訴東京威力科創、求處罰金1.2億 - Gossiping 板

作者: KotoriCute 61.224.173.236 (台灣) 2025-12-02 19:23:23

15F 6推
+4 [新聞] 韓國酷澎逾3000萬帳戶個資外洩疑中籍員工涉案 - Gossiping 板

作者: KotoriCute 61.224.178.163 (台灣) 2025-11-30 13:53:17

37F 6推 2噓
+27 [M.D.] MD解包出來的訊息 - YUGIOH 板

作者: KotoriCute 61.224.158.89 (台灣) 2025-11-25 12:48:13

48F 27推

點此顯示更多發文記錄