看板 Stock
作者 Latte7 (nonono)
標題 [請益] Deepseek v3 對台積電有影響嗎
時間 Sat Dec 28 19:08:23 2024


https://www.ettoday.net/amp/amp_news.php7?news_id=2882228&ref=mw&from=google.c
號稱匹敵GPT-4o 陸AI模型DeepSeek-V3訓練僅花558萬美元 | ETtoday大陸新聞 | ETtodayAMP
[圖]
中國大陸AI公司深度求索(DeepSeek)26日發表了全新大型開源AI模型「DeepSeek-V3」。據其官方的數據,DeepSeek-V3在性能上已可匹敵世界頂尖的閉源模型 GPT-4o 以及 Claude-3.5-Sonnet。 ...

 
om

中國展示了他們的新模型
重點在它極低的成本

好奇這樣是不是代表科技巨頭們不需要這麼多晶片?

會對台積電的晶片需求有影響嗎

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.137.70.92 (臺灣)
※ 作者: Latte7 2024-12-28 19:08:23
※ 文章代碼(AID): #1dRzmfo7 (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1735384105.A.C87.html
※ 同主題文章:
[請益] Deepseek v3 對台積電有影響嗎
12-28 19:08 Latte7
SabreN: 所以微軟、谷歌、Meta、亞馬遜、馬斯克,他們都是傻瓜,中國這間最聰明,是這樣嗎?
建議你放空美股七巨頭和台積電,一定賺大錢的1F 12/28 19:10
jerrychuang: 樓上這想法很危險4F 12/28 19:11
kkes0001: 26的AI是真有點東西,這個看論文可以知道,但也僅就這樣5F 12/28 19:13
[圖]
cccict: 可以畫出屠殺最多中國人的人嗎?8F 12/28 19:15
Heedictator: 泡沫9F 12/28 19:16
kkes0001: 吹和gpt 4o一個等級是他們論文的數據,寫過論文的都知道這邊論文肯定是挑最好的擺,實際如何還得實際驗證,到時候chatbot arena 或者hugging face 看看?10F 12/28 19:17
aegis43210: 表示兩國AI競爭更激進,是利多14F 12/28 19:18
noahlin: 是不是剛聽完股癌XD15F 12/28 19:18
keel90135: 抖音的世界線核融合能電池都已經誕生了16F 12/28 19:21
gladopo: 那這種再靠gb200跑不就爽到飛天17F 12/28 19:25
hellophoenix: 等其他人複現出來再說吧 都忘記超導的論文了嗎18F 12/28 19:28
matthewcheng: 那張圖?19F 12/28 19:31
Lowpapa: AI已死20F 12/28 19:35
payneblue: 能實際運用再說…21F 12/28 19:37
nfsong: 要跑很久
參數也比較少22F 12/28 19:43
leo6315: 對岸的碼農工作時數應該抵美國五個24F 12/28 19:54
easyman: 對,用 55nm 就跑得動,all in 力積電25F 12/28 19:56
jhnny: 短期內不會有什麼影響...26F 12/28 19:57
chih5120: 你是不是聽了今天的股癌27F 12/28 19:57
Homeparty: 對普通人夠用了,scalling law比較重要28F 12/28 20:02
nfsong: 很多人跳進去了  還有人在質疑ai29F 12/28 20:04
aegis43210: 西台灣因為算力不足,所以才需要模型剪枝,美國能用百萬顆GPU去硬幹,就不需要省成本
西台灣是在為愈來愈難取得老黃的GPU做準備30F 12/28 20:05
nfsong: 我記得 去年有人說  訓練大部分時間都在搬運
所以時間差不了太多
甚至有人開始考慮分散式訓練
也才導致 後來出現HBM 記憶體 降低搬運
重點是對岸每年有1200萬畢業的大學生  出來肝
其他國家沒有
對岸鮮肉多  還內卷....33F 12/28 20:08
homeworkboy: 搞不好可以用手連線出ai40F 12/28 20:14
shaun851025: 介殼在馬來西亞就可以買到GB200了41F 12/28 20:16
bnn: 剪枝本身可能會加入人為bias 但不好說這模型變好壞42F 12/28 20:18
cchh179: 這個deepseek 對政治有特定立場 可以去試試看 嘻嘻基本上是把黑的說成白的43F 12/28 20:19
Lhmstu: 還不錯啊,就AI模型的戰爭
但是都要晶片倒是真的45F 12/28 20:32
Cliffx: 你是不是聽股癌講的47F 12/28 20:37
sdbb: 丸子,下週ai股一根48F 12/28 20:40
netsphere: inference time scale law49F 12/28 21:07
JoeyChen: 7樓圖是真的嗎50F 12/28 21:11
dani1992: 7樓是真的,但只代表訓練資料偷的,模型應該是真的51F 12/28 21:17
s56565566123: 股癌要獲利了結52F 12/28 21:29
yrhhimamr: 其實是中國網站轉問GPT然後再改的53F 12/28 21:31
sova0809: 吹了半天 碼農跟中企還是乖乖架梯子想辦法弄GPT
用GPT 出錯了可以怪GPT 用中國垃圾 出錯就準備被告54F 12/28 21:48
Latte7: 我怎麼想都覺得這東西撼動不了hyperscaler ,
看推文去聽股癌,感覺他講的沒什麼根據,歐美會拿中國的東西challenge 自己嗎… 他們應該覺得這超low 吧..56F 12/28 22:17
lusifa2007: 這個如果用先進製程會更猛 對面是沒先進製程只好這樣玩60F 12/28 22:35
WD640G: 擔心這個不如擔心日本搞出2奈米62F 12/28 22:38
cute15825: 他們不用考慮智慧財產權的話 訓練出來是真低猛63F 12/28 22:43
s910612: 阿就股癌想出貨了啊64F 12/28 23:05
nfsong: 都開源的  因為知道其他人訓練不了
xAI 開源當天  一堆人下載後發現要8張H100 就砍了xAI Grok-1 model size 310B , deepseek 670B
看起來模型參數不小65F 12/28 23:07
ohsexygirl: 上面講出貨的….出貨要吹好的,不是吹壞的…69F 12/28 23:18
nfsong: 股癌 蠻有道理的阿  有人拿既有的模型優化
像是GPT 4o
或是最新的openAI o3
只要有人願意餵AI 中文資料  應該都樂見
把四庫全書 龍藏經  一堆古文全部餵進去
反正對岸  破壞價格也不是一天兩天
手機 面板 記憶體 電動車  只要內卷後都爛大街
不過 openAI 看起來更重視 AGI指數
不用知道太多  但是要符合人性70F 12/28 23:21
energyy1104: 誰出貨是放利空== 有夠韭79F 12/28 23:33
nfsong: 通用AI 以後應該會偏向AGI 困難的都不回答
都會叫你去問專業的
然後就要收錢了
資料中心蓋了也不是只訓練 通用模型
專業模型才是有錢賺  而且不開源
蛋白質 和 化學組成80F 12/28 23:44
cowking520: 整天妄想別人要出貨 真可悲86F 12/28 23:53
FreedomTrail: 看他的商業模式跟如何獲利,再看模型優劣是否為致命因素。87F 12/28 23:58
jimmy12332: 現在在搞知識蒸餾 之後語言模型一定會變小89F 12/29 00:05
chang1248w: 這隻用moe才這麼省90F 12/29 00:43
gnckt: 講出貨的是87是不是?哪個主力會想要在自己出貨前股價先崩啊,傻逼是不是啊91F 12/29 01:39
gn02620938: 看到推文就可以安心放空了 一堆8793F 12/29 09:36
clecer: GPU即將泡沫了94F 12/29 10:04
s910612: 穩了 一堆沒聽仔cc95F 12/29 10:52
aria0520: GG幾年前就有在招AI人才了 我也被邀去面過
不過聽完覺得GG還沒準備在AI上下重本 或許這幾年又有變化96F 12/29 12:33
eriker: 對岸ai論文多就是敢說謊跟造假99F 12/29 12:57
Mograine: 推文真的蠻好笑的 台灣啥屁都沒有 還有臉說別人XD100F 12/29 13:57

--
作者 Latte7 的最新發文:
點此顯示更多發文記錄