作者 stpiknow (H)標題 [新聞] 亞馬遜、Alphabet、Meta和微軟在AI晶片時間 Mon Apr 29 08:08:28 2024
亞馬遜、Alphabet、Meta和微軟在AI晶片的佈局,長期將帶給輝達麻煩
原文網址:
https://bit.ly/3UfIw3P
原文:
亞馬遜、Alphabet、Meta和微軟是AI雲端運算領域的四大參與者。他們也恰好是輝達GPU
的最大買家之一。可是這四家雲端巨頭的另一個共同點是他們都在製造自己的晶片,尋求
互補輝達無法滿足其AI客製化的供應。
其實,輝達的GPU非常昂貴,所以四家雲端供應商都希望並且需要控制不斷飆升的資本支
出預算。Meta、微軟、亞馬遜和Alphabet 在AI基礎設施上投入了大量資金。根據
FactSet估計,2024財年這四家的資本支出總計預計將達到1,780億美元,比2023年增加
26%以上。唯有透過設計自己的解決方案來實現,涵蓋軟體、硬體和晶片的大部分成本。
以亞馬遜為例,其於2015年透過收購以色列晶片設計公司Annapurna Labs進軍晶片業務。
這筆交易最後產生了三種晶片:一種名為Graviton的CPU,亞馬遜稱其性價比比同類x86晶
片高出40%;用於訓練LLM的Trainium;以及用於AI推理工作負載的Inferentia。
亞馬遜也投資OpenAI的敵手Anthropic。如今Anthropic用Trainium來訓練其AI模式。
Airbnb、位元組跳動、Snap和德國電信都是 Inferentia 的客戶。 亞馬遜使用自己的晶
片來運行 Alexa、亞馬遜廣告及其新的 Rufus 購物機器人。
Alphabet 旗下的谷歌近十年來一直在開發AI晶片,且創建完整系統的優勢,不僅是晶片
,還包括相關的軟體、網路基礎設施和儲存。谷歌將其晶片稱為TPU(Tensor Process
Unit)。谷歌正在開發第五代TPU,它有兩種類型,一種專注於效能,另一種則針對效率
。
谷歌使用TPU建立大型語言模型,包括其廣泛部署的Gemini軟體。它還依賴TPU來驅動
Google Mail和其他服務。 許多依賴Google TPU的新創公司包括製造個人化聊天機器人的
Character AI和提供文字到圖像軟體的Midjourney。
Meta則是推出了第二代AI晶片,稱為MTIA(Meta Training and Inference Accelerator
)。Facebook和Instagram都正在使用MTIA晶片來支援社群媒體排名和廣告模式。Meta表
示,MTIA 是一項長期事業,旨在為 Meta 獨特的工作負載提供最高效的架構。
至於微軟,其於2023年推出了Azure Maia 100 AI Accelerator,這是一款用於模型訓練
和推理的晶片。到目前為止,微軟僅限於內部工作負載的使用。未來微軟將重新構想從晶
片到伺服器到系統再到數據中心基礎設施的每一層,以最大限度地提高效能和效率。
總之,這四家廠商不太可能將其AI晶片販售給其他業者,並與輝達競爭。但是其生產的AI
晶片,仍會逐漸削弱輝達在AI晶片的佔有率,甚至未來的影響力。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 203.145.192.245 (臺灣)
※ 作者: stpiknow 2024-04-29 08:08:28
※ 文章代碼(AID): #1cBkJ_GQ (Tech_Job)
※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1714349311.A.41A.html
→ soliboy: 長期來說 這些公司都會倒3F 04/29 08:46
推 abbei: 長期來說 1+1=26F 04/29 09:04
推 rogergon: 就想像是系統廠自己設計軟硬體不走wintel
從歷史教訓看,很難玩得過老黃的業界標準
除非像linux+arm做出另一個標準7F 04/29 09:08
推 yytseng: 現在看winqual會不會成功囉10F 04/29 09:18
→ yytseng: 不過在大模型方面他們這幾家都還是買GB20012F 04/29 09:20
→ tsairay: 只要它們搶不到GG產能就沒用吧,三星和intel明顯
落後一段距離
蘋果就死抓著GG產能不放,幫自己未來AI晶片產能卡位13F 04/29 10:08
推 pponywong: 除非它們在AI佔有率可以到跟蘋果手機一樣
否則不見得便宜16F 04/29 12:25
→ tabrisPTT: 這幾間做出來的chip…效能應該慘到不行吧18F 04/29 12:28
推 agbr2: 自己做chip是趨勢,好不好是另一回事19F 04/29 13:00
→ btpeter: 剛開始 哪有這麼快趕上NV 目前最新的GPU B100/GB200/B200效能… 需要時間 NV也不是花了多少時間才到這樣目前位置….但AI solution 絕對不會是只有GPU為主流…..ASIC/FPGA/RISC-V 都還是未知數也還在進行中…. 任何的改變不是一蹴可及….20F 04/29 13:22
→ a27417332: 什麼業界標準,他們就是想當標準呀
雲三家打的算盤就是把AI服務拿來賣
只要把模型遷移到自家硬體上順順跑就好
只是順不順利就是另一件事了
補述一下,第一句前面說的是底層後面說的是AI服務28F 04/29 19:36
→ cathychg: 尼們忘了 還有雅虎噢。亞美利堅合眾合國33F 04/29 19:58
→ Alwen: 就當初手機晶片潮再走一次而已
三四年後一堆就說不玩惹34F 04/29 21:00
→ sachialanlus: 應該會做特質化的處理器 像是 TPU LPU 那種 不然 GPU 短時間內應該是沒辦法追上36F 04/30 02:45
→ btpeter: ASIC 自己做作業 ….38F 04/30 07:50
--