※ 本文轉寄自 ptt.cc 更新時間: 2024-12-24 21:51:42
看板 Stock
作者 標題 [情報] MI300X vs H100 vs H200測試&分析 - semi
時間 Tue Dec 24 10:05:04 2024
標題:
MI300X vs H100 vs H200 Benchmark Part 1: Training – CUDA Moat Still Alive
網址:
https://reurl.cc/oVyd9v
MI300X vs H100 vs H200 Benchmark Part 1: Training – CUDA Moat Still Alive – SemiAnalysis
Intro SemiAnalysis has been on a five-month long quest to settle the reality of MI300X. In theory, the MI300X should be at a huge advantage over Nvidi ...
Intro SemiAnalysis has been on a five-month long quest to settle the reality of MI300X. In theory, the MI300X should be at a huge advantage over Nvidi ...
內文:
此篇為semianalysis 測試5個月比較
MI300X H100 H200實際使用的效能以及使用上的現況
下面放上作者的發現總結,詳細請看文章
1. 在紙上比較 FLOP/s 和 HBM 頻寬/容量類似於僅透過檢查百萬像素數來比較相機。判斷?
2. Nvidia 的開箱即用效能和體驗令人驚嘆,我們在基準測試期間沒有遇到任何 Nvidia 特
3. AMD 的開箱即用體驗非常難以使用,需要相當大的耐心和努力才能達到可用狀態。 在我們的大多數基準測試中,AMD PyTorch 的公共 AMD 穩定版本仍然存在問題,我們需要解決方法。
4 如果沒有多個 AMD 工程師團隊對我們遇到的 AMD 軟體錯誤進行分類和修復的支持,AMD 的結果將遠低於 Nvidia。
5 . 我們與 Sustainable Metal Cloud 合作在 256 H100 上運行非官方 MLPerf Training GPT-3 175B,以測試不同 VBoost 設定的效果
6. 對於 AMD 來說,公開穩定發布的軟體的真實世界性能與其紙面銷售的 TFLOP/s 相差甚遠。 Nvidia 的現實世界表現也低於其行銷 TFLOP/s,但相差不大。
7. 與 H100/H200 相比,MI300X 的總擁有成本 (TCO) 較低,但在 AMD 軟體的公共穩定版本上,MI300X 的每 TCO 訓練效能較差。如果使用 AMD 軟體的客製化開發版本,情況就會改變。
8. 訓練效能較弱,MI300X的矩陣乘法微基準測試表明,AMD公開發布的軟體在單節點訓練吞吐量上仍落後於Nvidia的H100和H200。
9. MI300X 的效能受到 AMD 軟體的阻礙。 BF16開發分支上的AMD MI300X軟體具有更好的效能 ,但尚未合併到AMD內部儲存庫的主要分支中。當它合併到主分支和 PyTorch 穩定版本時,Nvidia Blackwell 將已經可供所有人使用。
10. AMD 的訓練表現也受到阻礙,因為 MI300X 無法提供強大的橫向擴展效能。這是由於與Nvidia 對其Nvidia 集體通訊庫(NCCL)、InfiniBand/Spectrum-X 網路結構和交換器的強大整合相比,其ROCm 計算通訊庫(RCCL) 較弱,且AMD 與網路和交換硬體的垂直集成程度較低。
11. 許多 AMD AI 庫都是 NVIDIA AI 庫的分支,導致結果不佳和相容性問題。
12. AMD 客戶傾向於僅使用手動製作的核心進行推理,這意味著它們在非常狹窄的明確定義的用例之外的效能很差,並且不存在快速轉移工作負載的靈活性。
-----
Sent from JPTT on my Google Pixel 7 Pro.
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.12.147.134 (臺灣)
※ 作者: baddaddy 2024-12-24 10:05:04
※ 文章代碼(AID): #1dQXRI5B (Stock)
※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1735005906.A.14B.html
→ : 連H100都打不贏,好慘ㄛ1F 12/24 10:11
推 : 卒業2F 12/24 10:12
推 : NV底層蹲了10年 其他人要幾年內追上也不容易3F 12/24 10:12
推 : 所以obov 早就把AMD 蛋雕4F 12/24 10:13
推 : AMD是不是要在沙崙建研發中心? 難怪卒業預定5F 12/24 10:13
噓 : 難怪教主跳車了6F 12/24 10:13
推 : H100都已經過時產品還...7F 12/24 10:13
→ : 難怪aws 裡面的人說沒人要用AMD GPU是真的8F 12/24 10:14
推 : 簡單來說 AMD卒業9F 12/24 10:14
→ : AMD今年還是負報酬10F 12/24 10:15
推 : AMD就垃圾沒人要阿,整年還是跌的不是沒原因11F 12/24 10:16
→ : amd軟體太差了,沒想到遊戲顯卡的nv driver值5000也12F 12/24 10:16
→ : 能套在AI上
→ : 能套在AI上
噓 : 教主殞落14F 12/24 10:17
※ 編輯: baddaddy (101.12.147.134 臺灣), 12/24/2024 10:18:00→ : GPU和AI沒一個能打15F 12/24 10:18
→ : 一個是已經有長遠計畫 一個只是模仿追尾 是要怎麼比16F 12/24 10:19
推 : 難怪AMD跌這麼慘...AI上面被海放!17F 12/24 10:19
推 : 真 遙遙領先18F 12/24 10:22
推 : NV軟體值5000!驅動就看的出來了XD19F 12/24 10:25
推 : Obov應該年初或Q1就把AMD 倒給小兒了20F 12/24 10:25
噓 : 這是什麼AI轉錄之後自動翻譯的文章嗎?23F 12/24 10:27
→ : 品質很差
→ : 品質很差
→ : Obov仍大賺,只漏掉tsla25F 12/24 10:27
推 : AMD還是乖乖做PC CPU X3D和遊戲機SOC就好CC26F 12/24 10:28
推 : 驅動值五千QQ27F 12/24 10:28
推 : 陳先生你的科技水平太落後了28F 12/24 10:28
噓 : AMD電子垃圾 生產出來浪費電的29F 12/24 10:31
推 : 這驅動現在大概值500b30F 12/24 10:38
推 : nv顯卡的驅動價格已經是過去式了XD31F 12/24 10:38
→ : AMD看起來路還很長遠,看來都反映在股價上了
→ : AMD看起來路還很長遠,看來都反映在股價上了
推 : 卒業33F 12/24 10:41
推 : 還好amd賣在190 嘻嘻34F 12/24 10:42
推 : 有第一買為什麼要買第二 NV 台G 無限資金買就對了35F 12/24 10:42
推 : 難怪AMD瘋狂烙賽36F 12/24 10:43
推 : cuda豈是說繞就繞得過去的技術37F 12/24 10:45
推 : 不意外阿 ppt吹得多屌 實際就多烙賽38F 12/24 10:49
→ : 跟h100比報價有差?而且差滿多的?39F 12/24 10:49
推 : AMD的cpu不是一堆人在搶?40F 12/24 10:49
→ : amd還是回去顧好cpu就好吧 市佔都還沒贏過intel41F 12/24 10:49
→ : 星空大師終究還是趕來戰場惹42F 12/24 10:50
→ : 就想開這麼多條線 還打成這個樣子 花一堆錢在AI上43F 12/24 10:50
→ : 結果出這什麼垃圾
→ : 結果出這什麼垃圾
推 : 目前AMD強的是CPU 誰在吹AI跟GPU? 竹竿裝菜刀45F 12/24 10:52
推 : 不要最後把大半的錢砸在AI上 結果CPU也被打趴46F 12/24 10:52
→ : 畢竟CPU那邊也沒有說領先多少 一代可能被追上
→ : 畢竟CPU那邊也沒有說領先多少 一代可能被追上
→ : AMD的AI跟GPU 只是希望就算落後 也不要差太多而已48F 12/24 10:54
推 : 星空大在幫呆兒自介歐49F 12/24 10:55
推 : NVDL繼續抱!50F 12/24 10:56
→ : 牙膏給GG代工 CUP很快就可以超越AMD了拉51F 12/24 10:58
推 : 對呀 這代intel桌機也才第一代用台積電製程52F 12/24 11:00
→ : 當初AMD剛跟台積電合作時也一堆問題 下一代不就
→ : 爆發
→ : 當初AMD剛跟台積電合作時也一堆問題 下一代不就
→ : 爆發
噓 : 連h100都打不贏快島一島55F 12/24 11:02
→ : 而且intel這一代架構還是用舊的 就MTL的改進版56F 12/24 11:03
推 : 驅動值5000梗又能用了嗎57F 12/24 11:03
推 : 主要是架構問題,CDNA3不太適合AI運算,等MI350才能58F 12/24 11:03
→ : 下一代完全新架構 amd只要不跟著大改進就會被打趴59F 12/24 11:03
→ : 改善60F 12/24 11:03
→ : 產能拿來做9800X3D比較實在啦61F 12/24 11:03
→ : 而且到時intel還有自家18A製程 選擇更為彈性62F 12/24 11:04
推 : 連CP值都輸 可悲啊 現在各家ASIC都搞起來了63F 12/24 11:05
→ : AMD還能搶得到什麼??
→ : AMD還能搶得到什麼??
推 : 好險沒接AMD65F 12/24 11:08
推 : 難怪AMD崩崩66F 12/24 11:13
→ : amd就每個市場都想分一杯羹阿 硬湊進來被打爛67F 12/24 11:18
→ : 真不知砸一堆錢搞這幹嘛
→ : 真不知砸一堆錢搞這幹嘛
→ : 99AMD 卒業預定69F 12/24 11:30
推 : 教主已經轉倉*黃BG*了,已經逍遙去卒業寫生了70F 12/24 11:33
推 : 難怪a90灰心到連Ptt都不上了71F 12/24 11:36
→ : 卒72F 12/24 11:38
→ : a90已經去退休環遊世界惹八,身家都十位數惹,連蘋73F 12/24 11:46
→ : 果工作都辭惹
→ : 果工作都辭惹
推 : 簡單總結 NV屌虐75F 12/24 11:53
推 : 99amd76F 12/24 11:55
推 : MI300很差是早已知了 看MI450有無機會分食Nvidia77F 12/24 12:12
推 : amd又不能跑ai模型 買來裝飾的喔78F 12/24 12:15
→ : 這時間a90大概放假回台灣啦 回台灣的時候幾乎都不79F 12/24 12:52
→ : 上線的
→ : 上線的
推 : amd未來價值不在gpu上81F 12/24 13:49
→ : 可是上個被A90說卒業預定的公司.......82F 12/24 18:29
--
※ 看板: Stock 文章推薦值: 0 目前人氣: 0 累積人氣: 76
作者 baddaddy 的最新發文:
- 38F 16推 7噓
- 標題: MI300X vs H100 vs H200 Benchmark Part 1: Training – CUDA Moat Still Alive 網址: 內文: 此篇為semianalys …82F 40推 5噓
- 美國總統拜登23日宣布,對中國大陸製造的成熟製程半導體發動「301調查」,將留給下任總統川普選擇是否對這些晶片課徵更高的關稅。 傳統晶片的效率雖遠遠不如人工智慧(AI)所需的尖端晶片,但廣泛用於汽車 …54F 25推 3噓
- 28F 14推 2噓
- (中央社東京22日綜合外電報導)日經亞洲(Nikkei Asia)引述消息人士報導,日本公平交易委員會預料將會判定谷歌(Google)違反該國的反托拉斯法規。 據報導,日本公平交易委員會(Japan …95F 51推 2噓
點此顯示更多發文記錄
→
guest
回列表(←)
分享