顯示廣告
隱藏 ✕
※ 本文轉寄自 ptt.cc 更新時間: 2024-08-08 23:39:03
看板 PC_Shopping
作者 SkyPlus (Sky)
標題 [情報] Zen5 AVX512 分析
時間 Thu Aug  8 09:39:45 2024


http://www.numberworld.org/blogs/2024_8_7_zen5_avx512_teardown/

雖然 Zen5 初期測試報告有點不盡人意
不過剛剛看到這篇文章大力讚揚 Zen5 AVX512 設計,
和 Zen4 AVX512 相比, Zen5 IPC成長幾乎快了 100%

這是因為 Zen4 用 4 x 256-bit 的通道組合出來

連 Intel 只有 server 等級的 Sapphire Rapids 才給的起 2 x 512-bit
但這次 zen5 桌面版大核就很大方的給了 4 x 512-bit
因此反映在效能上就直接爆漲了

另外 Intel 常被詬病 AVX512 需要先花一些時間(約50000 cycle)低速跑,
等電上去,CPU降速才能全速跑。但 Zen5 可能靠設計和製程完全解決這問題,
不需降速也不用等,下指令後幾乎立即全速運作。

此外 Intel 在 Tiger Lake 加了 AVX512-VP2INTERSECT 指令,
但速度超級慢 (25 cycle),大家都用別的指令去模擬還比較快,
因此 Intel 在往後的 CPU 也移除他。
這次 Zen5 實作了這個指令,而且只花 1 cycle 就完成。

綜合這些分析,他認為Zen5可以說第一次讓大家看到完整版的 AVX-512。
反觀 Intel 設計了卻四處限制...

他還有提到 Cinebench, CPU-Z 都沒有很認真測試 AVX-512,
因此看不出Zen5在這方面的優勢。

不過有些 Zen4 可以在 1 cycle 做完的非 AVX-512 SIMD,
在 Zen5 反而不明原因退步到 2 cycle,
另外混合 AVX-256,512 指令的順序不對也會變慢

--

--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.113.235.116 (臺灣)
※ 作者: SkyPlus 2024-08-08 09:39:45
※ 文章代碼(AID): #1cj27ntw (PC_Shopping)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1723081201.A.DFA.html
smallreader: 重返榮耀!1F 223.139.184.93 台灣 08/08 09:42
ltytw: i粉正在嘗試關心 : 既然以前i被說avx5122F 114.33.46.227 台灣 08/08 09:45
ltytw: 超熱超耗電又要讓U降頻跑  那這次的zen5呢
Fortis931: i吹討厭4F 36.238.95.84 台灣 08/08 09:58
Fortis931: 這篇 並試著無視
orze04: 不知道Linus 大神如何看待…6F 114.136.57.150 台灣 08/08 10:01
johnson0319: 新一代RPCS3神器7F 104.28.232.15 台灣 08/08 10:05
mayolane: 之前用7950X的AVX-512挖礦的還在嗎8F 114.136.146.11 台灣 08/08 10:19
qwe753951: 超缺頻寬9F 211.20.26.1 台灣 08/08 10:33
qwe753951: X3D快來
seiya2000: AVX-512做什麼用?11F 39.10.8.235 台灣 08/08 10:36
Gwaewluin: 這個之前好像看到能挖礦的樣子12F 114.137.153.82 台灣 08/08 10:44
arnold3: 遊戲好像用不到?13F 119.14.100.51 台灣 08/08 10:46
arrenwu: AVX2應用比較廣泛 AVX512不知道那些軟體14F 98.45.195.96 美國 08/08 10:47
arrenwu: 現在有在用
mayolane: So sorry to disappoint the RPCS3 com16F 114.136.146.11 台灣 08/08 10:47
mayolane: munity here. As much as they love AV
mayolane: X512, they primarily only use 128-bi
mayolane: t AVX512 - which does not significan
mayolane: tly benefit from Zen5's improvements
mayolane:  to the vector unit.
mayolane: RPCS3沒什麼用
DrGun: 8要再反觀惹!收盤只剩18.99 天下苦皇久矣23F 1.163.252.225 台灣 08/08 10:53
DrGun: !!
chiahong1227: AVX-512 普通消費者用不到也是事實25F 140.114.85.131 台灣 08/08 11:12
leviva: 普通遊戲用不到,PS3模擬器有用到的樣子26F 27.52.41.115 台灣 08/08 11:14
qwe753951: 一般人用不到是事實27F 211.20.26.1 台灣 08/08 11:19
yankeefat: i皇今年已經跌掉60%了28F 123.204.11.71 台灣 08/08 11:28
kamichu: 等X3D應該猛猛的29F 111.82.252.188 台灣 08/08 11:45
amos30627: G叔吹18A股價18塊 等他吹14A的時候會剩30F 101.9.133.227 台灣 08/08 11:50
amos30627: 14塊
amos30627: 看他是製程吹的快還是股價跌的快
wantsu: PS2模擬器好像會用到33F 125.228.171.79 台灣 08/08 12:12
mayolane: PS3模擬器有用34F 114.136.146.11 台灣 08/08 12:17
Arbin: 那PS3模擬器應該會跑更快了吧xd35F 223.140.213.77 台灣 08/08 12:21
mayolane: PS3模擬器就上面說的RPCS3,看起來Zen536F 223.136.78.202 台灣 08/08 12:24
mayolane: 不會比較快
easyman: X3d加上avx512 ,跑llama小model,應該個38F 42.73.70.132 台灣 08/08 12:24
easyman: 人使用也不錯
tim108108: cpu跑大語言模型可以用avx512加速40F 42.73.75.255 台灣 08/08 12:27
Lansbury: 沒想到自己搞得專用指令 AMD才能好好發41F 49.217.128.171 台灣 08/08 12:36
Lansbury: 揮 可悲
wahaha99: 可是這超級耗電晶體耶 能照顧到的43F 118.169.27.203 台灣 08/08 12:43
wahaha99: 應用有限說...
ybite: 指令集的改善我覺得要等程式編譯執行時最佳45F 42.70.227.91 台灣 08/08 12:45
ybite: 化才能展現
wahaha99: 主要是應用太少 當年推出時幾乎沒什麼47F 118.169.27.203 台灣 08/08 12:48
wahaha99: 地方用的上 到現在有AI可以用上
wahaha99: 但GPU跟NPU他不香嗎... 為什麼要用CPU
mayolane: 但Zen5塞了AVX-512還沒有比Zen4核心大50F 140.112.55.67 台灣 08/08 12:53
mayolane: 顆
mayolane: 製程也沒用進步很多
ltytw: cpu還是比較通用53F 114.33.46.227 台灣 08/08 13:00
alvistan: 重點是這次看起來不佔空間54F 101.10.57.167 台灣 08/08 13:31
b325019: 原本以為塞avx512會很肥,結果塞了4路進55F 223.137.23.210 台灣 08/08 13:39
b325019: 去整體面積跟上代差不多真猛
mtc5566: 我猜AMD先上 過幾年Intel又會出來AXV51W57F 118.231.208.21 台灣 08/08 13:46
mtc5566: 無用論
kaj1983: 台積電就是猛59F 36.238.142.66 台灣 08/08 13:48
SHR4587: 伺服器資料中心那邊avx512有甚麼用嗎?60F 111.241.132.33 台灣 08/08 14:12
SHR4587: 畢竟AMD EPYC跟Ryzen用的料幾乎是一樣的
EXTECH: RPCS3全順砲62F 223.140.192.34 台灣 08/08 14:14
ltytw: 我很像有看過11代要跨12代那時候63F 114.33.46.227 台灣 08/08 14:21
ltytw: 不知道哪個I吹說512沒用了
aegis43210: 轉檔很有用65F 223.140.155.246 台灣 08/08 14:39
as920909: NPU跟GPU不就是為了算浮點數的嗎66F 218.172.69.212 台灣 08/08 14:42
jhjhs33504: 跑大語言模型的回答比較不會出現幻覺67F 36.228.20.172 台灣 08/08 14:50
tonyian: 到底誰在用avx512?有這需求的不是都拿GP68F 39.9.231.251 台灣 08/08 15:54
tonyian: U或是TPU加速了?
b325019: 你問那些雲端吧,蘇媽會放這個東西進來大70F 223.137.23.210 台灣 08/08 16:02
b325019: 概是按DC客戶的回饋加的
aegis43210: i皇的server都有AVX512呀,蘇嬤在DT端72F 175.181.175.150 台灣 08/08 16:21
aegis43210: 這樣純粹是debug加上佛心來著沒閹割
enonrick: intel 市場行銷的東西先做出來再說,只74F 111.241.167.51 台灣 08/08 17:02
enonrick: 是要降頻降溫,code 都要重寫, port難
enonrick: 度高 伺服器端用在加密/hash 加速 ,一
enonrick: 般使用者不需要靠 gpu 做inference ,
enonrick: 多媒體之類的何不用gpu 就好, 猜是想要
enonrick: 吹上面的 NVVI 吧,有實驗宣稱比 gpu
enonrick: 快好幾倍,總之~~讓子彈飛一會~
enonrick: 啊對了 zluda 被 amd 正式發公文下架了
friedpig: 兩邊DT都馬是Server的白老鼠 需求都是82F 118.163.149.125 台灣 08/08 17:28
friedpig: Server來的 只是牙膏DT大小核稿到AVX512
friedpig: 不好Debug關掉而已
friedpig: AMD不知道是比較保守還是客戶壓力沒那麼
friedpig: 大 可以比較晚等AVX512成熟一點在實作優
friedpig: 秀的硬體 牙膏就比較早硬上慢慢優化
friedpig: 牙膏最新的E核看起來還是沒AVX512 DT應
friedpig: 該87%又是閹割掉了
yymeow: 建議i社把那些面積拿去做L3還比較實際一點90F 60.250.130.216 台灣 08/08 17:40
yymeow: 整天搞一些有的沒有的
friedpig: 做硬體的別想太多 食物鏈的下游 很多92F 118.163.149.125 台灣 08/08 17:45
friedpig: 時候你以為是牙膏想做 客戶說了算
friedpig: 不過我到蠻想看牙膏現在高階封裝也是有
friedpig: 再碰 能乖乖拉下臉弄個X3D來看看嗎
yymeow: i社現在NEX事業群倒是出了一些怪機絲96F 60.250.130.216 台灣 08/08 18:07
yymeow: 比如說1851腳位的[真。14代]
leung3740250: MSDT改用NINE L3第4年了還在堆L3,98F 119.237.179.153 香港 08/08 18:09
leung3740250: 能不能先查一下牙膏L3到底是怎麼運
leung3740250: 作的?
yymeow: core ultra 7 165HL之類的101F 60.250.130.216 台灣 08/08 18:09
yymeow: 還有什麼i7-14701e的怪東東
birdy590: 我覺得Linus的看法是對的 桌面/一般用途103F 119.14.42.10 台灣 08/08 21:11
birdy590: 根本用不上 佔用的空間可以有更好的利用
birdy590: 伺服器之類特殊用途如果需要可以另外出
mayolane: 另外出怎麼玩蘇媽最愛的膠水大法106F 1.161.79.156 台灣 08/08 21:32
kamichu: 這次avx512進步那麼多107F 111.82.129.169 台灣 08/08 23:06
kamichu: zen5這次可能真的卡在那顆舊的iod

--
※ 看板: PC_Shopping 文章推薦值: 0 目前人氣: 0 累積人氣: 88 
作者 SkyPlus 的最新發文:
點此顯示更多發文記錄
分享網址: 複製 已複製
guest
x)推文 r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄 同主題: =)首篇 [)上篇 ])下篇