※ 本文轉寄自 ptt.cc 更新時間: 2024-08-08 23:39:03
看板 PC_Shopping
作者 標題 [情報] Zen5 AVX512 分析
時間 Thu Aug 8 09:39:45 2024
http://www.numberworld.org/blogs/2024_8_7_zen5_avx512_teardown/
雖然 Zen5 初期測試報告有點不盡人意
不過剛剛看到這篇文章大力讚揚 Zen5 AVX512 設計,
和 Zen4 AVX512 相比, Zen5 IPC成長幾乎快了 100%
這是因為 Zen4 用 4 x 256-bit 的通道組合出來
和 Zen4 AVX512 相比, Zen5 IPC成長幾乎快了 100%
這是因為 Zen4 用 4 x 256-bit 的通道組合出來
連 Intel 只有 server 等級的 Sapphire Rapids 才給的起 2 x 512-bit
但這次 zen5 桌面版大核就很大方的給了 4 x 512-bit
因此反映在效能上就直接爆漲了
另外 Intel 常被詬病 AVX512 需要先花一些時間(約50000 cycle)低速跑,
等電上去,CPU降速才能全速跑。但 Zen5 可能靠設計和製程完全解決這問題,
不需降速也不用等,下指令後幾乎立即全速運作。
此外 Intel 在 Tiger Lake 加了 AVX512-VP2INTERSECT 指令,
但速度超級慢 (25 cycle),大家都用別的指令去模擬還比較快,
因此 Intel 在往後的 CPU 也移除他。
這次 Zen5 實作了這個指令,而且只花 1 cycle 就完成。
綜合這些分析,他認為Zen5可以說第一次讓大家看到完整版的 AVX-512。
反觀 Intel 設計了卻四處限制...
他還有提到 Cinebench, CPU-Z 都沒有很認真測試 AVX-512,
因此看不出Zen5在這方面的優勢。
不過有些 Zen4 可以在 1 cycle 做完的非 AVX-512 SIMD,
在 Zen5 反而不明原因退步到 2 cycle,
另外混合 AVX-256,512 指令的順序不對也會變慢
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.113.235.116 (臺灣)
※ 作者: SkyPlus 2024-08-08 09:39:45
※ 文章代碼(AID): #1cj27ntw (PC_Shopping)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1723081201.A.DFA.html
推 : 重返榮耀!1F 223.139.184.93 台灣 08/08 09:42
推 : i粉正在嘗試關心 : 既然以前i被說avx5122F 114.33.46.227 台灣 08/08 09:45
→ : 超熱超耗電又要讓U降頻跑 那這次的zen5呢
→ : 超熱超耗電又要讓U降頻跑 那這次的zen5呢
推 : i吹討厭4F 36.238.95.84 台灣 08/08 09:58
→ : 這篇 並試著無視
→ : 這篇 並試著無視
推 : 不知道Linus 大神如何看待…6F 114.136.57.150 台灣 08/08 10:01
推 : 新一代RPCS3神器7F 104.28.232.15 台灣 08/08 10:05
推 : 之前用7950X的AVX-512挖礦的還在嗎8F 114.136.146.11 台灣 08/08 10:19
推 : 超缺頻寬9F 211.20.26.1 台灣 08/08 10:33
→ : X3D快來
→ : X3D快來
→ : AVX-512做什麼用?11F 39.10.8.235 台灣 08/08 10:36
推 : 這個之前好像看到能挖礦的樣子12F 114.137.153.82 台灣 08/08 10:44
推 : 遊戲好像用不到?13F 119.14.100.51 台灣 08/08 10:46
→ : AVX2應用比較廣泛 AVX512不知道那些軟體14F 98.45.195.96 美國 08/08 10:47
→ : 現在有在用
→ : 現在有在用
推 : So sorry to disappoint the RPCS3 com16F 114.136.146.11 台灣 08/08 10:47
→ : munity here. As much as they love AV
→ : X512, they primarily only use 128-bi
→ : t AVX512 - which does not significan
→ : tly benefit from Zen5's improvements
→ : to the vector unit.
→ : RPCS3沒什麼用
→ : munity here. As much as they love AV
→ : X512, they primarily only use 128-bi
→ : t AVX512 - which does not significan
→ : tly benefit from Zen5's improvements
→ : to the vector unit.
→ : RPCS3沒什麼用
噓 : 8要再反觀惹!收盤只剩18.99 天下苦皇久矣23F 1.163.252.225 台灣 08/08 10:53
→ : !!
→ : !!
推 : AVX-512 普通消費者用不到也是事實25F 140.114.85.131 台灣 08/08 11:12
推 : 普通遊戲用不到,PS3模擬器有用到的樣子26F 27.52.41.115 台灣 08/08 11:14
推 : 一般人用不到是事實27F 211.20.26.1 台灣 08/08 11:19
推 : i皇今年已經跌掉60%了28F 123.204.11.71 台灣 08/08 11:28
推 : 等X3D應該猛猛的29F 111.82.252.188 台灣 08/08 11:45
推 : G叔吹18A股價18塊 等他吹14A的時候會剩30F 101.9.133.227 台灣 08/08 11:50
→ : 14塊
→ : 看他是製程吹的快還是股價跌的快
→ : 14塊
→ : 看他是製程吹的快還是股價跌的快
推 : PS2模擬器好像會用到33F 125.228.171.79 台灣 08/08 12:12
→ : PS3模擬器有用34F 114.136.146.11 台灣 08/08 12:17
推 : 那PS3模擬器應該會跑更快了吧xd35F 223.140.213.77 台灣 08/08 12:21
→ : PS3模擬器就上面說的RPCS3,看起來Zen536F 223.136.78.202 台灣 08/08 12:24
→ : 不會比較快
→ : 不會比較快
推 : X3d加上avx512 ,跑llama小model,應該個38F 42.73.70.132 台灣 08/08 12:24
→ : 人使用也不錯
→ : 人使用也不錯
推 : cpu跑大語言模型可以用avx512加速40F 42.73.75.255 台灣 08/08 12:27
推 : 沒想到自己搞得專用指令 AMD才能好好發41F 49.217.128.171 台灣 08/08 12:36
→ : 揮 可悲
→ : 揮 可悲
推 : 可是這超級耗電晶體耶 能照顧到的43F 118.169.27.203 台灣 08/08 12:43
→ : 應用有限說...
→ : 應用有限說...
→ : 指令集的改善我覺得要等程式編譯執行時最佳45F 42.70.227.91 台灣 08/08 12:45
→ : 化才能展現
→ : 化才能展現
→ : 主要是應用太少 當年推出時幾乎沒什麼47F 118.169.27.203 台灣 08/08 12:48
→ : 地方用的上 到現在有AI可以用上
→ : 但GPU跟NPU他不香嗎... 為什麼要用CPU
→ : 地方用的上 到現在有AI可以用上
→ : 但GPU跟NPU他不香嗎... 為什麼要用CPU
推 : 但Zen5塞了AVX-512還沒有比Zen4核心大50F 140.112.55.67 台灣 08/08 12:53
→ : 顆
→ : 製程也沒用進步很多
→ : 顆
→ : 製程也沒用進步很多
推 : cpu還是比較通用53F 114.33.46.227 台灣 08/08 13:00
→ : 重點是這次看起來不佔空間54F 101.10.57.167 台灣 08/08 13:31
推 : 原本以為塞avx512會很肥,結果塞了4路進55F 223.137.23.210 台灣 08/08 13:39
→ : 去整體面積跟上代差不多真猛
→ : 去整體面積跟上代差不多真猛
推 : 我猜AMD先上 過幾年Intel又會出來AXV51W57F 118.231.208.21 台灣 08/08 13:46
→ : 無用論
→ : 無用論
推 : 台積電就是猛59F 36.238.142.66 台灣 08/08 13:48
推 : 伺服器資料中心那邊avx512有甚麼用嗎?60F 111.241.132.33 台灣 08/08 14:12
→ : 畢竟AMD EPYC跟Ryzen用的料幾乎是一樣的
→ : 畢竟AMD EPYC跟Ryzen用的料幾乎是一樣的
推 : RPCS3全順砲62F 223.140.192.34 台灣 08/08 14:14
推 : 我很像有看過11代要跨12代那時候63F 114.33.46.227 台灣 08/08 14:21
→ : 不知道哪個I吹說512沒用了
→ : 不知道哪個I吹說512沒用了
推 : 轉檔很有用65F 223.140.155.246 台灣 08/08 14:39
推 : NPU跟GPU不就是為了算浮點數的嗎66F 218.172.69.212 台灣 08/08 14:42
推 : 跑大語言模型的回答比較不會出現幻覺67F 36.228.20.172 台灣 08/08 14:50
推 : 到底誰在用avx512?有這需求的不是都拿GP68F 39.9.231.251 台灣 08/08 15:54
→ : U或是TPU加速了?
→ : U或是TPU加速了?
推 : 你問那些雲端吧,蘇媽會放這個東西進來大70F 223.137.23.210 台灣 08/08 16:02
→ : 概是按DC客戶的回饋加的
→ : 概是按DC客戶的回饋加的
推 : i皇的server都有AVX512呀,蘇嬤在DT端72F 175.181.175.150 台灣 08/08 16:21
→ : 這樣純粹是debug加上佛心來著沒閹割
→ : 這樣純粹是debug加上佛心來著沒閹割
→ : intel 市場行銷的東西先做出來再說,只74F 111.241.167.51 台灣 08/08 17:02
→ : 是要降頻降溫,code 都要重寫, port難
→ : 度高 伺服器端用在加密/hash 加速 ,一
→ : 般使用者不需要靠 gpu 做inference ,
→ : 多媒體之類的何不用gpu 就好, 猜是想要
→ : 吹上面的 NVVI 吧,有實驗宣稱比 gpu
→ : 快好幾倍,總之~~讓子彈飛一會~
→ : 啊對了 zluda 被 amd 正式發公文下架了
→ : 是要降頻降溫,code 都要重寫, port難
→ : 度高 伺服器端用在加密/hash 加速 ,一
→ : 般使用者不需要靠 gpu 做inference ,
→ : 多媒體之類的何不用gpu 就好, 猜是想要
→ : 吹上面的 NVVI 吧,有實驗宣稱比 gpu
→ : 快好幾倍,總之~~讓子彈飛一會~
→ : 啊對了 zluda 被 amd 正式發公文下架了
→ : 兩邊DT都馬是Server的白老鼠 需求都是82F 118.163.149.125 台灣 08/08 17:28
→ : Server來的 只是牙膏DT大小核稿到AVX512
→ : 不好Debug關掉而已
→ : AMD不知道是比較保守還是客戶壓力沒那麼
→ : 大 可以比較晚等AVX512成熟一點在實作優
→ : 秀的硬體 牙膏就比較早硬上慢慢優化
→ : 牙膏最新的E核看起來還是沒AVX512 DT應
→ : 該87%又是閹割掉了
→ : Server來的 只是牙膏DT大小核稿到AVX512
→ : 不好Debug關掉而已
→ : AMD不知道是比較保守還是客戶壓力沒那麼
→ : 大 可以比較晚等AVX512成熟一點在實作優
→ : 秀的硬體 牙膏就比較早硬上慢慢優化
→ : 牙膏最新的E核看起來還是沒AVX512 DT應
→ : 該87%又是閹割掉了
推 : 建議i社把那些面積拿去做L3還比較實際一點90F 60.250.130.216 台灣 08/08 17:40
→ : 整天搞一些有的沒有的
→ : 整天搞一些有的沒有的
→ : 做硬體的別想太多 食物鏈的下游 很多92F 118.163.149.125 台灣 08/08 17:45
→ : 時候你以為是牙膏想做 客戶說了算
→ : 不過我到蠻想看牙膏現在高階封裝也是有
→ : 再碰 能乖乖拉下臉弄個X3D來看看嗎
→ : 時候你以為是牙膏想做 客戶說了算
→ : 不過我到蠻想看牙膏現在高階封裝也是有
→ : 再碰 能乖乖拉下臉弄個X3D來看看嗎
推 : i社現在NEX事業群倒是出了一些怪機絲96F 60.250.130.216 台灣 08/08 18:07
→ : 比如說1851腳位的[真。14代]
→ : 比如說1851腳位的[真。14代]
→ : MSDT改用NINE L3第4年了還在堆L3,98F 119.237.179.153 香港 08/08 18:09
→ : 能不能先查一下牙膏L3到底是怎麼運
→ : 作的?
→ : 能不能先查一下牙膏L3到底是怎麼運
→ : 作的?
→ : core ultra 7 165HL之類的101F 60.250.130.216 台灣 08/08 18:09
→ : 還有什麼i7-14701e的怪東東
→ : 還有什麼i7-14701e的怪東東
推 : 我覺得Linus的看法是對的 桌面/一般用途103F 119.14.42.10 台灣 08/08 21:11
→ : 根本用不上 佔用的空間可以有更好的利用
→ : 伺服器之類特殊用途如果需要可以另外出
→ : 根本用不上 佔用的空間可以有更好的利用
→ : 伺服器之類特殊用途如果需要可以另外出
推 : 另外出怎麼玩蘇媽最愛的膠水大法106F 1.161.79.156 台灣 08/08 21:32
→ : 這次avx512進步那麼多107F 111.82.129.169 台灣 08/08 23:06
→ : zen5這次可能真的卡在那顆舊的iod
→ : zen5這次可能真的卡在那顆舊的iod
--
※ 看板: PC_Shopping 文章推薦值: 0 目前人氣: 0 累積人氣: 88
作者 SkyPlus 的最新發文:
- 昨天日古戰的日本關門投手,也分享了大巨蛋的影片: 藤平 尚真/SHOMA FUJIHIRA @_shoma_official 通訳リンさんからです 昨日は台北ドームで地鳴りのような 応援をしていた台 …103F 63推 2噓
- 22F 7推
點此顯示更多發文記錄
→
guest
回列表(←)
分享