作者 tint (璇月)
標題 Re: [閒聊] AMD你也有大小核出問題的一天啊
時間 Wed Jul 31 11:05:05 2024


※ 引述《mayolane (沒有人啦)》之銘言:
: Ryzen AI 9 HX 370有Zen5*4+Zen5c*8
: 主要的問題是Zen5和Zen5c在兩顆CCD上
: 彼此用Infinity Fabric連接
: https://i.imgur.com/acR8B42.jpeg
: 然後彼此之間通信延遲鋼彈180 ns
: 要知道7950X兩顆CCD的延遲也才79 ns

在前代Zen4架構
消費級首次用上Zen4+Zen4c大小核的
Phoenix 2 APU(7545U/7440U、Z1、8500G等使用)
Zen4+Zen4c大小核是位於同一個CCX上
https://i.imgur.com/8PqjH3e.jpeg
[圖]
6個核心共用16MB的L3快取
雖然大核Zen4對比桌面版L3快取縮小
但整個CCX共用16MB的L3
4個Zen4c每核平均也能分配到2.6MB的L3

以桌面的8500G為例
Zen4c小核的最高時脈為3.7GHz
參考一些評測,跨小核的延遲並未明顯增加
Phoenix 2 APU的Zen4c
在應用上就是時脈較低的核心

這次的Zen5 Strix Point APU
配置4個Zen5+8個Zen5c大小核,總共12核心
其中4個Zen5大核心
給到和桌面一樣完整的L3(每核平均4MB)
但8個Zen5c小核,則精簡到僅8MB L3
每核心平均只有1MB L3

依之前AMD公佈的投影片說明
https://i.imgur.com/8b3nqmH.jpeg
[圖]
這次4個Zen5和8個Zen5c
分別為二組獨立的CCX
4個Zen5的CCX共用16MB的L3
8個Zen5c的CCX則只共用8MB的L3
二組CCX彼此使用Infinity Fabric相連
有點類似以前Zen2時的設計

Strix Point APU這樣的雙CCX配置
導致跨二組CCX上核心存取時
會受限於Infinity Fabric的頻寬
跨CCX的延遲和頻寬可能會受不小影響
而且Zen5c的CCX僅有8MB L3快取
大小核效能的落差可能更凸顯出來

在6月時一篇Ryzen AI 9 365偷跑詳細測試中
就能看出這次雙CCX設計的特徵
https://blog.hjc.im/zen5-preliminary-review.html

 
Ryzen AI 9 365這顆APU為Strix Point核心
遮蔽2個Zen5c小核
為4個Zen5+6個Zen5c總共10核心的配置
文章中跨二組CCX的同步測試
https://i.imgur.com/zIrijeT.jpeg
[圖]
可觀察到跨到CCX時的延遲和頻寬
都有明顯受影響的情形
延遲增加至170ns
頻寬從28000MB/s左右降至9000MB/s等級

Strix Point這次的雙CCX設計
在跨CCX的應用上
可能也抵銷了一些這次給到4個滿規
Zen5核心的性能優勢
不過Strix Point的能效表現仍是不錯的
Strix Point雙CCX的架構
AMD在設計初應就知會有這情形
但Strix Point主要面向移動端產品
配置12核心和16CU RDNA3.5內顯
各方面都已有不少提升了

明年還會有一顆面向主流市場
原生8核心Zen5 APU「Kraken Point」推出
配置4個Zen5+4個Zen5c的大小核設計
內顯是8CU規模,NPU維持50TOPS算力
看起來非常適合掌機和低功耗裝置
到時可以觀察看看這一顆APU
大小核會不會回到採用單CCX的設計了
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.204.6.173 (臺灣)
※ 作者: tint 2024-07-31 11:05:05
※ 文章代碼(AID): #1cgQdZNm (PC_Shopping)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1722395107.A.5F0.html
※ 同主題文章:
Re: [閒聊] AMD你也有大小核出問題的一天啊
07-31 11:05 tint
※ 編輯: tint (123.204.6.173 臺灣), 07/31/2024 11:21:06
canandmap: 推解說,所以延遲高的原因看起來似乎就是L3不夠+IF頻寬不足,導致這樣的結果發生1F 36.228.160.137 台灣 07/31 11:20
smallreader: IF頻寬高要更耗電所以頻寬給很少嗎4F 111.254.174.244 台灣 07/31 11:43
SHR4587: 下一代移動端應該就是改進延遲問題了
這次就算有延遲問題整體表現還是很亮眼遊戲是可惜了,但會買這類型產品的遊戲應該都是附加價值吧5F 111.241.189.9 台灣 07/31 11:46
avans: 推解說9F 114.137.200.253 台灣 07/31 11:48
bunjie: 推詳細解說10F 111.82.220.142 台灣 07/31 11:53
Arbin: 遊戲筆電大概還是得要等全大核或是單CCX11F 111.71.212.194 台灣 07/31 12:31
oopFoo: 筆電的cpu功耗最重要。現在分成兩個ccx,一個是lowish power island,平常就用這個高功耗的ccx可以關掉。你串在一起無法關掉省電。ringbus很耗電的。上一代的反應不好就是功耗降不下來。這個跟MTL的lpe有點像但MTL的兩顆ecore太少了。
以後主流一定是要分流的12F 36.224.200.235 台灣 07/31 12:39
smallreader: AMD好像是Mesh但我資訊很久沒更新了哦是在說Intel P/E核同在ringbus耗電19F 111.254.174.244 台灣 07/31 13:18

--
作者 tint 的最新發文:
點此顯示更多發文記錄