※ 本文轉寄自 ptt.cc 更新時間: 2024-06-22 20:45:16
看板 PC_Shopping
作者 標題 [測試] I家E core在Ansys Fluent中的效能表現
時間 Fri Jun 21 22:39:19 2024
懶人包:沒有用
部落格好讀版:
https://soulattic.blogspot.com/2024/06/intel-13th-cpuansys-fluent.html
1. 前言
由於工作上時常需要使用CFD(計算流體力學)軟體來模擬,加上對電腦硬體有些認識,成了
成了本次做這一些小測試的契機。
念研究所的時候12代剛上,當時有時間可以進行測試,實驗室的設備費卻已經乾了,因此一
直沒能買有大小核設計的CPU來進行一些CFD運算的測試。我看到的大多說法都說大小核
設計有助於計算密集型的生產力應用,例如渲染、剪片轉檔等等,也確實在Cinebench之類
的跑分軟體中有十分強悍的表現。
網路上國內外的評測都鮮少提到CFD軟體的測試成績,只有少數評測網站會測試開源的CFD軟
體OpenFOAM,但測出來的結果卻差異甚大。
在AnandTech的測試中intel 13/14th 全面領先Ryzen 7000系
在Phoronix的測試中7950x3d卻反將一軍
目前工作上使用的軟體是ANSYS Fluent,因此本文將會以這個軟體做為測試主軸。但合法的
ANSYS軟體一套要價數百萬,只好跟公司借用借用,嘿嘿。
利用了下班時間跑了ANSYS Fluent的Benchmark Case做了一些測試,留個紀錄想要拋磚引玉
2. 測試環境
A. 軟體版本: ANSYS Fluent 23R2
B. Benchmark Case: ANSYS Fluent, External Flow Over an Aircraft Wing
(aircraft_2m)
C. 網格數量: 2m(200萬)
D. 網格類型: Hexa(六面體)
E. 紊流模型: realizable k-eps turbulence
F. 求解器類型: Pressure based coupled solver, Green Gauss Node based, steady
G. 電腦配備:
CPU: Intel i7 13700 nonK
Cooler: Thermalright BA120
MB: ASUS B760-A WiFi D4
RAM: Kingston Fury DDR4-3200 32GBx2 @3466
SSD: ADATA S70 pro 2TB
Case: CM TD500 MESH V2
H. 環境溫度24度C,觀測HWinfo軟體全測試無出現撞溫度牆的狀況。
I. 電源計畫: 高效能
合法的ANSYS Fluent一次最多只能使用4核心運算,想另外加核心數上去就必須購買HPC(Hig
h Performance Computing)。
而這個HPC也是動輒百來萬的東西,因此在這邊只使用1個軟體本體+1個HPC的License,總共
總共12核心下去做運算,我想在有限的核心數量下找出最佳的組合也比較符合預算有限的且
只能使用合法軟體的單位。
總共12核心下去做運算,我想在有限的核心數量下找出最佳的組合也比較符合預算有限的且
只能使用合法軟體的單位。
3. 測試結果
必須要先做說明,我有找到原廠的電腦設定建議,裏頭是建議關掉超執行緒(Hyper-Thread,
因此剛開始測試都是關閉HT的狀況,後來才想說要把HT打開測試看看。
以下是測試結果,橘框是P core:
A. 6P6E (no HT)
Simulation wall-clock time for 1800 iterations 4085 sec
6P6E是將HT關掉後,在Windows 11下的自動核心調度結果進工作管理員看是有指定CPU親和性在每個運作的核心上的
https://i.imgur.com/GadJ4lb.png
B. 8P4E (no HT)
Simulation wall-clock time for 1800 iterations 3920 sec
8P4E是我在工作管理員中手動將CPU親和性調度到8個P核上的結果https://i.imgur.com/3XH3Yia.png
C. 全預設 (自由調度)
Simulation wall-clock time for 1800 iterations 3630 sec
全預設狀況下把HT重新打開,這時進工作管理員查看會發現CPU親和性沒有被指定但從工作管理員上可以推斷出應該是跑在12個P核的執行緒上
https://i.imgur.com/uVanIiv.png
D. 8P0E (no HT)
SSimulation wall-clock time for 1800 iterations 3683 sec
把小核跟HT都關了,軟體設定8核心運算,只用8C8T下去跑,這個就沒有特別截圖了以下是測試結果,橘框是P core:
A. 6P6E (no HT)
Simulation wall-clock time for 1800 iterations 4085 sec
6P6E是將HT關掉後,在Windows 11下的自動核心調度結果進工作管理員看是有指定CPU親和性在每個運作的核心上的
https://i.imgur.com/GadJ4lb.png
B. 8P4E (no HT)
Simulation wall-clock time for 1800 iterations 3920 sec
8P4E是我在工作管理員中手動將CPU親和性調度到8個P核上的結果https://i.imgur.com/3XH3Yia.png
C. 全預設 (自由調度)
Simulation wall-clock time for 1800 iterations 3630 sec
全預設狀況下把HT重新打開,這時進工作管理員查看會發現CPU親和性沒有被指定但從工作管理員上可以推斷出應該是跑在12個P核的執行緒上
https://i.imgur.com/uVanIiv.png
D. 8P0E (no HT)
SSimulation wall-clock time for 1800 iterations 3683 sec
把小核跟HT都關了,軟體設定8核心運算,只用8C8T下去跑,這個就沒有特別截圖了E. 8P0E(有開HT,用12個執行緒在跑)
Simulation wall-clock time for 1800 iterations 3578 sec
關小核但開HT,看工作管理員,也有指定CPU親和性在前12個執行緒上https://i.imgur.com/65t7BYt.png
4. 總結
基本上可以將結果分為兩群:
i. 有E核參加運算(A、B)
ii. 無E核參加運算(C、D、E)
https://i.imgur.com/5eo1FTG.png
其中i群內8P4E相較於6P6E快了4.2%,好像有些差別
ii群內8P0E無HT比預設慢了1.4%,8P0E有HT比預設快了1.5%,這應該可以被認為是誤差
i群平均(4002.5s)相較於ii群平均(3630.3s)慢了10.3%
甚至可以從B跟D的比較中發現8P4E比8P0E還慢!!
我認為這可以歸因於CFD的特性,CFD是一種吃重記憶體頻寬的應用。
在消費級平台上只有雙通道的記憶體頻寬被P核和E核共享,結果就是沒有讓速度較快的P核
發揮全部的算力,進而導致整體計算時間拉長。
因為還沒測試過AMD平台,所以不能說全大核的AMD平台就比較好。但可以得到的結論是:
算CFD完全沒有買13900/K的必要,因為P核數量並沒有增加。
以上結果供各位參考,如有關於購買CFD模擬用硬體設備也歡迎留下建議。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.173.25.76 (臺灣)
※ 作者: xiaotee 2024-06-21 22:39:19
※ 文章代碼(AID): #1cTP2PJQ (PC_Shopping)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1718980761.A.4DA.html
※ 編輯: xiaotee (1.173.25.76 臺灣), 06/21/2024 22:44:15
※ 編輯: xiaotee (1.173.25.76 臺灣), 06/21/2024 22:46:49
文章格式有點跑掉,手機沒辦法修正
回家之後修
https://reurl.cc/4r76R2
https://i.imgur.com/P69E3N7.png
不是我配的,不要看我
有確認過主板內PL1/2都設定在253W
各項測試跑起來最多到160w左右而已
※ 編輯: xiaotee (101.8.26.47 臺灣), 06/22/2024 07:50:05
--
※ 編輯: xiaotee (1.173.25.76 臺灣), 06/21/2024 22:46:49
文章格式有點跑掉,手機沒辦法修正
回家之後修
推 : 有數據有推1F 36.238.90.61 台灣 06/21 22:46
謝謝推推 : 每個小核簇(每4個小核)共用一個記憶2F 36.232.148.201 台灣 06/21 22:49
→ : 體節點,在memory intensive的程式表現
→ : 會很差
感謝說明~→ : 體節點,在memory intensive的程式表現
→ : 會很差
推 : 推測試,我以為我在看小論文5F 1.162.93.146 台灣 06/21 22:50
其實只是廢話比較多的簡易測試而已推 : 記憶體頻寬 那L3快取大小會不會也有6F 111.254.183.69 台灣 06/21 22:51
我印象中看別人測的數據是有差https://reurl.cc/4r76R2
Microsoft Posts In-Depth AMD EPYC Milan-X Benchmarks | Tom's Hardware
Microsoft gives a sneak peek of its revamped Azure HBv3 VMs powered by AMD's EPYC 7V73X (Milan-X) processor. ...
Microsoft gives a sneak peek of its revamped Azure HBv3 VMs powered by AMD's EPYC 7V73X (Milan-X) processor. ...
推 : 原po有沒有考慮7000系也測一篇來比較7F 111.71.212.146 台灣 06/21 22:55
沒...沒有多餘的預算了推 : 推測試,太詳細了吧,我還是買AMD好了8F 118.169.21.174 台灣 06/21 22:55
謝謝推→ : 喔~沒事 x3d提到評測已經講完了9F 111.254.183.69 台灣 06/21 22:56
推 : Intel什麼時候放棄大小核架構10F 114.34.167.89 台灣 06/21 23:03
※ 編輯: xiaotee (1.173.25.76 臺灣), 06/21/2024 23:19:11推 : 推分享11F 27.52.38.5 台灣 06/21 23:21
→ : 是說這台電腦是你自己的還是實驗室的
是...是公司的→ : 是說這台電腦是你自己的還是實驗室的
推 : 吃重記憶體頻寬? 所以用D4跑跟D5理論上來說13F 182.155.78.98 台灣 06/21 23:24
→ : 應該會有差距?
理論上是這樣,因為同樣D4-3200,跑雙通道、四通道、八通道的求解速度天差地遠→ : 應該會有差距?
推 : 懶人包簡單暴力,害我笑出來15F 1.200.10.90 台灣 06/21 23:26
※ 編輯: xiaotee (1.173.25.76 臺灣), 06/21/2024 23:32:57→ : 實驗室的SSD拿S70 Pro我有點擔心16F 27.52.38.5 台灣 06/21 23:42
→ : *公司
資料碟而已,系統碟是SN770...XD→ : *公司
不是我配的,不要看我
推 : 感謝18F 112.104.64.201 台灣 06/22 00:08
→ : 有撞功耗牆嗎?19F 59.127.199.236 台灣 06/22 00:10
看起來都沒有撞功耗牆喔有確認過主板內PL1/2都設定在253W
各項測試跑起來最多到160w左右而已
推 : 最快的居然是把小核關了w20F 211.76.58.165 台灣 06/22 00:43
→ : 多核圍觀21F 39.10.8.240 台灣 06/22 01:07
推 : 我喜歡你這麼粗暴22F 1.171.242.95 台灣 06/22 02:17
推 : 推 懶人包 XD23F 220.134.41.251 台灣 06/22 03:23
推 : 簡單粗暴的結論24F 220.142.135.215 台灣 06/22 04:45
我怕我廢話太多沒人看QQ→ : 這應該還蠻有參考價值的吧 這種商業軟體很少25F 124.218.223.231 台灣 06/22 06:57
→ : 人能測 而且原PO也滿詳細的
※ 編輯: xiaotee (101.8.26.47 臺灣), 06/22/2024 07:22:38→ : 人能測 而且原PO也滿詳細的
推 : 推 這個軟體使用者普遍太專業XDDD27F 98.45.195.96 美國 06/22 07:30
推 : 有拖後腿效用啊 怎麼能說沒有用= =28F 1.34.164.202 台灣 06/22 07:31
推 : X3D對這些EDA應用是超強的...29F 220.135.86.145 台灣 06/22 07:32
※ 編輯: xiaotee (101.8.26.47 臺灣), 06/22/2024 07:40:29※ 編輯: xiaotee (101.8.26.47 臺灣), 06/22/2024 07:50:05
→ : 大小核還要賭軟體設計/OS調度 真的不如直30F 111.249.142.175 台灣 06/22 08:13
→ : 接AMD 大小核比較像Intel的遮羞布 功耗狂
→ : 拉 跑分才會好看
→ : 接AMD 大小核比較像Intel的遮羞布 功耗狂
→ : 拉 跑分才會好看
推 : 推33F 223.140.170.202 台灣 06/22 08:21
推 : 清楚有料的實測 推推34F 101.136.149.212 台灣 06/22 09:00
推 : 同跑CFD 幫推推35F 111.252.172.218 台灣 06/22 09:08
推 : 感謝測試,這結論有釐清一些我操作上的36F 118.160.61.12 台灣 06/22 09:08
→ : 疑問,連原廠工程師都沒解釋清楚
→ : 疑問,連原廠工程師都沒解釋清楚
推 : 推 關小核派不推不行38F 1.170.185.115 台灣 06/22 09:09
→ : SN770就另一種賣牌子的
→ : WD的nvme根本就是SN580綠標 SN770藍標
→ : 但改個標色很有幫助
→ : SN770就另一種賣牌子的
→ : WD的nvme根本就是SN580綠標 SN770藍標
→ : 但改個標色很有幫助
推 : intel 大小核吹上天 實際應用一跑笑死人42F 42.75.131.185 台灣 06/22 09:14
→ : 這個測試結論簡單粗暴 我喜歡
→ : 這個測試結論簡單粗暴 我喜歡
推 : 小核跑分用的 玩遊戲也用不到44F 101.9.196.171 台灣 06/22 09:15
推 : 推測試45F 106.1.186.50 台灣 06/22 09:24
推 : 多補一些數據就論文了 而且結論有趣46F 220.142.150.146 台灣 06/22 09:35
→ : 結果傳統的加強記憶體階層還是比較受用。47F 42.70.164.240 台灣 06/22 09:37
推 : 推測試!雖然不會用到Fluent了48F 36.239.139.176 台灣 06/22 09:47
推 : 從i7-12700的8P4E、i9-12900的8P8E49F 123.192.245.57 台灣 06/22 09:50
→ : 往上一代都是在增加E核而已
→ : 往上一代都是在增加E核而已
推 : 好直接的結論xd51F 111.254.61.191 台灣 06/22 10:53
推 : 推52F 49.216.221.13 台灣 06/22 11:04
推 : 只差全小核了,這有辦法測嗎53F 118.167.21.216 台灣 06/22 11:31
推 : 推 不知道static structural 或Ansys54F 36.238.155.33 台灣 06/22 11:41
→ : lsdyna是不是一樣結果
→ : lsdyna是不是一樣結果
推 : 有數據給推56F 223.138.55.131 台灣 06/22 12:12
推 : 謝謝57F 111.251.230.53 台灣 06/22 12:22
推 : 優文58F 111.71.213.212 台灣 06/22 12:31
推 : 推59F 1.200.40.85 台灣 06/22 13:53
推 : E核到底有沒有用我覺得不好下定論,像是2060F 114.43.30.199 台灣 06/22 13:55
→ : 77我關HT開E核,FPS有比較高一些
→ : 但原PO環境下,開E核看起來就是悲劇
推 : 大小核主要還是調度問題
→ : 77我關HT開E核,FPS有比較高一些
→ : 但原PO環境下,開E核看起來就是悲劇
推 : 大小核主要還是調度問題
推 : 有料,推個64F 223.139.104.91 台灣 06/22 14:26
推 : 謝謝懶人包65F 111.255.68.122 台灣 06/22 14:44
推 : 推66F 1.34.92.164 台灣 06/22 15:29
推 : 推測試67F 118.161.169.190 台灣 06/22 16:19
推 : 推68F 122.55.34.138 菲律賓 06/22 16:36
推 : 全大核沒有問題69F 124.6.4.211 台灣 06/22 17:11
推 : 之前測試過公司用的Flotherm70F 58.114.66.151 台灣 06/22 18:25
→ : 跟樓主的結論差不多
→ : 關掉HT,關掉E核會比較快
→ : 另外記憶體頻寬大速度明顯有差
→ : 跟樓主的結論差不多
→ : 關掉HT,關掉E核會比較快
→ : 另外記憶體頻寬大速度明顯有差
推 : 看不懂QQ 為什麼有E反而比沒E慢74F 36.236.199.199 台灣 06/22 18:57
→ : 推測試,不過買的起這軟體,至少要上64核75F 27.53.113.173 台灣 06/22 19:31
→ : 心吧,不會用家用型
→ : 心吧,不會用家用型
推 : 哪有差不多,樓主不關HT比較快吧77F 124.213.115.96 日本 06/22 19:39
推 : 開HT就該比較快 關HT是考量增幅太小78F 111.254.183.69 台灣 06/22 20:28
→ : (這裡增幅小因為被記憶體頻寬限制住)
→ : 如果沒有記憶體瓶頸 例如測cb 那HT分
→ : 數還是有顯著差異 (耗電也UP就是了)
→ : (這裡增幅小因為被記憶體頻寬限制住)
→ : 如果沒有記憶體瓶頸 例如測cb 那HT分
→ : 數還是有顯著差異 (耗電也UP就是了)
--
※ 看板: PC_Shopping 文章推薦值: 0 目前人氣: 0 累積人氣: 81
→
guest
回列表(←)
分享