[情報] Nvidia探索將多GPU封裝到一塊：輕鬆打破 - Z_sports板

首頁(home) 上頁(↑) 下頁(↓) 末頁(end)

※ 本文為 JackLee5566.bbs. 轉寄自 ptt.cc 更新時間: 2017-07-04 22:10:39

看板 PC_Shopping

作者 KotoriCute (Lovelive!)
標題 [情報] Nvidia探索將多GPU封裝到一塊：輕鬆打破
時間 Tue Jul 4 19:46:22 2017

Nvidia探索將多GPU封裝到一塊：輕鬆打破舊架構極限

http://www.cnbeta.com/articles/tech/628297.htm

商業計算、可選研究、以及4K多屏遊戲等需求，不斷推升著對現代GPU的性能需求。根據
一份近期的研究報告，Nvidia認為正在迅速接近當前GPU架構模型的極限，因此需要尋找
新的方法去攻堅。當前這個想法仍處於模擬階段，但文中提到的“多芯片模塊GPU”（

MCM-GPU）的概念，有望最終將多顆GPU模塊整合到一處。

在意識到Nvidia 將很快難以通過當前架構榨取GPU 性能之後，亞利桑那州立大學、英偉
達、德州大學奧斯汀分校、以及巴塞羅那超算中心攜手展開了研究。

此前，廠商還可以通過在每次製程迭代時堆積更多的流處理器來提升GPU 性能。但遺憾的
是，在單一模塊中塞入更多晶體管的方法，已經變得越來越困難。

以Nvidia V100 GPU 為例，其已經需要代工廠商（台積電）將製程推到12nm 的極限。此
外，製造規模越來越大的模塊，其成本和相關問題也不可忽視（比如因製造錯誤遇到的數
量減少）。

雖然Nvidia 可以通過將多顆GPU 裝在一塊PCB 上的方式來提升顯卡性能（比如Tesla
K10 和K80），但當前仍有一些未能解決的問題—— 比如跨多GPU 的任務分配就需要編程
來提升硬件效率。

於是研究人員們另闢蹊徑，決定在封裝技術上尋找新方法，讓Nvidia 可以將多個GPU 模
塊（GPMs）封裝到一塊。這些GPMs 比當代GPU 要小一些，製造起來也更容易和便宜。

儘管人們對其性能仍有疑問，但研究人員聲稱近期基板技術的發展（PDF）已經能夠幫助
其部署一種快速、強健的模塊通信互聯架構。從理論上來講，其帶寬可達數TB/s 。

在Nvidia 內部GPU 模擬中，研究團隊將MCM-GPU 堆到了256 組SMs，而Pascal 架構僅為
56 組SMs 。然後團隊基於當前架構進行了預測，結果顯示MCM-GPU 可提速45.5% 。

此外，在同一板子上進行的多GPU性能對比表明，MCM-GPU有26.8%的領先優勢。最後，有
消息稱AMD公司也有類似的點子（基於Navi GPU）。

--

GPU也即將邁入大膠水時代？

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.165.167.165
※ 文章代碼(AID): #1PMu0GAb (PC_Shopping)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1499168784.A.2A5.html

→ gn01140216 : nvidia也懂膠水?1F 07/04 19:47

→ reaturn : 會不會以後整個PCB版就一堆東西粘起來的？2F 07/04 19:47

推 jinshun : 說AMD引領世界潮流真的不是開玩笑der3F 07/04 19:48

→ mayjan : 我有能力評論我就不會上這個板了4F 07/04 19:49

→ ww578912tw : AMD之前講的INFINITY FABRIC不就是膠水惹5F 07/04 19:51

→ friedpig : 最理想還是3dic 只是還做不出來6F 07/04 19:53

→ arrenwu : GPU 膠水的難度比較高吧7F 07/04 19:57

推 chaahk2012 : 新架構生出來之前，先膠水sli檔一下。8F 07/04 19:58

推 ATand : GPU的膠水會不會同等於內部SLI??9F 07/04 19:59

推 greg7575 : 膠水10F 07/04 20:05

→ kuninaka : 3dfx那個比較炫11F 07/04 20:06

推 darkdixen : 跟C2D有87% 像12F 07/04 20:07
→ darkdixen : 封一起跟外部雙GPU還是有差

推 sdbb : Pentium pro表示：比膠水，嗯哼14F 07/04 20:11

推 a2935373 : 大膠水時代要來臨惹嗎15F 07/04 20:14

推 tomsawyer : Pentium D:哼哼16F 07/04 20:18

→ kuma660224 : GPU膠水應該比較困難。否則AMD早就用了17F 07/04 20:23
→ kuma660224 : 一般遊戲用戶大概也沒在擔心製程面積上限。
→ kuma660224 : 因為連GG都覺的很硬的超大Die很少人買的起

推 a2935373 : HBM用的interposer不知道能不能解決問題20F 07/04 20:27

→ ry3298 : 印象中交火效率大於SLI？！ A家軟體優勢大些？21F 07/04 20:31

推 a2935373 : 這應該不是傳統SLI22F 07/04 20:31

推 c52chungyuny: GPU一堆pipeline怎麼黏啊23F 07/04 20:32

→ kuma660224 : Die連外的頻寬做到超高是很有可能。24F 07/04 20:35
→ kuma660224 : 但不同Die吃不同記憶體，很難有效率。
→ kuma660224 : 因為多GPU繪圖常常不是真的完全各算各的。
→ kuma660224 : 遊戲優化常是把運算切成好幾個frame算。

→ arrenwu : pipeline還不算是問題，要能夠sync才是問題28F 07/04 20:39

→ kuma660224 : 多GPU就變成GPU1算完,得丟給GPU229F 07/04 20:39

→ arrenwu : 應該說，要能夠sync又有效率就變成問題30F 07/04 20:39

→ kuma660224 : 但兩GPU各自有自己記憶體自己的頻寬31F 07/04 20:40

推 Merkle : 大膠水時代32F 07/04 20:40

→ kuma660224 : 資料傳來傳去就常常要等待。33F 07/04 20:40

→ commandoEX : Crossfire的fps浮動值比較大，所以要說真的比較好也34F 07/04 20:40
→ commandoEX : 不算

→ kuma660224 : 不像挖礦是多GPU毫無交流。36F 07/04 20:41

推 aegis43210 : 如果是專門用來深度學習呢？這樣就比較不怕延遲37F 07/04 20:45

→ arrenwu : 應該說如果現行 multi-GPU 沒問題的話膠水應該就行38F 07/04 20:45

→ kuma660224 : 如果是為深度學習有需要黏嗎?39F 07/04 20:47

推 kamichu : 不能一塊gpu分別算一個角落嗎？40F 07/04 20:47

→ kuma660224 : 既然不介意延遲，直接多插幾張卡就好。41F 07/04 20:47

推 arrenwu : 這之前kuma大有講解過，現在rendering算法連續兩張42F 07/04 20:48
→ arrenwu : 圖片並不是獨立運算的

→ kuma660224 : 會想搞膠水就是多卡多晶片不能解決的情況44F 07/04 20:48
→ kuma660224 : 應該說繪圖大部分是獨立運算，但是
→ kuma660224 : 有一部分為了優化省效能，反而是不太獨立。
→ kuma660224 : 你這frame的反射貼圖可能是上個frame算的
→ kuma660224 : 不是所有即時素材都需每個frame從0開始

→ arrenwu : 的魔法輸49F 07/04 20:53

→ kuma660224 : 單GPU素材擺在自己幾百GB/s的VRAM50F 07/04 20:53
→ kuma660224 : 多GPU就糗了某些素材在另一PCIE顯卡那

→ kamichu : 印象中3d算圖平行運算是切成一塊一塊再組合一張圖52F 07/04 20:55

→ kuma660224 : 繪圖平行運算有很多種分配方式。53F 07/04 20:55

推 arrenwu : 這樣說起來，如果膠水之後是用同一個VRAM有搞頭囉？54F 07/04 20:56

→ kuma660224 : 如果是那樣，兩晶片共用VRAM又怕頻寬不足55F 07/04 20:57

推 arrenwu : 剛剛查了一下 https://goo.gl/cP8hfS56F 07/04 21:00

Types of VRAM Explained: HBM vs. GDDR5 vs. GDDR5X - Logical Increments Blog

This PC hardware article explains in simple, straightforward terms the differences between 3 standards of graphics card VRAM: GDDR5, GDDR5X, and HBM. ...

→ arrenwu : 目前 GDDR5 是 28GB/s，HBM 是 100GB/s57F 07/04 21:00
→ arrenwu : 如果真的用上 HBM，頻寬問題應該可以克服？

→ kuma660224 : Xbox360的Ati晶片示範過pipeline上下切。59F 07/04 21:01
→ kuma660224 : 它把跟大頻寬有關的ROPs跟eDram做在一起
→ kuma660224 : 所以它的eDram不只是記憶體，也有部分
→ kuma660224 : GPU的功能。
→ kuma660224 : 那種做法就不擔心工作分配的問題。
→ kuma660224 : 但兩邊都不是完整GPU,合起來才能運作。

推 a2935373 : 不知道成本如何65F 07/04 21:13
→ a2935373 : 如果能把ROP和SP切開的話運算卡和遊戲卡部分晶片
→ a2935373 : 或許能夠共用?

推 Monoson : 這是nvidia research發表的學術論文68F 07/04 21:24
→ Monoson : 原文是公開的可以從research.nvidia.com下載
→ Monoson : 原文連結 https://goo.gl/rxyTjD

MCM-GPU: Multi-Chip-Module GPUs for Continued Performance Scalability | Research

推 Monoson : 我不是業內人士不過瞄一下看起來是用理論模擬比較71F 07/04 21:28
推 Monoson : 膠水做在晶片上封裝上 pcb板上還是不同卡之間
→ Monoson : 的效率跟能耗不過似乎沒講怎樣實作(商業機密? XD)

推 david10ne : 膠水大戰74F 07/04 21:50

推 Dissipate : 大家一起膠起來！75F 07/04 21:57

推 jior : 大罐膠水!!!!76F 07/04 21:59

※ 看板: Z_sports　文章推薦值: 0 目前人氣: 0 累積人氣: 56　

作者 KotoriCute 的最新發文:

+45 [公連] 公連廣播節目由每月4次改為每月2次 - C_Chat 板

作者: KotoriCute 36.232.162.102 (台灣) 2024-12-26 20:16:01

公主連結廣播節目由每個月4次改為每個月2次看來這遊戲真的到生涯末期限定卡池連發也很有當時彈射收掉前既視感之前對岸多次精準爆料日服公連消息的內鬼也提到現在日服公連每日活躍人數已不到巔峰的1/1 …

74F 46推 1噓
+155 [閒聊] 燒鳥店店長：拔出雞肉的人就滾去烤肉店 - C_Chat 板

作者: KotoriCute 223.138.132.40 (台灣) 2024-12-26 16:02:16

《吃烤雞肉串的禮儀問題》將雞肉拔出竹籤？店長痛罵這種人就該滾去烤肉店烤雞肉串是日本居酒屋常見的下酒菜，甚至還有許多烤雞肉串專賣店，可見這道料理多麼受到日本人喜愛。然而正因為烤雞肉串相當普遍，也因 …

306F 164推 9噓
+21 [M.D.] 2024 Dec DC 主流(?)牌組的對戰相性 - YUGIOH 板

作者: KotoriCute 36.232.162.102 (台灣) 2024-12-26 12:20:26

62F 21推
+5 [情報] 幻塔國際服營運由騰訊變更為完美世界 - C_Chat 板

作者: KotoriCute 36.232.162.102 (台灣) 2024-12-25 23:48:41

7F 5推
+14 [M.D.] ROTK DC前百上餅圖 - YUGIOH 板

作者: KotoriCute 223.138.130.223 (台灣) 2024-12-25 15:23:35

47F 14推

點此顯示更多發文記錄

分享網址: 複製

DispBBS

回到看板(←)《Z_sports》

r)回覆 e)編輯 d)刪除 M)收藏 ^x)轉錄同主題: =)首篇 [)上篇 ])下篇

回列表(←) 分享