<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達Blackwell平臺網絡配置分析

智能計算芯世界 ? 來源:智能計算芯世界 ? 2024-04-17 11:01 ? 次閱讀

本文來自“英偉達Blachwell平臺網絡配置詳解”。GTC大會英偉達展示了全新的 Blackwell 平臺系列產品,包括 HGX B100 服務器、NVLINK Switch、GB200Superchip Computer Node、Quantum X800 交換機和 CX8 網卡(InfiniBand 方案)、ETH Spectrum X800 交換機和 BF3 網卡(以太網方案)。

1. Blackwell 平臺網絡配置分析

從網絡配置的角度,英偉達提供了第五代 NVLINK、第六代 PCIE、單端口800Gbit/s 的 IB 和以太網網卡、1.6T 光模塊需求。從目前英偉達公布的產品介紹看,這些升級后的網絡能力可能不會第一時間全部配置在最新的 DGX B200 服務器上,而是在后續的產品中逐步升級。從英偉達公布的產品說明材料看,DGX B200 服務器配置 8 顆 NVIDIA B200 Tensor Core GPUs,4 個 800G OSPF 光模塊,最大功耗為 14.3kW。

2 DGX GB200: NVLink domain 提升至 576 GPUs

采用 DGX GB200 系統的 NVIDIA DGX SuperPOD 專為訓練和推理萬億參數生成式AI 模型而構建。每個液冷機架配備 36 個 NVIDIA GB200 Grace Blackwell 超級芯片(36 個 NVIDIA Grace CPU 和 72 個 Blackwell GPU),與 NVIDIA NVLink 連接為一體。多個機架與 NVIDIA Quantum InfiniBand 連接,可擴展到數萬個 GB200 超級芯片。

GB200 可以在單機柜內搭建包含 36 個或者 72 個 GPU 的 NVLink domain。一個機柜內包含 18 個計算節點和 9 臺 L1 NVLink Switch?;诘谖宕?NVLink 技術,每個 NVLink 交換機可以提供 144 個 100GB NVLink 端口。通過機柜內的 9 個 L1NVLink Switch 可以合計 提 供 1296 個 100GB NVLink 端口 ,機柜 內的每 個Blackwell GPUs 可以獲得 18 個端口,合計 1.8T 的 NVLink 帶寬。

GB200 NVL72 使用了一個定制化的 Copper cable cartridge 實現機柜內 9 個L1 NV Switch 和 18 個計算節點的 NVLink 連接。英偉達介紹 NVIDIA GB200 NVL72可以在一個 NVLink domain 內連接 576 個 GPU。英偉達當前公布的 GB200 NVL72 配置了 72 個 CX7 網口(OSFP 400Gb/s InfiniBand),并沒有使用最新的 CX8 網卡。

3 全新 IB 交換機,雙層胖樹支持萬卡集群

NVIDIA Quantum-X800 Q3400-RA 是一臺 4U 的 IB 交 換機 ,對比 上一 代Quantum-9700 交換機設備尺寸提升了一倍。Quantum-X800 也是英偉達第一款使用200Gb/s-per-lane SerDes 方案的交換機設備,通過 72 個 OSPF 1.6T 光模塊提供144 個 800G 端口。英偉達指出,基于 Quantum-X800 的高性能,兩層胖樹網路拓撲就可以連接 10386 個網絡接口卡。

GTC 大會上,英偉達推出的 Spectrum-X800 SN5600 是一臺 51.2T 端口容量的以太網交換機,可以配置 64 個 OSPF 800G 光模塊。

4 新平臺依然需要 800G 和 400G 光模塊

從 GTC 大會的介紹看,BLACKWELL 平臺會帶來第五代 NVLINK、第六代 PCIE、第八代 IB 網絡應用。但是在當前早期交付的產品中依然會采用 800G 和 400G 光模塊。其中 DGX B200 服務器配置通過 4 個 800G OSPF 光模塊提供 8 個 400G 端口,這和DGX H100 服務器的配置相同。

我們認為 B200 GPU 和 800 光模塊的配置比例和 H100 GPU 保持一致。而 GB200NVL72 需要配置 72 個 OSPF 400G 光模塊,以便通過 IB 網絡實現萬卡集群的連接。

5 新的IB網絡帶來1.6T光模塊需求

NVIDIA Quantum-X800 Q3400-RA 和 CX8 NIC 則明確需要配置 1.6T 光模塊。和上一代 IB 網絡相比,主要的變化是 Quantum-X800 的端口能力提升至 115.2T,可以通過兩層胖樹拓撲實現 10386 個網絡接口卡的連接,萬卡規模 Blackwell GPU 集群使用 IB 網絡組網的成本得到優化。我們認為這會弱化以太網方案的價格優勢,提升 IB 網絡方案的競爭力。

6 NVLink domain 容量擴展帶來新增的銅纜連接需求

通過第五代 NVLINK 從 900GB 提升至 1800GB,單個 NVLINK domain 的 GPU 數量提升至 576 個。最大的變化是 L1 NV Switch 從服務器 PCB 板載芯片的形式調整為機柜內的 9 臺交換機,連接能力提升至 72 個 GPU,需要使用銅纜實現機柜內的NVLINK 連接。

而如何實現 576 個 GPU 連接,目前英偉達還沒有給出具體的連接方案,但是鑒于目前最新的 IB 交換機能力,我們認為連接 576 個 GPU 需要 L2 NV Switch。最終的方案使用銅纜還是光模塊,核心是銅纜的連接距離是否可以滿足 8 個機柜的連接需求,低成本的銅纜連接方案會是優先選項。

審核編輯:黃飛

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 以太網
    +關注

    關注

    40

    文章

    5076

    瀏覽量

    166234
  • 交換機
    +關注

    關注

    19

    文章

    2437

    瀏覽量

    95655
  • 光模塊
    +關注

    關注

    71

    文章

    1134

    瀏覽量

    58099
  • 網絡配置
    +關注

    關注

    0

    文章

    21

    瀏覽量

    7538
  • 英偉達
    +關注

    關注

    22

    文章

    3327

    瀏覽量

    87766

原文標題:英偉達Blackwell平臺網絡配置詳解

文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    英偉達發布最強AI加速卡Blackwell GB200

    英偉達在最近的GTC開發者大會上發布了其最新、最強大的AI加速卡——GB200。這款加速卡采用了新一代AI圖形處理器架構Blackwell,標志著英偉達在AI圖形處理領域邁入了一個新的里程碑。
    的頭像 發表于 03-20 11:38 ?417次閱讀

    英偉達宣布推出新一代GPU Blackwell,SK海力士已量產HBM3E

    英偉達GTC 2024大會上,英偉達CEO黃仁勛宣布推出新一代GPU Blackwell,第一款Blackwell芯片名為GB200,將于今年晚些時候上市。
    的頭像 發表于 03-20 11:32 ?456次閱讀
    <b class='flag-5'>英偉</b>達宣布推出新一代GPU <b class='flag-5'>Blackwell</b>,SK海力士已量產HBM3E

    英偉達最新一代AI芯片Blackwell GPU,AI算力能力較上代提升30倍!

    黃仁勛說:"我們已經來到了一個臨界點,因此需要一種新的計算方式來加速整個行業的發展效率。那么英偉達能夠做什么?當然,答案就是——更大的芯片?!苯又?,英偉達新一代圖形計算平臺Blackwell
    的頭像 發表于 03-19 13:39 ?503次閱讀

    英偉達攜手臺積電、新思科技,力推下一代半導體芯片制造技術

    英偉達與臺積電、 Synopsys 已做出決策,將在其軟件環境、制造工藝以及系統上整合英偉達的 cuLitho 計算光刻平臺。此舉旨在大幅提升芯片制造速率,并為英偉達即將推出的
    的頭像 發表于 03-19 11:41 ?236次閱讀

    今日看點丨英偉達發布最強 AI 加速卡--Blackwell GB200;三星面臨罷工 存儲市場供需引關注

    1. 英偉達發布最強 AI 加速卡--Blackwell GB200 ,今年發貨 ? 3 月 19 日,英偉達發布最強 AI 加速卡--Blackwell GB200,今年發貨。
    發表于 03-19 11:08 ?857次閱讀

    英偉新顯卡起售近1.3萬元

    英偉行業資訊
    深圳市浮思特科技有限公司
    發布于 :2023年12月29日 16:56:52

    英偉將在越南設法人實體

    英偉行業資訊
    深圳市浮思特科技有限公司
    發布于 :2023年12月12日 10:29:04

    英偉HBM4預計2026年推出

    英偉行業資訊
    深圳市浮思特科技有限公司
    發布于 :2023年11月27日 15:15:17

    英偉為何放不下中國?

    英偉行業資訊
    深圳市浮思特科技有限公司
    發布于 :2023年11月27日 15:11:09

    #英偉 #顯卡 英偉全新旗艦顯卡RTX 5090性能暴漲70%

    顯卡英偉
    深圳市浮思特科技有限公司
    發布于 :2023年11月20日 14:19:25

    #消費級顯示被禁止出口 英偉RTX 4090顯卡遭遇下架風波

    英偉
    深圳市浮思特科技有限公司
    發布于 :2023年10月19日 15:58:35

    英偉達AI芯片將迎重大變革:Blackwell B100 GPU采用Chiplet設計

    到目前為止,英偉達已經證明業界不使用Chiplet也能發展,英偉達的hopper和ada lovelace gpu在提供公司歷史上最高的瓦糖性能和最高收益方面非常卓越。但是,從布萊克威爾(blackwell)開始,我們將會看到
    的頭像 發表于 09-19 14:36 ?1017次閱讀

    00032 Jetson TX2 NX開發者套件!TX2的性能,NANO的尺寸! #英偉 #jetson

    英偉
    學習電子知識
    發布于 :2023年07月02日 13:21:19

    聯發科回應結盟英偉合攻 Arm 架構芯片傳聞

    外界推測英偉將與聯發科共同宣布雙方在 Arm PC 相關芯片的合作,但聯發科發布公告表示,這個傳聞純屬外界猜測,聯發科不做任何評論。 外界認為,根據聯發科的活動邀請函內容來看,將展示該公司產品在智能生活、移動通信、車用電子三領域的先進技術應用,持續朝向跨領域、跨
    發表于 05-28 08:47
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>