<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

借助NVIDIA Aerial CUDA增強5G/6G的DU性能和工作負載整合

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 作者:NVIDIA ? 2024-05-24 11:10 ? 次閱讀

Aerial CUDA 加速無線接入網 (RAN)可加速電信工作負載,使用 CPU、GPU 和 DPU 在云原生加速計算平臺上提供更高水平的頻譜效率 (SE)。

適用于 Aerial 的 NVIDIA MGX 系統基于先進的 NVIDIA Grace Hopper 超級芯片NVIDIA Bluefield-3 DPU 構建,旨在加速 5G 端到端無線網絡

虛擬化 RAN (vRAN)分布式單元(DU)

集中式單元(CU)

用戶平面函數(UPF)

vRouter

網絡安全

這種全棧加速方法可提供領先的性能和頻譜效率,同時降低總擁有成本(TCO),并為更好的資產回報(ROA)開辟新的盈利機會。NVIDIA 6G 研究云平臺中提供了 Aerial CUDA 加速的 RAN 軟件堆棧。

電信公司已投入數十億資金購買 4G/5G 頻譜,預計他們將再次投入購買 6G 頻譜,以滿足日益增長的移動用戶需求。

該生態系統包括芯片制造商、OEM 和獨立軟件供應商(ISV),可提供具有不同性能特征的解決方案。這些解決方案主要基于專用硬件,例如專用集成電路ASIC)或系統級芯片(SoC),用于處理計算密集型第 1 層(L1)和第 2 層(L2)功能。

挑戰在于如何在 RAN 解決方案中實施算法的復雜程度與實施成本和功耗之間取得平衡。

電信公司希望能夠分解 RAN 工作負載的硬件和軟件,使其能夠在云基礎設施上構建網絡,從而為軟件創新、新的差異化服務、控制硬件生命周期管理以及提高總體擁有成本(TCO)開辟可能性。

vRAN 展示了商用現成(COTS)平臺運行 RAN 分布式單元(DU)工作負載的能力。但是,由于計算性能差距,需要加速,從而實現某些工作負載的固定功能加速,例如前向糾錯(FEC)。

在本文中,我們將討論用于 DU 工作負載加速的 Aerial CUDA 加速 RAN 的進展,詳細介紹所使用的算法和預期收益、所使用的底層硬件,以及它整合 DU、集中式單元(CU)和核心等電信工作負載以及使用多租戶功能托管創收工作負載的能力。最后,我們將探討電信公司有望實現的總體 TCO 和 ROA 優勢。

Aerial CUDA 加速 RAN

NVIDIA Aerial RAN 將適用于 5G 和 AI 框架的 Aerial 軟件與 NVIDIA 加速計算平臺相結合,幫助電信公司降低 TCO 并實現基礎設施盈利。

Aerial RAN 具有以下主要特性:

一個軟件定義、可擴展、模塊化、高度可編程和云原生的框架,無需任何固定函數加速器。它使生態系統能夠靈活地采用其商業產品所需的模塊。

DU L1、DU L2+、CU、UPF 和其他網絡功能的全棧加速,可實現工作負載整合,從而更大限度地提高性能和頻譜效率,實現出色的系統 TCO。

通用型基礎架構,具有多租戶,可支持傳統工作負載和先進的 AI 應用程序,從而實現出色的 RoA。

全棧加速

全棧加速依托如下兩個支柱:

NVIDIA Aerial 軟件,可加速 DU 功能 L1 和 L2;

支持生態系統在平臺上運行和優化 CU 或 UPF 等工作負載,并實現工作負載整合。

圖 1 顯示加速 DU L1 和 L2 是 NVIDIA 實現全棧加速的關鍵方面。

1112401621-0.png

DU 加速

Aerial 已實施先進算法,以提高 RAN 協議棧的頻譜效率,涵蓋 DU L1 和 L2。

本文中介紹的加速 L1 和 L2 功能是通過一種利用加速計算平臺內的 GPU 并行計算能力的通用方法實現的。

圖 2 顯示 MGX 服務器平臺在同一 GPU 實例上托管經加速的 L1 cuPHY 和 L2 MAC 調度程序 cuMAC,并由 CPU 托管 L2+ 堆棧。這展示了基于 GPU 的平臺在同時加速多個計算密集型工作負載方面的強大功能。

11124044A-1.png

L1 (cuPHY)

Aerial cuPHY 是 RAN 物理層 L1 的數據和控制通道的 3GPP 兼容、GPU 加速的全內聯實現。它提供 L1 高 PHY 庫,通過利用 GPU 的強大計算能力和高度并行性來處理 L1 的計算密集型部分,提供無與倫比的可擴展性。它支持標準多輸入多輸出(sMIMO)和大規模 MIMO(mMIMO)配置。

作為一種軟件實現,它支持持續增強和優化工作負載,正如 cuPHY 隨著時間推移在 AX800 加速平臺和全新 MGX 平臺上持續實現容量提升。

L1 中的信道估計是任何無線接收機中的基礎塊,優化的信道估計器可以顯著提高性能。傳統的信道估計方法包括最小平方(LS)或最小均方誤差(MMSE)。這些方法的比較總結在表 1 中。

NVIDIA 使用新的通道估計器增強了 cuPHY L1,該估計器的性能優于表 1 中列出的方法。此實現使用復制核 Hilbert 空間(RKHS)通道估計器算法。

RKHS L1 信道估計

RKHS 信道估計專注于時域信道脈沖響應(CIR)的有意義部分,可限制不必要的噪聲并放大脈沖響應的相關部分(圖 3)。

RKHS 需要復雜的計算,接近無限凸優化問題。RKHS 將這個無限凸問題轉換為有限凸問題,而不會損失任何性能。

RKHS 計算密集型,非常適合在 GPU 上進行并行處理。表 2 總結了 sMIMO 和 mMIMO 配置的 RKHS 增益和計算需求。

RKHS 計算得出的 CIR(圖 4)與實際通道(在模擬環境中測量得出)非常接近,用于具有四個天線和兩個 UL 層的分接延遲線(TDL)- C 通道模型。

在一系列調制和編碼方案(MCS)中,與信噪比(SNR)曲線相比,改進后的 CIR 顯著提高了誤碼率(BER)。圖 5 顯示了 RKHS 相對于 MMSE(具有兩個不同的窗口,1 s 和 2.3 s)的優勢,對于 MCS 15,可提供高達 2.5 dB 的增益。

L2 (cuMAC)

RAN 協議棧中的 L2 MAC 調度程序在決定 UE 如何訪問無線電資源方面發揮著重要作用。而這反過來又決定了整個網絡的頻譜效率。

對于 5G 系統,有許多自由度,包括:

傳輸時間間隔(TTI)插槽

已分配的物理資源塊(PRB)

MCS

MIMO 層選擇

典型的調度程序專注于單個單元,這會限制實現的性能。表 3 顯示了典型調度程序方法的比較。

在 NVIDIA ,我們使用比例公平(PF)算法實施了多單元調度程序,其性能優于表 3 中列出的兩種方法。

多單元調度程序

NVIDIA 多單元調度程序通過優化大量相鄰單元的調度參數(TTI、PRB、MCS 和 MIMO 層),顯著提高了無線性能(圖 6)。

使用 PF 算法的多單元調度需要復雜的計算邏輯來解決所有單元中的各種變量。這非常適合具有大規模并行處理能力的 GPU。表 4 總結了 sMIMO 和 mMIMO(聯合調度 20 個單元)的優勢和計算需求。如您所見,CPU 計算需求很高。

圖 7 顯示了 20 個 100MHz 4T4R 4DL/2UL 單元(每個單元具有 500 個活躍 UE 和 16 個 UE/TTI)的頻譜效率。

DU 綜合加速提升

總而言之,RKHS 信道估計支持每個 UE 更高的 MCS 分配,而多單元調度器代表了無線電資源調度的重大飛躍。這兩種方法都能顯著提高頻譜效率,并在 GPU 上得到優化實施。

例如,對于 6 單元的 100MHz 64T64R 系統,實現 2 倍以上的 SE 增益將需要大約 240 個核心(大約 8 個 32 核心 CPU),需要額外的 CPU 服務器。相較于 GPU 實現,其中 L1 PHY 處理和 L2 調度程序托管在單個服務器中的單個 GPU 上。

工作負載整合

如前文所述,全棧加速的第二個支柱是整合多個工作負載并在 Aerial RAN 上加速這些工作負載。這是通過利用 NVIDIA 加速計算平臺中的 GPU、CPU 和 DPU 的可用計算資源來實現的。

針對電信工作負載,MGX 系統提供針對數據中心的模塊化和可擴展架構。該系統可提供所需的計算能力,以整合 RAN CU、RAN 智能控制器(RIC)應用等功能以及 UPF 等核心功能。

NVIDIA Grace Hopper 超級芯片結合了 NVIDIA Grace 和 NVIDIA Hopper 架構,使用 NVIDIA NVLink-C2C 為 5G 和 AI 應用提供 CPU+GPU 一致性內存模型。

CU 可以利用許多 Grace CPU 核心。RIC 應用程序(例如通常包含 AI/ML 技術以提高頻譜效率的 xApp)可以在 GPU 上進行加速。

隨著我們進一步進入網絡,UPF 等功能通過使用關鍵的 DPU 功能可以從 DPU 加速中受益:

GTP 加密和解密

流哈希處理和接收端縮放(RSS)

深度數據包檢測(DPI

工作負載整合使電信公司能夠更大限度地減少部署在數據中心的服務器數量,從而全面提高 TCO。

多租戶 Aerial RAN

電信公司需要一個可以滿足電信工作負載嚴苛的性能和可靠性要求的平臺,能夠在一個通用平臺上托管不同類型的電信工作負載(從 RAN 到核心)。

電信 RAN 基礎設施的利用率明顯不足。借助多租戶云基礎設施,電信公司可以在有閑置容量時通過可盈利的應用程序提高利用率。

可以為電信公司提供盈利機會的工作負載類型包括生成式 AI 和基于大語言模型(LLM)的多接入邊緣計算(MEC)應用程序。這些類型的工作負載在分布式電信邊緣數據中心引發了前所未有的計算需求。

由于需要在邊緣支持大量基于 LLM 的應用程序,因此專用于執行 LLM 推理的邊緣 GPU 服務器和各種 MEC 應用程序正在大幅增加。

圖 9 顯示了 MGX 平臺,該平臺可以托管所有工作負載,并幫助電信公司克服計算資源利用不足的問題,減少總體能源足跡,并提高基礎設施的貨幣化程度。

共享 AI 和電信基礎設施

Aerial CUDA 加速 RAN 的優勢

到目前為止,我們已經討論了 NVIDIA Aerial 軟件如何幫助提高整體頻譜效率,以及加速計算平臺如何提供處理能力,以在同一平臺上整合多個工作負載。

多租戶平臺支持 AI 工作負載的貨幣化。5 年期 TCO 分析顯示,該平臺的可用時間約為 AI 的 30%,并考慮到典型的每小時 GPU 定價,可提供顯著抵消平臺成本的收入。與僅使用 CPU 的系統相比,此 ROA 對每美元指標的性能有重大影響。

根據條形圖顯示,與 x86 CPU 相比,采用 AI 創收的 GPU 的每成本性能提升了 4.1 倍。

結束語

總而言之,Aerial RAN 可提供出色的 TCO 并釋放新的收入機會,從而更大限度地提高投資回報率(ROA)。

NVIDIA 正在改變電信基礎設施,該基礎設施基于 NVIDIA 加速計算平臺構建,并由 Aerial 軟件提供支持。Aerial CUDA 加速的 RAN 可滿足電信公司的愿望,以 TCO 高效的方式提供市場領先的無線功能,并能夠開始以當今部署的基礎設施無法實現的方式從部署的基礎設施中獲利。

在本文中,我們詳細介紹了使用新算法在 L1 和 L2 上實現的頻譜效率提升,并討論了基于 RAN 和 LLM 的工作負載加速 AI 工作負載的能力。新一代 NVIDIA 平臺將通過提供更高的單元密度和更高的工作負載加速來進一步改進這些關鍵指標。

Aerial CUDA 加速 RAN 作為 NVIDIA 6G 研究云平臺的一部分提供。




審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 集成電路
    +關注

    關注

    5341

    文章

    10912

    瀏覽量

    355121
  • NVIDIA
    +關注

    關注

    14

    文章

    4670

    瀏覽量

    102066
  • ASIC芯片
    +關注

    關注

    2

    文章

    91

    瀏覽量

    23577
  • 超級芯片
    +關注

    關注

    0

    文章

    31

    瀏覽量

    8825
  • MIMO技術
    +關注

    關注

    0

    文章

    43

    瀏覽量

    7412

原文標題:借助 NVIDIA Aerial CUDA 加速 RAN,增強 5G/6G 的 DU 性能和工作負載整合

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    俄羅斯決定繞過5G 直接開發6G

    5G6G
    電子發燒友網官方
    發布于 :2022年07月28日 16:51:32

    什么是5G NR?

    新電臺。高通評論說,NR是一個復雜的話題,因為它涉及到一種新的基于OFDM的無線標準。圖1 5G無線接入架構由LTE演進和新的無線接入技術(NR)組成,它與LTE不向后兼容,可從1GHz到100GHz工作
    發表于 05-03 11:34

    【AD新聞】5G的基站數量是4G兩倍?國內5G的發展情況

    /NFV架構、網絡切片、MEC等技術,讓網絡更靈活,更高效,進而滿足5G需求多樣化的需求。從無線側來看,基站重構就是CU/DU高層切分和DU/AAU低層切分,讓整個網絡架構更加扁平。在5G
    發表于 08-22 10:52

    怎么在5G測試wifi性能

    我使用控制臺項目來測試兩個CYW43907 EVKS中的WiFi性能。一個是AP,另一個是STA。如果我想在AP和STA之間進行5G的測試,我應該設置命令嗎?我猜想,在StaseTap AP命令中
    發表于 11-27 11:17

    6G網絡將是什么樣子的?

    日前,工信部IMT-2020(5G)無線技術工作組組長粟欣透露6G概念研究將在今年啟動。這意味著中國與全球同步開始6G研究。除了中國,美國、俄羅斯、歐盟等國家和地區也在進行相關的概念設
    發表于 08-16 07:16

    基于OTN的5G中傳/回傳承載方案

    4G只有前傳和回傳兩部分,而5G承載網隨著RAN架構的重構,核心網云化、C/U分離、數據面分布式部署,使網絡更趨扁平化,劃分為前傳網絡、中傳網絡和回傳網絡三部分。AAU連接DU部分為5G
    發表于 07-17 17:08

    5G網絡的建設方案

    采用玻璃鋼,禁止采用金屬材質或金屬支撐架?!   D6 美化外罩場景改造方案  1.4.1.4有空余抱桿或新增抱桿空間  對于不屬于以上場景,不能通過整合改造騰出5G抱桿位。如果天面有空余抱桿或新增抱桿
    發表于 12-03 14:03

    推薦收藏:25G光互連——5G前傳篇

    :25G灰光模塊)5G前傳光纖直驅如果采用雙纖雙向方案方案,DU與AAU直接相連,每個AAU需與DU連接兩根光纖實現收發,共需使用6根光纖和
    發表于 07-08 17:01

    5G的落地現狀與未來變局 精選資料推薦

    5月17日,是中國電信日。從2G5G時代,短短幾十年間,中國就從曾經的落后迅速跨越到了如今的領跑地位。三天前,在由工信部召開的5G、6G
    發表于 07-27 07:59

    已結束-【蓋樓送書NO.56G開山之作!華為輪值董事長撰序推薦——《6G無線通信新征程》

    成立的組織,一方面使5G被定義得能夠適應這些垂直行業的獨特需求;另一方面,隨著商用化的進程,也激發出越來越多5G不能滿足的創新需求,由此催生的5.5G將能夠持續增強,但無疑又將激發出更
    發表于 08-31 11:17

    6G

    5G6G,未來的通訊將改變中國科技智能的方方面面,面對科技爆發的新時代,華為從無到有,從弱到強,引領著通訊科技前沿變革,對國家科技領域的振興和發展貢獻力了力量。了解6G也能更好的看清更遠的路,和美國發展
    發表于 09-04 09:22

    6G聯盟又開會!華為等國內通信巨頭被除名?

    微軟、高通、三星和諾基亞等等,唯獨沒有華為??上У氖?,在6G時代,老美注定要淪為陪襯!?為什么這么說呢?首先,我們先了解下什么是6G?5g之后中國能創造輝煌嗎?1、什么是6G?從1
    發表于 12-01 16:08

    5G 器件的設計與開發: 5G 性能范圍

    注意到5 g 是由幾個不同的性能級別組成的。5 g 網絡由以下部分組成:低頻帶范圍(600兆赫至3ghz)中頻范圍(3吉赫至
    發表于 04-10 21:31

    高頻微波射頻pcb板在5G6G應用下的新機遇

    ;二要進一步降低材料的損耗、提高Q值;三要探索新的、合適的材料體系,簡單地認為現有性能優異的微波介質陶瓷材料體系在太赫茲下也能表現出良好性能是不嚴謹的。微波介質陶瓷是5G/6G通信的關
    發表于 03-28 11:18

    5G網絡架構,5G中的SDR和SDN是什么?

    了前傳的負載。性能優化的要求不僅限于前傳,因為資源實例化的位置、訪問和管理都很大程度上取決于服務切片的要求。在這種情況下,基于 SDR 和SDN/NFV 的架構(圖 4)可以提供幫助。   5G 優化
    發表于 05-05 09:48
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>