<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

探究GDDR6給FPGA帶來的大帶寬存儲優勢以及性能測試(上)

Achronix ? 來源:Achronix ? 作者:黃侖 ? 2021-12-03 11:31 ? 次閱讀

1.概述

隨著互聯網時代的到來,人類所產生的數據發生了前所未有的、爆炸性的增長。IDC預測,全球數據總量將從2019年的45ZB增長到2025年的175ZB[1]。同時,全球數據中近30%將需要實時處理,因而帶來了對FPGA硬件數據處理加速器的需求。如圖1所示。

在這樣的數據高速增長的情況下,用于傳輸數據的網絡帶寬和處理數據所需要的算力也必須急速增長。傳統的CPU已經越來越不堪重負,所以用硬件加速來減輕CPU的負擔是滿足未來性能需求的重要發展方向。未來的硬件發展需求對于用于加速的硬件平臺提出了越來越高的要求,可以概括為三個方面:算力、數據傳輸帶寬和存儲器帶寬。Achronix的新一代采用臺積電7nm工藝的Speedster 7t FPGA芯片根據未來硬件加速和網絡加速的需求,在這三個方面都做了優化,消除了傳統FPGA的瓶頸。下面我們重點說一說為了提高存儲器帶寬,Achronix通過采用硬核GDDR6控制器所帶來的優勢。2.

GDDR6的發展

在GDDR的設計之初,其定位是針對圖形顯示卡所特別優化的一種DDR內存。因為2000年后電腦游戲特別是3D游戲的發展和火爆,使運行電腦游戲的顯卡需要有大量的高速圖像數據交互需求,GDDR在這種情況下應運而生。第一個GDDR標準是基于DDR的GDDR2,隨后發展到了基于DDR3的GDDR5,在一段時間中非常流行。

2016年,GDDR5X正式發布,它引入了具有16n預取的四倍數據速率模式,但代價是訪問粒度從GDDR5的32Byte提高到了64Byte。2018年,GDDR6發布,數據速率達到了16Gbps,帶寬幾乎是GDDR5X的兩倍,同時采用了雙通道設計,訪問粒度和GDDR5一樣是32Byte。

3.GDDR6和DDR4/5的比較

GDDR一直以來是針對圖形顯示卡所優化的一種DDR內存。因為顯卡處理圖像數據,特別是3D圖像數據對顯存帶寬的要求更高,GPU和GDDR之間的數據交換非常頻繁。而DDR內存專注于與CPU進行數據交換的效率,因此對于整體存取性能、低延遲更為看重,所以在CPU和傳統的FPGA中基本都是用DDR4。

隨著硬件加速需求對于存儲器的帶寬提出了越來越高的要求,傳統的DDR4帶寬顯然已經無法滿足要求,Achronix看重了GDDR6在數據存儲中的帶寬優勢,創新地將GDDR6引入到了FPGA,徹底解決了傳統FPGA存儲帶寬不夠的瓶頸。2020年7月15日,JEDEC存儲協會正式發布了DDR5 SDRAM的標準(JESD79-5),內存的頻率相對DDR4的標準頻率有了大幅的提升,總傳輸帶寬也提升了38%,但是還是和GDDR6的帶寬有一定的差距。GDDR6和DDR4/5的帶寬對比。

473c6de8-52b8-11ec-b2e9-dac502259ad0.png

圖2 GDDR與DDR帶寬發展對比

如果實現同一個大帶寬存儲的應用,在提供相同的存儲器帶寬的情況下,無論在設計復雜度,PCB占用面積,還是在功耗方面,與DDR4相比,GDDR6的性能都有很大的提高,如圖3所示[2]。

476b1eae-52b8-11ec-b2e9-dac502259ad0.png

圖3 GDDR6和DDR4性能對比4.

GDDR6和HBM2的比較

HBM全稱High Bandwidth Memory,最初的標準是由JEDEC在2013年發布。2016年1月,HBM的第二代HBM2正式成為工業標準。HBM的出現也是為了解決存儲器帶寬問題。與GDDR6不同的是,HBM內存一般是由4個或者8個HBM的Die堆疊形成,我們稱之為一個Stack。如圖4所示[4]。

4793243a-52b8-11ec-b2e9-dac502259ad0.png

圖4 HBM Die的堆疊

我們以市面上帶有HBM2的高端 FPGA為例,這個系列的FPGA集成了1~2個這樣的HBM2 Stack。兩個Stack之間是相互獨立的,各自有自己的地址空間。

每個Die都有獨立的兩個128bit的Channel,所以4個Die 8個通道就是1024bit的位寬,HBM2的頻率是900MHz,按DDR的方式訪問,一個Stack總共帶寬是 900(MHz)x 2(DDR)x 1024(位寬)/8 = 230GB/s,兩個Stack最高可以到460GB/s的帶寬。

Achronix的Speedster 7t FPGA集成了8個GDDR6的硬核,每個GDDR6的硬核支持雙通道??偟膸捠?16Gbps x 16(位寬)x 2(通道)x 8(控制器)/8 = 512 GB/s,略高于帶HBM2的FPGA存儲器帶寬。

從成本上來看,目前GDDR6與HBM2相比有著很大的優勢,HBM2技術工藝要求高,目前芯片的良率和產量都會受到很大的影響。同時GDDR6使用起來更靈活,使用片外的DRAM,可以根據應用要求,選擇不同速率,不同容量的GDDR6顆粒。HBM2的優勢在于集成度高,不占用PCB板的面積。圖5是DDR4、GDDR6和HBM2在成本上的一個綜合比較。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1603

    文章

    21328

    瀏覽量

    593264
  • 存儲器
    +關注

    關注

    38

    文章

    7151

    瀏覽量

    162003
  • 帶寬
    +關注

    關注

    3

    文章

    818

    瀏覽量

    40146
  • HBM
    HBM
    +關注

    關注

    0

    文章

    234

    瀏覽量

    14383

原文標題:GDDR6給FPGA帶來的大帶寬存儲優勢以及性能測試(上)

文章出處:【微信號:Achronix,微信公眾號:Achronix】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    下一代高端顯卡標配,容量和速度雙翻倍的GDDR7登場!

    電子發燒友網報道(文/周凱揚)要說起GPU的話,對其性能的一部分定義在其處理單元上,比如英偉達的CUDA核心,或是AMD的CU等。然而還有一部分決定性能的因素在其片上VRAM上,這些內存不僅需要存儲
    的頭像 發表于 03-08 09:04 ?1258次閱讀
    下一代高端顯卡標配,容量和速度雙翻倍的<b class='flag-5'>GDDR</b>7登場!

    AMD RDNA4或采用GDDR6顯存,Navi 4X或Navi 4C具備216個計算單元?

    因受限 RDNA 3 世代尷尬處境,AMD 下一代 RDNA4 游戲顯卡似乎選擇避開與英偉達在旗艦級別產品上的競爭。據消息人士 Kepler 透露,AMD 下一代 RDNA4 游戲顯卡將全部采用 18Gbps 的 GDDR6 顯存,而英偉達則可能使用更強大的 GDDR7
    的頭像 發表于 04-28 14:29 ?209次閱讀

    中高端FPGA如何選擇

    為了使數據傳輸更加高效,Achronix FPGA的Memory資源也是非常力,不管是片Ram還是DDR接口,都比Virtex Ultrascale+有很大
    發表于 04-24 15:09

    Rambus推GDDR7內存控制器IP滿足AI應用需求

    據報道,該公司的 GDDR7 控制器采用 PAM3 信號,運行速度高達 40 Gbps,能為 GDDR7 存儲器設備提供 160 GB/s 的吞吐量,相比其自身研發的GDDR6 控制器
    的頭像 發表于 04-23 15:52 ?105次閱讀

    三星將展示16Gb GDDR7技術,重點關注PAM3優化TRX均衡和ZQ校準

    該款高性能的 DRAM 采用 PAM3 編碼技術,兼具 PAM4 和 NRZ 的優點,相較于 NRZ,它能夠以更高的數據傳輸率運行,且無需過高的內存總線頻率,表現優于 GDDR6,能耗及成本則低于 GDDR6X。
    的頭像 發表于 01-29 10:13 ?322次閱讀

    利用搭載全域硬2D NoC的FPGA器件去完美實現智能化所需的高帶寬低延遲計算

    在該FPGA器件的外圍,這個硬2D NoC連接到所有高速接口:包括多個400G以太網、PCIe Gen5、GDDR6和DDR4/5端口。這使得Achronix的Speedster7t成為了業界第一款
    的頭像 發表于 11-24 16:19 ?211次閱讀

    三星開發出業界首款GDDR7 DRAM顯存

    與目前的GDDR6 DRAM相比,GDDR7的每引腳帶寬從24Gbps提升至32Gbps,總帶寬可達1.5TB/s。這款新產品采用了脈沖幅度調制(PAM3)信令的方法,取代了前幾代產品
    發表于 07-24 11:09 ?219次閱讀

    【機器視覺】歡創播報 | 三星開發出業界首款GDDR7顯存

    行驗證。與目前的GDDR6 DRAM相比,GDDR7的每引腳帶寬從24Gbps提升至32Gbps,總帶寬可達1.5TB/s。這款新產品采用了脈沖幅度調制(PAM3)信令的方法,取代了前
    的頭像 發表于 07-20 11:27 ?529次閱讀
    【機器視覺】歡創播報 | 三星開發出業界首款<b class='flag-5'>GDDR</b>7顯存

    三星推出其首款GDDR7 釋放下一代顯存性能潛力

    三星最新32Gbps GDDR7將進一步強化人工智能、高性能計算和汽車等的應用能力 與上一代24Gbps GDDR6 相比,GDDR7性能
    的頭像 發表于 07-19 10:27 ?825次閱讀

    Rambus GDDR6 PHY 賦能AI服務器

    GDDR通常指的是用在顯卡上的內存,本質上還是雙倍速率同步動態隨機存儲器,它是為了設計高端顯卡而特別設計的高性能 DDR 存儲器規格,其有專屬的工作頻率、時鐘頻率、電壓,因此與市面上
    的頭像 發表于 06-26 14:41 ?311次閱讀
    Rambus <b class='flag-5'>GDDR6</b> PHY 賦能AI服務器

    緩解AI推理算力焦慮,高帶寬GDDR6成殺手锏?

    據 Rambus IP 核產品營銷高級總監 Frank Ferro 分享,AI 推理應用對帶寬的需求通常在 200 到 500Gb/s 的范圍之間波動,每一個 GDDR6 設備的帶寬都可以達到
    的頭像 發表于 06-02 15:49 ?325次閱讀
    緩解AI推理算力焦慮,高<b class='flag-5'>帶寬</b><b class='flag-5'>GDDR6</b>成殺手锏?

    Rambus提升GDDR6帶寬,以應對邊緣計算挑戰

    HBM(高帶寬內存)于 2013 年推出,是一種高性能 3D 堆疊 SDRAM架構。如其名稱所述,HBM最重要的是帶寬更高,盡管HBM的內存都以相對較低的數據速率運行,但其通道數更多。例如,以3.6
    的頭像 發表于 05-29 09:34 ?336次閱讀
    Rambus提升<b class='flag-5'>GDDR6</b><b class='flag-5'>帶寬</b>,以應對邊緣計算挑戰

    為AI推理打造高達24Gb/s的GDDR6 PHY,Rambus全面支持中國市場的AI升級

    ,但對成本和功耗更為敏感。 ? 在AI推理應用越來越多的趨勢下,Rambus率先研判與推出GDDR6 IP產品組合。Rambus IP核產品營銷高級總監Frank Ferro先生表示,作為更加理想的方案,GDDR6有著高帶寬
    的頭像 發表于 05-26 16:38 ?1200次閱讀
    為AI推理打造高達24Gb/s的<b class='flag-5'>GDDR6</b> PHY,Rambus全面支持中國市場的AI升級

    Rambus推出提升GDDR6內存接口性能的Rambus GDDR6

    憑借Rambus GDDR6 PHY所實現的新一級性能,設計人員可以為帶寬要求極為苛刻的工作負載提供所需的帶寬。和我們領先的HBM3內存接口一樣,這項最新成就表明了我們不斷致力于開發最
    的頭像 發表于 05-17 14:22 ?590次閱讀

    Rambus通過業界領先的24Gb/s GDDR6 PHY提升AI性能

    內存接口性能。Rambus GDDR6 PHY提供市場領先的數據傳輸速率,最高可達24 Gb/s,能夠為每個GDDR6內存設備帶來96 GB/s的
    發表于 05-17 13:47 ?340次閱讀
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>