<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

GPU競爭壁壘:微架構和平臺生態

架構師技術聯盟 ? 來源:架構師技術聯盟 ? 2023-05-15 11:00 ? 次閱讀

據Global Market Insights 數據,全球 GPU 市場預計將以 CAGR 25.9%持續增長,至 2030 年達到 4000 億美元規模。其中 AI 領域大語言模型的持續推出以及參數量的不斷增長有望驅動模型訓練端、推理端 GPU 需求快速增長。

近年來,國產 GPU 廠商在圖形渲染 GPU 和高性能計算 GPGPU 領域上均推出了較為成熟的產品,在性能上不斷追趕行業主流產品,在特定領域達到業界一流水平。生態方面國產廠商大多兼容英偉達 CUDA,融入大生態進而實現客戶端不斷導入。在高端GPU 芯片進口受限的背景下,國產 GPU 廠商預計將乘政策東風,抓住國產替代契機快速成長。

a0f44268-f251-11ed-90ce-dac502259ad0.png

GPU(圖形處理器)最初是為了解決 CPU 在圖形處理領域性能不足的問題而誕生。CPU 作為核心控制計算單元,高速緩沖存儲器(Cache)、控制單元(Control)在 CPU 硬件架構設計中所占比例較大,主要為實現低延遲和處理單位內核性能要求較高的工作而存在,而計算單元(ALU)所占比例較小,這使得 CPU 的大規模并行計算表現不佳。GPU 架構內主要為計算單元,采用極簡的流水線進行設計,適合處理高度線程化、相對簡單的并行計算,在圖像渲染等涉及大量重復運算的領域擁有更強運算能力。 GPGPU脫胎于GPU,通用性提升

a0ff6404-f251-11ed-90ce-dac502259ad0.png

CPU+GPU 異構計算解決多元化計算需求

a10960ee-f251-11ed-90ce-dac502259ad0.png

大語言模型開啟 AI 元年

a110f944-f251-11ed-90ce-dac502259ad0.png

常見的AI 加速芯片主要為GPU、FPGAASIC

a11ae1ac-f251-11ed-90ce-dac502259ad0.png

大語言模型有望拉動 GPU 需求增量

a12385d2-f251-11ed-90ce-dac502259ad0.png

a12faf6a-f251-11ed-90ce-dac502259ad0.png

GPU 的微架構是用以實現指令執行的硬件電路結構設計 以 Nvidia 第一個實現統一著色器模型的 Tesla 微架構為例,從頂層 Host Interface 接受來自 CPU 的數據,藉由 Vertex(頂點)、Pixel(片元)、Compute(計算著色器)分發給各 TPC(Texture Processing Clusters 紋理處理集群)進行處理。

a13a875a-f251-11ed-90ce-dac502259ad0.png

流處理器、特殊函數計算單元構成計算核心 在單個 TPC 中主要的運算結構為SM(Streaming Multiprocessor 流式多處理器),其內在蘊含 I Cache(指令緩存)、C Cache(常量緩存)以及核心的計算單元 SP(Streaming Processor 流處理器)和 SFU(Special Function Unit 特殊函數計算單元),外加 Texture Unit(紋理單元)。

a1467a60-f251-11ed-90ce-dac502259ad0.png

解耦計算單元,擁抱通用計算 由于圖形渲染流管線相對固定,Nvidia 在 Tesla構中將部分重要環節剝離并實現可編程,解耦出 SM 計算單元用于通用計算,即可實現根據具體任務需要分配相應線程實現通用計算處理。

a14f464a-f251-11ed-90ce-dac502259ad0.png

計算核心、紋理單元增加, GPC 功能更加完整,Nvidia Fermi 架構奠定完整GPU 計算架構基礎。

a1596788-f251-11ed-90ce-dac502259ad0.png

在Tesla 之后,Nvidia 第一個完整的 GPU 計算架構 Fermi通過制程微縮增加更多計算核心、紋理單元,并且通過增加 PolyMorph Engine(多形體引擎)和 Raster Engine(光柵引擎)使得原來 TPC 升級成為擁有更加完整功能的 GPC(Graphics Processing Clusters 圖形處理器集群)。Fermi 架構共包含 4 個 GPC,16 個 SM,512 個CUDA Core。

英偉達GPU從最初 Fermi 架構到最新的 Ampere 架構和 Hopper 架構

a166f9f2-f251-11ed-90ce-dac502259ad0.png

每一階段都在性能和能效比方面得到提升,引入了新技術,如 CUDA、GPUBoost、RT 核心和 Tensor 核心等,在圖形渲染、科學計算和深度學習等領域發揮重要作用。最新一代 Hopper 架構在 2022 年 3 月推出,旨在加速 AI 模型訓練,使用 Hopper Tensor Core 進行 FP8 和 FP16 的混合精度計算,以大幅加速Transformer 模型的 AI 計算。與上一代相比,Hopper 還將 TF32、FP64、FP16 和INT8 精度的每秒浮點運算(FLOPS)提高了 3 倍。

AMD 作為全球第二大GPU廠商,亦通過持續的架構演進保持其市場領先地位

a16fa23c-f251-11ed-90ce-dac502259ad0.png

從2010年以來,AMD 相繼推出:GCN 架構、RDNA 架構、RDNA 2 架構、RDNA 3 架構、CDNA 架構和 CDNA 2 架構。最新一代面向高性能計算和人工智能 CDNA 2 架構于架構采用增強型 Matrix Core 技術,支持更廣泛的數據型和應用,針對高性能計算工作負載帶來全速率雙精度和全新 FP64 矩陣運算?;?CDNA2 架構的 AMD Instinct MI250X GPU FP64 雙精度運算算力最高可達 95.7 TFLOPs。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    27

    文章

    4478

    瀏覽量

    127185
  • 微架構
    +關注

    關注

    0

    文章

    20

    瀏覽量

    7003

原文標題:GPU競爭壁壘:微架構和平臺生態

文章出處:【微信號:架構師技術聯盟,微信公眾號:架構師技術聯盟】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    實錘!騰訊終于擁抱鴻蒙生態,信鴻蒙原生版本即將上線

    大家都知道, 目前已知純血鴻蒙星河版next將于今年6月份開啟Bate版本的測試 ,也就是說原生鴻蒙系統快上線了。 而目前對于鴻蒙生態的發展,大家最關心的恐怕只有騰訊系的信和QQ是否適配了純血鴻蒙
    發表于 04-30 21:14

    FPGA在深度學習應用中或將取代GPU

    將 AI 框架模型映射到硬件架構。 Larzul 的公司 Mipsology 希望通過 Zebra 來彌合這一差距。Zebra 是一種軟件平臺,開發者可以輕松地將深度學習代碼移植到 FPGA 硬件上
    發表于 03-21 15:19

    GPU技術、生態及算力分析

    對比AMD從2013年開始建設GPU生態,近10年時間后用于通用計算的ROCm開放式軟件平臺才逐步有影響力,且還是在兼容CUDA的基礎上。因此我們認為國內廠商在軟件和生態層面與英偉達C
    的頭像 發表于 01-14 10:06 ?660次閱讀
    <b class='flag-5'>GPU</b>技術、<b class='flag-5'>生態</b>及算力分析

    深入解讀AMD最新GPU架構

    GCN 取代了 Terascale,并強調 GPGPU 和圖形應用程序的一致性能。然后,AMD 將其 GPU 架構開發分為單獨的 CDNA 和 RDNA 線路,分別專門用于計算和圖形。
    發表于 01-08 10:12 ?607次閱讀
    深入解讀AMD最新<b class='flag-5'>GPU</b><b class='flag-5'>架構</b>

    揭秘GPU: 高端GPU架構設計的挑戰

    在計算領域,GPU(圖形處理單元)一直是性能飛躍的代表。眾所周知,高端GPU的設計充滿了挑戰。GPU架構創新,為軟件承接大模型訓練和推理場景的人工智能計算提供了持續提升的硬件基礎。
    的頭像 發表于 12-21 08:28 ?532次閱讀
    揭秘<b class='flag-5'>GPU</b>: 高端<b class='flag-5'>GPU</b><b class='flag-5'>架構</b>設計的挑戰

    上海站報名啟動! 2023年開源產業生態大會OpenHarmony生態分論壇

    ,目標是面向全場景、全連接、全智能時代、基于開源的方式,搭建一個智能終端設備操作系統的框架和平臺,促進萬物互聯產業的繁榮發展。 開源三年以來,OpenHarmony已成為智能終端領域發展速度最快的開源
    發表于 11-24 14:55

    NVIDIA GPU的核心架構架構演進

    在探討 NVIDIA GPU 架構之前,我們先來了解一些相關的基本知識。GPU 的概念,是由 NVIDIA 公司在 1999 年發布 Geforce256 圖形處理芯片時首先提出,從此 NVIDIA
    發表于 11-21 09:40 ?540次閱讀
    NVIDIA <b class='flag-5'>GPU</b>的核心<b class='flag-5'>架構</b>及<b class='flag-5'>架構</b>演進

    陳海波:OpenHarmony技術領先,產學研深度協同,生態蓬勃發展

    。 根深葉茂,OpenHarmony四大技術架構競爭力領先,生態蓬勃發展 OpenHarmony以“面向萬物智聯世界,構建分布式全場景協同的開源操作系統基座與生態系統”為技術愿景,秉
    發表于 11-06 14:35

    生態建設的管中一窺:Intel的AI時代生態布局

    :企業需要花費成倍的人力物力,到開發工具、中間件,及生態培養工作中;則伴隨市場競爭加劇及成本大幅增加,市場必然面臨大量參與者的離席。 早年的CPU、圖形GPU市場競爭如此,現在的AI芯
    的頭像 發表于 10-30 11:19 ?454次閱讀
    <b class='flag-5'>生態</b>建設的管中一窺:Intel的AI時代<b class='flag-5'>生態</b>布局

    Versal ACAP硬件、IP和平臺開發方法指南

    電子發燒友網站提供《Versal ACAP硬件、IP和平臺開發方法指南.pdf》資料免費下載
    發表于 09-13 15:24 ?0次下載
    Versal ACAP硬件、IP<b class='flag-5'>和平臺</b>開發方法指南

    Arm Mali? GPU OpenCL開發者指南

    Arm?生產馬里家庭? GPU。Bifrost、Valhall和第五代是馬里的三個? GPU架構。 馬里? GPU并行運行包含相對較少控制代碼的數據處理任務。馬里?
    發表于 08-10 07:47

    基于磁貼的GPU架構優缺點

    本指南介紹了基于磁貼的GPU架構的優缺點。它還將ARM馬里基于瓷磚的GPU架構設計與臺式PC或控制臺中常見的更傳統的即時模式GPU進行了比較
    發表于 08-02 12:54

    NVIDIA RTX平臺及Turing GPU架構榮獲美國先進影像協會技術獎

    NVIDIA RTX平臺及Turing GPU架構榮獲美國先進影像協會盧米埃爾技術獎
    的頭像 發表于 08-01 14:58 ?420次閱讀

    GPU架構生態研究框架(2023)

    第三,詳細拆解了NVIDIA Fermi和Hopper兩大典型微架構的具體硬件實現,在頂點處理、光柵化計算、紋理貼圖、像素處理的圖形渲染流水線上對Fermi架構進行了拆分;在指令接收、調度、分配
    的頭像 發表于 07-09 10:55 ?1372次閱讀
    <b class='flag-5'>GPU</b>微<b class='flag-5'>架構</b>及<b class='flag-5'>生態</b>研究框架(2023)

    你不了解的國產GPU,都處于什么水平?

    GPU(GPGPU)為根基,逐步涉足大模型應用,下面列舉幾家具有實力的國內GPU廠商。 登臨科技 登臨科技專注于高性能通用計算平臺的芯片研發與技術創新,致力于打造云邊端一體、軟硬件協同、訓練推理融合的前沿芯片產品
    的頭像 發表于 06-26 14:03 ?2519次閱讀
    你不了解的國產<b class='flag-5'>GPU</b>,都處于什么水平?
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>