<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

傳統用于數字設計的CPU是否已經達到了容量極限?

傅里葉的貓 ? 來源:傅里葉的貓 ? 2024-04-17 10:11 ? 次閱讀

本文翻譯自Synopsys的官方文章:

在數字設計的Implementation過程中,從RTL到GDSII的每一步都是高度計算密集型的。在SoC層面,為了最小化互連的延遲,我們需要評估數百個partition的各種布局方案。一旦確定了布局方案,接下來就是進行每個partition內的其余步驟,以實現全芯片的implementation和signoff。由于每一步的計算需求已經很高,并且還要乘以partition的數量,這就引發了一個問題:傳統用于數字設計的CPU是否已經達到了容量極限?GPU是否能夠滿足計算需求?

如今,GPU以其處理人工智能、機器學習、游戲和高性能計算等要求最為苛刻的工作負載而聞名。隨著芯片越來越大、越來越復雜,也許也是時候考慮用GPU來完成數字芯片設計的Implementation了。

CPU在EDA工作負載中的容量挑戰

CPU長期以來被認為是計算機的“大腦”。擁有數十億個晶體管和多個處理核心,如今的CPU非常適合完成廣泛的任務,并且能夠快速完成。另一方面,GPU最初是為特定目的設計的,但隨著時間的推移,它們也轉變為通用的并行處理器。

一般來講,EDA工具都是在基于x86處理器的CPU上運行的。然而,隨著多芯片設計等復雜架構變得越來越普遍,我們正在接近CPU計算容量的限制??紤]到芯片設計團隊始終面臨的上市時間壓力,利用額外的工具和技術來加速芯片設計過程的任何方面都是有意義的。在驗證和分析方面,新思科技的PrimeSim和VCS仿真流程已經從GPU加速中受益。雖然數字設計流程中的每個任務并不是都非常適合GPU,但有些任務確實可以加速。

最先進的高性能數據中心x86 CPU核心平均有64到128個核心,每個box最多約有200個核心。需要更多核心的任務需要分布在許多box上;如果網絡不夠快,這會產生一些開銷。RTL到GDSII流程和優化技術包含許多相互依賴性。為了使流程中的每個任務能夠成功并行執行,作業分布在CPU box之間的數據共享必須非??焖?,延遲要小。然而,實際上,網絡延遲會妨礙周轉時間,使得完整的RTL到GDSII流程的分布式并行化變得不那么有吸引力。

另一方面,GPU核心可以輕松擴展。每個核心執行的操作更少,而且非常微小,以至于你可以在一個插座中擁有數萬個核心,以提供巨大的處理能力,同時保持可管理的占用空間。能夠從大規模并行性中受益的任務非常適合GPU。然而,這樣的任務也必須是主要單向的,因為任何決策和迭代都會減慢進程和/或需要回到CPU進行“如果那么”決策。這排除了許多RTL到GDSII數字implementation流程中的任務,盡管并非所有任務都不適合。

使用GPU加速加快布局過程

在數字設計流程中,自動布局是已經展示出在GPU上運行前景的一項任務。在商業環境中運行的原型中,新思科技的Fusion Compiler GPU加速布局技術相比CPU,已經展示出顯著的周轉時間優勢:

使用GPU放置一個3nm GPU流處理器設計,包含1.4M個可放置的標準單元和20個可放置的硬宏,僅需38秒,相比之下,CPU驅動的布局需要13分鐘

使用GPU放置一個12nm汽車CPU設計,包含2.9M個可放置的標準單元和200個可放置的硬宏,僅需82秒,相比之下,CPU驅動的布局需要19分鐘

結合新思科技DSO.ai的AI驅動自動設計空間優化,我們預計將在相同的完成時間線上將AI驅動的搜索空間擴大15倍到20倍。這樣做可以使設計團隊實現更好的功耗、性能和面積(PPA)結果。

在許多方面,由于對最終設計PPA的高影響,布局和 floorplanning 是涉及最廣泛探索的implementation步驟。我們可以想象,即使GPU計算資源通常與強大的CPU計算集群分開,單個designer使用基于GPU的布局技術也能具有很高的生產力。然而,在RTL到GDSII 的implementation流程的其余部分中,通過CPU和GPU集群之間移動設計數據引入的延遲可能會限制吞吐量優勢。

新的數據中心SoC正在設計中,CPU和GPU資源之間具有統一內存,用于TB級工作負載。這些新興架構消除了利用GPU加速所需的設計數據移動,并將允許我們考慮在數字設計流程中應用GPU加速的其他位置,特別是當設計師可以將GPU與AI驅動的implementation工具配對時,可以進行更快、更廣泛的探索和更好的結果。隨著像新思科技.ai這樣的AI驅動的全棧EDA流程解決方案產生更好的PPA結果、更快的達到目標時間和更高的工程生產力,人們只能想象GPU加速的加入將如何進一步改變芯片設計。

總結

雖然芯片設計過程中的仿真部分對于在GPU上運行并不陌生,但很快數字設計流程的各個方面也將有機會利用GPU加速。對于大型芯片或復雜架構(如多芯片設計),CPU在運行RTL到GDSII流程時所需的計算容量正在耗盡,無法達到期望的速度。憑借其可擴展性和處理能力,GPU有可能提供更快的周轉時間和更好的芯片結果。使用GPU驅動的放置器進行的原型實驗已經將布局速度提高了多達20倍。隨著AI集成到EDA流程中,加入GPU可以形成一個強大的組合,以提高PPA(功耗、性能和面積)和上市時間。



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片設計
    +關注

    關注

    15

    文章

    937

    瀏覽量

    54474
  • 人工智能
    +關注

    關注

    1780

    文章

    44671

    瀏覽量

    231489
  • RTL
    RTL
    +關注

    關注

    1

    文章

    382

    瀏覽量

    59186
  • 機器學習
    +關注

    關注

    66

    文章

    8176

    瀏覽量

    130993
  • GPU芯片
    +關注

    關注

    1

    文章

    303

    瀏覽量

    5697

原文標題:GPU可以加速芯片設計的Implementaion嗎?

文章出處:【微信號:傅里葉的貓,微信公眾號:傅里葉的貓】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    超級電容的容量達到多少?超級電容的容量有多大?

    超級電容器的容量是其一個關鍵的技術參數,直接影響著其在各種應用中的性能表現。
    的頭像 發表于 04-15 16:44 ?510次閱讀

    如何判斷stm8s207是否已經運行?

    手里有一塊掃地機的板子出現故障了,板子有一個芯片是stm8s207,用于按鍵和指示燈控制的,有故障燈一直閃,按鍵沒有反應;不知道這stm8s芯片是否已經運行,怎么判斷?謝謝大家
    發表于 04-03 07:58

    什么是輸出極限電流?怎么測試電源模塊的輸出極限電流?

    輸出電流極限測試是測試電源模塊在輸出限流點放開(PFC的過流保護也要放開)后所能輸出的最大電流。目的是檢測電源模塊的限流點是否設計合理,器件選擇是否合適。如果電源模塊輸出電流極限值較小
    的頭像 發表于 03-29 13:49 ?251次閱讀

    LTM4644 SS管腳接地,是否可以達到禁止該通道輸出的目的?

    手冊中表示,SS管腳的對地電容可以調整上電時間。問:SS管腳接地,是否可以達到禁止該通道輸出的目的? 因為我的板子已經生產完成RUN引腳上拉值高電平,并且無法割線修改為下拉來禁止該路輸出。想要通過SS管腳接地來
    發表于 01-05 12:25

    交流電機的堵轉轉矩是否為電機的轉矩極限?

    交流電機的堵轉轉矩是否為電機的轉矩極限,此時,電機輸出功率如何計算,是否為電機最大功率
    發表于 12-12 07:17

    計算光學成像如何突破傳統光學成像極限

    傳統光學成像建立在幾何光學基礎上,借鑒人眼視覺“所見即所得”的原理,而忽略了諸多光學高維信息。當前傳統光學成像在硬件功能、成像性能方面接近物理極限,在眾多領域已無法滿足應用需求。
    發表于 11-17 17:08 ?301次閱讀
    計算光學成像如何突破<b class='flag-5'>傳統</b>光學成像<b class='flag-5'>極限</b>

    怎樣才能在有限的容量下發揮電池的極限續航能力

    電子發燒友網站提供《怎樣才能在有限的容量下發揮電池的極限續航能力.doc》資料免費下載
    發表于 11-14 14:38 ?0次下載
    怎樣才能在有限的<b class='flag-5'>容量</b>下發揮電池的<b class='flag-5'>極限</b>續航能力

    傳統企業數字化轉型都要面臨哪些挑戰?

    數字化轉型已經成為傳統企業發展的必經之路,但在這個過程中,企業往往會遭遇多方面的挑戰。
    的頭像 發表于 11-10 11:00 ?503次閱讀

    如何選擇諧振桿的尺寸使功率容量達到最佳?

    如何選擇諧振桿的尺寸使功率容量達到最佳? 諧振桿是一種傳輸電力的裝置,它在高壓電網中起著重要的作用。諧振桿的功率容量是指它能夠傳輸的最大功率,因此,選擇適合的諧振桿尺寸以達到最佳功率
    的頭像 發表于 10-30 11:01 ?302次閱讀

    求助,內存地址空間是否一定大于所有物理存儲器的容量?

    內存地址空間是否一定大于所有物理存儲器的容量?
    發表于 10-17 07:14

    TenstorrentInc首席CPU構架師 練維漢:助力數字化升級的RISC-V AI 高性能CPU

    (電子發燒友網 張迎輝)在2023年8月28日上海臨港舉行的第三屆滴水湖中國RISC-V產業論壇上,主辦方特別邀請到了高性能 RISC-V AI芯片公司Tenstorrent Inc首席CPU構架
    的頭像 發表于 08-28 12:05 ?2728次閱讀
    TenstorrentInc首席<b class='flag-5'>CPU</b>構架師 練維漢:助力<b class='flag-5'>數字</b>化升級的RISC-V AI 高性能<b class='flag-5'>CPU</b>

    MCU內置的12位ADC是否可以直接用于額溫槍方案嗎?

    MCU內置的12位ADC是否可以直接用于額溫槍方案?答案:可以的,而且完全能達到國家對紅外溫度計的相關標準要求。疫情期間,除口罩外,快速測溫的額溫槍也成為搶手貨,各種優秀的額溫槍方案不斷出現。
    的頭像 發表于 08-17 16:43 ?535次閱讀
    MCU內置的12位ADC<b class='flag-5'>是否</b>可以直接<b class='flag-5'>用于</b>額溫槍方案嗎?

    用于 RX140 CPU 板原理圖的 Renesas 入門套件

    用于 RX140 CPU 板原理圖的 Renesas 入門套件
    發表于 07-03 19:52 ?0次下載
    <b class='flag-5'>用于</b> RX140 <b class='flag-5'>CPU</b> 板原理圖的 Renesas 入門套件

    用于 3803L CPU 板原理圖的 Renesas 入門套件

    用于 3803L CPU 板原理圖的 Renesas 入門套件
    發表于 06-27 20:08 ?0次下載
    <b class='flag-5'>用于</b> 3803L <b class='flag-5'>CPU</b> 板原理圖的 Renesas 入門套件

    為什么氮化鎵(GaN)很重要?

    氮化鎵(GaN)的重要性日益凸顯,增加。因為它與傳統的硅技術相比,不僅性能優異,應用范圍廣泛,而且還能有效減少能量損耗和空間的占用。在一些研發和應用中,傳統硅器件在能量轉換方面,已經達到了
    發表于 06-15 15:47
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>