<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

PCIe在AI加速器中的作用

新思科技 ? 來源:新思科技 ? 2023-11-18 10:36 ? 次閱讀

從線上購物時的“猜你喜歡”、到高等級自動駕駛汽車上的實時交通信息接收,再到在線視頻游戲,所有的這些都離不開人工智能(AI)加速器。AI加速器是一種高性能的并行計算設備,旨在高效處理神經網絡等AI工作負載并提供近乎實時的處理方案,從而實現一系列應用。

為了讓AI加速器有效地完成自己的工作,數據必須要以極快的速度在AI加速器(作為設備)與CPUGPU(主機)之間進行快速且低延時的移動,而實現這一切的關鍵就在于PCI Express(PCIe)高速接口。

PCIe大約每三年更新換代一次,帶寬也會隨之翻倍,而這正是我們數據驅動的數字世界所需要的。作為PCIe規范的最新版本,PCIe 6.0可提供:

每個引腳64 GT/s的數據傳輸速率

一種新的低功耗狀態,從而實現更低的功耗

經濟高效的性能

高性能的完整性和數據加密(IDE)

向后兼容前幾代

盡管PCIe過去可能通過PC上的插槽,連接顯卡和掃描儀等外圍設備,但得益于帶寬的不斷增加,PCIe的作用現在已遠不止于此。本文將詳細介紹PCIe如何滿足AI加速器的日益增長的要求。

AI無處不在,PCIe也是如此

GlobalData的數據表明,AI正在芯片組領域中迅速普及,預計到2030年,超過40%的芯片組中都將包含AI硬件。人工智能(AI)和機器學習(ML)工作負載的復雜性仍在不斷增加。事實上,AI和ML訓練模型的規模大約每隔幾個月就會翻一番。為了確保有效性,AI系統必須能在不犧牲性能或增加延遲的情況下,通過AI開發管道移動大型數據集。不妨看一看下面這些帶寬密集型工作負載示例:

4K和8K高清視頻 — 需要更多計算能力和內存

高分辨率和高動態范圍 — 實現機器視覺和實時感知

多攝像頭陣列和4D傳感 — 實現深度和運動推理

所有這些趨勢都表明,AI加速器的關鍵在于提供強大的并行計算能力,讓語音激活和高等級自動駕駛汽車等應用能夠做出近乎實時的響應。這些高性能機器既可以采用超大芯片的形式,例如用于深度學習系統的Cerebras晶圓級引擎(WSE);也可以是GPU、大規模多核標量處理器或空間加速器,通過將數十到數百個芯片組合到一起,打造出具有數百petaFLOPS處理能力的大型系統,用以處理大型神經網絡。

838cee98-8534-11ee-939d-92fbcf53809c.png

PCIe發揮著高效的橋梁作用

由于能夠處理AI和ML工作負載,AI加速器可以增強數據中心服務器中CPU的處理能力,而PCIe則充當兩者之間的橋梁。就其作用而言,PCIe具有以下優勢:

最大限度提高芯片到芯片接口的帶寬,無論是用于大規模計算陣列中的AI加速器,還是邊緣的AI加速器

提供擴展容量,以便在多個主機和多臺設備之間移動數據,因為PCIe插槽可以支持各種類型的擴展卡,包括AI加速器

支持通過多線程技術跨多個芯片并行處理工作負載

實現主機和設備之間的通用互操作性,使得能夠在系統運行時無縫添加或移除AI加速器卡

提供低功耗PCIe 6.0 L0p模式,能夠以更少的通道支持所需的數據流量,從而可以降低功耗,幫助最大限度地減少碳足跡

提供數據保密性、完整性和重發保護功能,確保傳輸中的數據免受嗅探、篡改、刪除、插入或重發數據包攻擊

要充分利用這種安全的高速接口,經驗證的PCIe物理層(PHY)和具有IDE安全性的控制器IP是關鍵,而相關的專業知識也對幫助開展相應設計至關重要。功耗和信號完整性方面的考量則突顯了專家支持的重要作用。AI加速通常需要許多高速通道。PCIe的多個通道同時切換會產生大量功耗,這使得電源完整性成為一個問題。如果在同時切換過程中出現IR壓降等問題,則不利于充分發揮全部性能。信號完整性也很重要,因為系統中在AI加速器和CPU之間傳輸的信號必須完好無損。新思科技內部擁有功耗和信號完整性方面的專家,他們能夠模擬多通道環境,指導開發者在設計芯片時將支持PCIe的PHY放置在合適位置,從而實現最佳性能。

83c3942a-8534-11ee-939d-92fbcf53809c.png

新思科技是PCIe IP和PCIe協議驗證解決方案(包括驗證IP)的行業領導者,新思科技的PCIe專家也是PCI-SIG聯盟(負責編寫PCIe總線規范)的主要貢獻者。新思科技的PCIe產品組合,以及各種具有向后兼容性的組件,包括:

新思科技PHY IP,通過自適應數字信號處理(DSP算法來優化數字均衡,以跨底板、網絡接口卡(NIC)及芯片到芯片通道實現高能效

新思科技控制器IP,具有與新思科技IDE安全IP模塊緊密集成的架構,其中包含多個接口,旨在盡可能降低延遲并提高吞吐量

新思科技驗證IP,可加速測試平臺開發,并且具有內置驗證計劃、驗證序列和功能覆蓋范圍

用于新思科技ZeBu硬件加速系統和新思科技HAPS原型系統的新思科技協議接口卡、在線和虛擬解決方案,可實現軟件驅動的系統驗證、性能分析、認證和流片前合規性測試

除了端到端PCIe IP解決方案,新思科技的IP核組合還包括內存、處理器及其他用于AI加速器的接口IP。全棧式AI驅動型電子設計自動化(EDA)套件Synopsys.ai現已搭載能夠顯著加快專用AI加速器設計的功能。在驗證方面,AI SoC需要更快的流片前硬件輔助驗證解決方案。新思科技的ZeBu Server 5和HAPS系統提供了超快且容量超大的硬件輔助驗證(HAV)系統,有助于完成各種復雜SoC設計的所有系統級驗證用例。

PCIe接下來的發展方向如何?

下一代PCIe有望達到速度驚人的2.048TB。隨著越來越多的設備和系統融入AI,任何能夠滿足AI速度需求的創新都是利好消息。對于現今和未來的AI加速器來說,不斷發展的PCIe高速接口有望與之攜手共進,讓日常生活變得更加智能。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    26659

    瀏覽量

    264328
  • 高速接口
    +關注

    關注

    1

    文章

    42

    瀏覽量

    14664
  • PCIe
    +關注

    關注

    13

    文章

    1091

    瀏覽量

    81051
  • 新思科技
    +關注

    關注

    5

    文章

    731

    瀏覽量

    50092

原文標題:AI低延遲應用,怎么缺少PCIe高速接口?

文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Hitek Systems開發基于PCIe的高性能加速器以滿足行業需求

    Hitek Systems 使用開放式 FPGA 堆棧 (OFS) 和 Agilex 7 FPGA,以開發基于最新 PCIe 的高性能加速器 (HiPrAcc),旨在滿足網絡、計算和高容量存儲應用的需求。
    的頭像 發表于 03-22 14:02 ?179次閱讀
    Hitek Systems開發基于<b class='flag-5'>PCIe</b>的高性能<b class='flag-5'>加速器</b>以滿足行業需求

    粒子加速器加速原理是啥呢?

    粒子加速器加速原理是啥呢? 粒子加速器是一種重要的實驗設備,用于研究粒子物理學、核物理學等領域。其主要原理是通過電場和磁場的作用,對帶電粒子進行
    的頭像 發表于 12-18 13:52 ?1019次閱讀

    CCES環境下如何使用21489的IIR加速器?

    VDSP++的環境下程序已經實現,但是到了CCES下,把中斷初始化函數修改了,還是無法正確配置中斷,直接返回IIR的中斷初始化失敗,請問CCES下怎么使用IIR加速器?
    發表于 11-30 08:20

    21489的IIR加速器濾波參數設置如何對應加速器的濾波參數?

    目前在用21489內部的IIR加速器去做一個低通濾波,例程的基礎上修改參數。通過平板的fda 工具工具去設計參數,但是設計出來的參數不知道如何對應加速器的濾波參數,手冊里也看得不是
    發表于 11-30 08:11

    低功耗下,高能效AI加速器如何設計?

    如果在數據中心和邊緣設備中部署上人工智能(AI加速器,那么它們將能夠快速處理PB級的數據量,還能幫助克服傳統的馮·諾依曼瓶頸。
    的頭像 發表于 10-26 09:18 ?909次閱讀

    AI加速器架構設計與實現》+第2章的閱讀概括

    首先感謝電子發燒友論壇提供的書籍和閱讀評測的機會。 拿到書,先看一下封面介紹。這本書的中文名是《AI加速器架構設計與實現》,英文名是Accelerator Based on CNN Design
    發表于 09-17 16:39

    AI加速器架構設計與實現》+學習和一些思考

    AI加速器設計的學習和一些思考 致謝 首先感謝電子發燒友論壇提供的書籍 然后為該書打個廣告吧,32K的幅面,非常小巧方便,全彩印刷,質量精良,很有質感。 前言 設計神經網絡首先要考慮的幾個問題
    發表于 09-16 11:11

    Rapanda流加速器-實時流式FPGA加速器解決方案

    電子發燒友網站提供《Rapanda流加速器-實時流式FPGA加速器解決方案.pdf》資料免費下載
    發表于 09-13 10:17 ?0次下載
    Rapanda流<b class='flag-5'>加速器</b>-實時流式FPGA<b class='flag-5'>加速器</b>解決方案

    AI加速器架構設計與實現》+第一章卷積神經網絡觀后感

    AI加速器架構設計與實現》+第一章卷積神經網絡觀感 ? ?本書的引言中也提到“一圖勝千言”,讀完第一章節后,對其進行了一些歸納(如圖1),第一章對常見的神經網絡結構進行了介紹,舉例了一些結構
    發表于 09-11 20:34

    華秋硬創聯合安創加速器,加速和創新賦能技術驅動型創業者

    區定制創新方案,助力科技加速與產業升級;注重本土產業與國際市場的合作,通過全球化布局幫助國外先進技術國內落地,以及國內項目在國外推廣和落地。 權益介紹 為助力第九屆中國硬件創新創客大賽,安創加速器將為
    發表于 08-18 14:37

    Intel媒體加速器參考軟件用戶指南

    英特爾媒體加速器參考軟件是用于數字標志、交互式白板(IWBs)和亭位使用模型的參考媒體播放應用軟件,它利用固定功能硬件加速來提高媒體流速、改進工作量平衡和資源利用,以及定制的圖形處理股(GPU)管道解決方案。該用戶指南將介紹和
    發表于 08-04 07:07

    英特爾媒體加速器參考軟件發行說明

    使用 Linux* 版本的這些發布注釋來審查 Intel 媒體加速器參考軟件的最新修改和改進。 您將會發現PDF 的最新功能、 最著名的配置、 硬件和軟件兼容性以及已知問題 。
    發表于 08-04 06:57

    【書籍評測活動NO.18】 AI加速器架構設計與實現

    后2個星期內提交不少于一篇試讀報告要求300字以上圖文并茂。4、試讀報告發表電子發燒友論壇>> 社區活動專版標題名稱必須包含《 AI加速器架構設計與實現》+自擬標題 注1
    發表于 07-28 10:50

    數據中心 AI 加速器:當前一代和下一代

    數據中心 AI 加速器:當前一代和下一代演講ppt分享
    發表于 07-14 17:15 ?0次下載

    AI和數據中心:PCIe 6.0,你是懂加速

    要想享受最新的800G以太網的聯網速度,就需要與之匹配的串行總線接口。同理,數據中心固態驅動器(SSD)和AI應用中使用的加速器也對傳輸速度有很高的需求。這就是為什么PCI Express(PCIe
    的頭像 發表于 07-12 17:50 ?1305次閱讀
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>