<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

利用設計網關的 IP 內核在 Xilinx VCK190 評估套件上加速人工智能應用

eeDesign ? 來源:物聯網評論 ? 作者:物聯網評論 ? 2022-11-25 16:27 ? 次閱讀

Xilinx 的 Versal AI Core 系列器件旨在通過使用高計算效率的 ASIC 級 AI 計算引擎和靈活的可編程結構來解決 AI 推理的獨特和最困難的問題,以構建具有加速器的 AI 應用程序,最大限度地提高任何給定的效率工作負載,同時提供低功耗和低延遲。

Versal AI Core 系列VCK190 評估套件采用VC1902 器件,該器件在產品組合中具有最佳的 AI 性能。該套件適用于需要高吞吐量 AI 推理和信號處理計算性能的設計。提供比當前服務器級 CPU 高 100 倍的計算能力并具有多種連接選項,使 VCK190 套件成為從云端到邊緣的各種應用程序的理想評估和原型設計平臺。

1.jpg

圖 1:Xilinx Versal AI Core 系列 VCK190 評估套件。(圖片來源:AMD 公司)

VCK190 評估套件的主要特性

板載 Versal AI 核心系列設備

配備 Versal ACAP XCVC1902 量產芯片

AI 和 DSP 引擎提供比當今服務器級 CPU 高 100 倍的計算性能

用于快速原型制作的預建合作伙伴參考設計

用于前沿應用程序開發的最新連接技術

內置 PCIe? Gen4 Hard IP,用于 NVMe SSD 和主機處理器等高性能設備接口

內置 100G EMAC Hard IP,用于高速 100G 網絡接口

DDR4 和 LPDDR4 內存接口

共同優化的工具和調試方法

Vivado? ML、Vitis? 統一軟件平臺、Vitis AI、用于 AI 推理應用程序開發的 AI Engine 工具

使用 Xilinx 的 Versal AI Core 系列器件實現 AI 接口加速

image.png

圖 2:Xilinx Versal AI Core VC1902 ACAP 器件框圖。(圖片來源:AMD 公司)

Versal? AI Core 自適應計算加速平臺 (ACAP) 是一款高度集成的多核異構設備,可在硬件和軟件層面動態適應各種 AI 工作負載,是 AI 邊緣計算應用或云加速器的理想選擇牌。該平臺集成了用于嵌入式計算的下一代標量引擎、用于硬件靈活性的自適應引擎,以及由 DSP 引擎和用于推理和信號處理的革命性 AI 引擎組成的智能引擎。其結果是一個適應性強的加速器,在 AI/ML 工作負載方面超越了傳統 FPGAGPU 的性能、延遲和能效。

Versal ACAP 平臺亮點

自適應引擎:

自定義內存層次結構優化加速器內核的數據移動和管理

預處理和后處理功能,包括神經網絡 RT 壓縮和圖像縮放

人工智能引擎 (DPU)

向量處理器的平鋪陣列,XCVC1902 設備的性能高達 133 INT8 TOPS,稱為深度學習處理單元或 DPU

適用于 CNN、RNN 和 MLP 等神經網絡;硬件適用于優化不斷發展的算法

標量引擎

四核 ARM 處理子系統,用于安全、電源和比特流管理的平臺管理控制器

VCK190 AI推理性能

與當前服務器級 CPU 相比,VCK190 能夠提供超過 100 倍的計算性能。下面是基于 C32B6 DPU Core 的 AI Engine 實現的性能示例,batch = 6。請參閱下表了解 VCK190 上各種神經網絡樣本的吞吐量性能(以幀/秒或 fps 為單位),DPU 在 1250 下運行兆赫茲。

image.png

表 1:VCK190 AI 推理性能示例。

查看 Vitis AI 庫用戶指南 (UG1354) r2.5.0 中的 VCK190 AI 性能的更多詳細信息,網址為https://docs.xilinx.com/r/en-US/ug1354-xilinx-ai-sdk/VCK190-Evaluation-Board

Design Gateway 的 IP 核如何加速 AI 應用性能?

Design Gateway 的 IP 核旨在處理網絡和數據存儲協議,無需 CPU 干預。這使得完全卸載 CPU 系統的復雜協議處理成為理想之選,并使它們能夠將大部分計算能力用于 AI 應用程序,包括 AI 推理、前后數據處理、用戶界面、網絡通信和數據存儲訪問,以實現最佳性能表現。

image.png

圖 3:具有 Design Gateway 的 IP 核的 AI 應用示例框圖。(圖片來源:Design Gateway)

Design Gateway 的 TCP 卸載引擎 IP (TOExxG-IP) 性能

傳統 CPU 系統處理超過 10GbE 或 25GbE 的高速、高吞吐量 TCP 數據流需要超過 50% 的 CPU 時間,這降低了 AI 應用程序的整體性能。根據 Xilinx 的 MPSoC Linux 系統上的 10G TCP 性能測試,10GbE TCP 傳輸期間的 CPU 使用率超過 50%,TCP 發送和接收數據傳輸速度可以達到 10GbE 速度的 40% 到 60% 或 400 MB/s 到600 兆字節/秒。

通過實施 Design Gateway 的TOExxG-IP 內核,通過 10GbE 和 25GbE 進行 TCP 傳輸的 CPU 使用率可以降低到幾乎 0%,而以太網帶寬利用率可以達到接近 100%。這允許通過純硬件邏輯直接通過 TCP 網絡發送和接收數據,并以最少的 CPU 使用率和盡可能低的延遲將數據饋送到 Versal AI 引擎。下面的圖 4 顯示了 TOExxG-IP 和 MPSoC Linux 系統之間的 CPU 使用率和 TCP 傳輸速度比較。

image.png

圖 4:MPSoC Linux 系統和 Design Gateway 的 TOExxG-IP 內核的 10G/25G TCP 傳輸性能比較。(圖片來源:Design Gateway)

Design Gateway 用于 Versal 器件的 TOExxG-IP

image.png

圖 5:TOExxG-IP 系統概覽。(圖片來源:Design Gateway)

TOExxG-IP 內核實現了 TCP/IP 堆棧(在硬線邏輯中),并與 Xilinx 的 EMAC Hard IP 和以太網子系統模塊連接,用于具有 10G/25G/100G 以太網速度的下層硬件接口。TOExxG-IP 的用戶接口包括一個用于控制信號的寄存器接口和一個用于數據信號的 FIFO 接口。TOExxG-IP 旨在通過 AXI4-ST 接口與 Xilinx 的以太網子系統連接。用戶界面的時鐘頻率取決于以太網接口速度(例如,156.625 MHz 或 322.266 MHz)。

TOExxG-IP 的特點

無需 CPU 即可實現完整的 TCP/IP 堆棧

支持一個會話與一個 TOExxG-IP

可以通過使用多個 TOExxG-IP 實例來實現多會話

支持服務器和客戶端模式(被動/主動打開和關閉)

支持巨型幀

通過標準 FIFO 接口的簡單數據接口

通過單端口 RAM 接口的簡單控制接口

XCVC1902-VSVA2197-2MP-ES FPGA 設備上的 FPGA 資源使用情況如下表 2 所示。

1669096115469055316.png

表 2:Versal 設備的實施統計示例。

TOExxG-IP 的更多詳細信息在其數據表中進行了描述,該數據表可通過以下鏈接從 Design Gateway 網站下載

TOE10G-IP 內核 Xilinx 數據表

TOE25G-IP 內核 Xilinx 數據表

TOE100G-IP 內核 Xilinx 數據表

Design Gateway 的 NVMe 主機控制器 IP 性能

NVMe 存儲接口速度與 PCIe Gen3 x4 或 PCIe Gen4 x4 的數據速率高達 32 Gbps 和 64 Gbps。這比 10GbE 以太網速度高三到六倍。CPU 處理復雜的 NVMe 存儲協議以達到盡可能高的磁盤訪問速度需要比 10GbE 以上的 TCP 協議更多的 CPU 時間。

Design Gateway 通過開發能夠作為獨立 NVMe 主機控制器運行的 NVMe IP 核解決了這個問題,能夠在沒有 CPU 的情況下直接與 NVMe SSD 通信。這實現了 NVMe PCIe Gen3 和 Gen4 SSD 訪問的高效率和性能,從而簡化了用戶界面和標準功能,以便在無需了解 NVMe 協議的情況下易于使用。NVMe PCIe Gen4 SSD 性能可通過 NVMe IP 實現高達 6 GB/s 的傳輸速度,如圖 6 所示。

image.png

圖 6:NVMe PCIe Gen3 和 Gen4 SSD 與 Design Gateway 的 NVMe-IP Core 的性能比較。(圖片來源:Design Gateway)

Design Gateway 的 NVMe-IP 用于 Versal 設備

image.png

圖 7:NVMe-IP 系統概覽。(圖片來源:Design Gateway)

NVMe-IP的特點

能夠實現應用層、事務層、數據鏈路層和部分物理層訪問NVMe SSD,無需CPU或外部DDR內存

與 Xilinx PCIe Gen3 和 Gen4 Hard IP 一起運行

無需外部存儲器接口即可利用 BRAM 和 URAM 作為數據緩沖器的能力

支持六個命令:Identify、Shutdown、Write、Read、SMART 和 Flush(可選的附加命令支持)

XCVC1902-VSVA2197-2MP-ES FPGA 設備上的 FPGA 資源使用情況如表 2 所示。

1669096085727048653.png

表 3:Versal 設備的實施統計示例。

用于 Versal 設備的 NVMe-IP 的更多詳細信息在其數據表中進行了描述

適用于 Gen4 Xilinx 數據表的 NVMe IP 核

結論

TOExxG-IP 和 NVMe-IP 內核都可以通過完全卸載 CPU 系統從計算和內存密集型協議(例如 TCP 和 NVMe 存儲協議)中卸載對實時 AI 應用程序至關重要的協議來幫助加速 AI 應用程序性能。這使得 Xilinx 的 Versal AI Core 系列器件能夠執行 AI 推理和高性能計算應用,而不會出現網絡和數據存儲協議處理的瓶頸或延遲。

VCK190 評估套件和 Design Gateway 的網絡和存儲 IP 解決方案可在賽靈思 Versal AI Core 設備上以盡可能低的 FPGA 資源使用率和極高的能效在 AI 應用中實現最佳性能。

審核編輯 黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Xilinx
    +關注

    關注

    70

    文章

    2121

    瀏覽量

    119373
  • IP
    IP
    +關注

    關注

    5

    文章

    1404

    瀏覽量

    148272
  • AI
    AI
    +關注

    關注

    87

    文章

    26443

    瀏覽量

    264044
  • 人工智能
    +關注

    關注

    1776

    文章

    43845

    瀏覽量

    230600
收藏 人收藏

    評論

    相關推薦

    如何在Linux平臺上進行Linux程序開發

    最近陸陸續續有工程師拿到了VCK190單板。 VCK190集成了Xilinx的7nm AIE,有很強的處理能力。 本文介紹怎么運行Xilinx AIE的例程,熟悉AIE開發流程。
    發表于 08-02 08:03 ?2705次閱讀
    如何在Linux平臺上進行Linux程序開發

    人工智能是什么?

    簡單的理解為“人工”與“智能”的完美結合呢?關于這個問題,仁者見仁智者見智。 現在繼續剛才的話題,以目前服務機器人的智商度來看的話,當前人工智能雖然不斷高速前進,但還是處于弱
    發表于 09-16 15:40

    百度人工智能大神離職,人工智能的出路在哪?

    。 舉例來說,之前的智能家居大多以監測為主,嚴格意義來說,根本不是智能,真正的智能一定監和控相結合的。監測的基礎加上控制功能,真正實現了
    發表于 03-23 17:00

    嵌入式人工智能簡介

    嵌入式人工智能-簡要了解OPEN AI LAB嵌入式人工智能開發套件(EAIDK)AIoTOPEN AI LAB最開始聽到這個名字,以為是一家國外的公司或者是一個開源社區,登錄官網之后發現是國內
    發表于 10-28 09:44

    利用設計網關IP 內核 Xilinx VCK190 評估套件加速人工智能應用

    出現網絡和數據存儲協議處理的瓶頸或延遲。VCK190 評估套件和 Design Gateway 的網絡和存儲 IP 解決方案可在 Xilinx
    發表于 11-25 16:29

    如何將人工智能應用到效能評估系統軟件中去解決

    ,我們可以將其應用到效能評估系統中,進一步提高效能評估的準確性和實用性。   華盛恒輝可以利用人工智能技術,通過對大量數據的分析,來識別和評估各個業務環節的表現,從而對效能進行
    發表于 08-30 12:58

    賽靈思Versal評估套件助力開發者邁入解鎖ACAP功能的高速路

    裝備業界首個自適應計算加速平臺(ACAP)的賽靈思 Versal AI Core 系列 VCK190評估套件 和 Versal Prime 系列 VMK180 Prime
    的頭像 發表于 01-14 09:30 ?1985次閱讀

    賽靈思宣布兩款Versal ACAP評估套件現已上市

    日前,賽靈思宣布兩款 Versal ACAP 評估套件現已上市,分別為?Versal AI Core 系列 VCK190 評估套件和?Ver
    的頭像 發表于 03-12 15:14 ?2892次閱讀

    VCK190板子上使用DDR4-DIMM的ECC

    在Vivado 2021.2的VCK190 boardfile里DDR4-DIMM的DQ width被限制為64bit,不能使能ECC功能。如果需要在VCK190板子上使用DDR4-DIMM的ECC,可以手動修改board file。
    的頭像 發表于 08-17 09:12 ?1031次閱讀

    如何更改VCK190單板啟動模式

    辦公室有VCK190單板,運行在SD啟動模式下,能進入Linux。但是現在在家辦公,不能更改VCK190單板啟動模式。
    的頭像 發表于 08-26 11:05 ?911次閱讀

    利用設計網關IP 內核Xilinx VCK190 評估套件加速人工智能應用

    。 VCK190 評估套件和 Design Gateway 的網絡和存儲 IP 解決方案可在 Xilinx 的 Versal AI Core
    的頭像 發表于 11-29 18:36 ?551次閱讀
    <b class='flag-5'>利用</b><b class='flag-5'>設計網關</b>的 <b class='flag-5'>IP</b> <b class='flag-5'>內核</b>在 <b class='flag-5'>Xilinx</b> <b class='flag-5'>VCK190</b> <b class='flag-5'>評估</b><b class='flag-5'>套件</b>上<b class='flag-5'>加速</b><b class='flag-5'>人工智能</b>應用

    【產品測試】利用設計網關IP 內核Xilinx VCK190 評估套件加速人工智能應用

    系列器件能夠執行 AI 推理和高性能計算應用,而不會出現網絡和數據存儲協議處理的瓶頸或延遲。 VCK190 評估套件和 Design Gateway 的網絡和存儲 IP 解決方案可在
    的頭像 發表于 11-29 18:36 ?2272次閱讀

    在Versal VCK190評估套件上使用器件固件升級(DFU)執行USB輔助啟動模式測試

    本文將演示如何在 Versal AI Core 系列 VCK190 評估套件上從 USB 輔助啟動模式啟動 Linux
    的頭像 發表于 07-10 17:09 ?577次閱讀
    在Versal <b class='flag-5'>VCK190</b><b class='flag-5'>評估</b><b class='flag-5'>套件</b>上使用器件固件升級(DFU)執行USB輔助啟動模式測試

    利用Design Gateway的IP Core加速Xilinx VCK190評估套件上的AI應用

    Xilinx?的?Versal AI Core?系列器件旨在解決有關 AI 推理的最大而獨特的難題
    的頭像 發表于 07-07 14:15 ?583次閱讀
    <b class='flag-5'>利用</b>Design Gateway的<b class='flag-5'>IP</b> Core<b class='flag-5'>加速</b><b class='flag-5'>Xilinx</b> <b class='flag-5'>VCK190</b><b class='flag-5'>評估</b><b class='flag-5'>套件</b>上的AI應用

    VCK190評估板用戶指南

    電子發燒友網站提供《VCK190評估板用戶指南.pdf》資料免費下載
    發表于 09-13 14:40 ?0次下載
    <b class='flag-5'>VCK190</b><b class='flag-5'>評估</b>板用戶指南
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>