0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區
會(huì )員中心
創(chuàng )作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內不再提示

在開(kāi)發(fā)平臺上使用VITIS AI加速AI應用

星星科技指導員 ? 來(lái)源:嵌入式計算設計 ? 作者:Vaibhav Kothari ? 2022-07-01 14:24 ? 次閱讀

VITIS 是一個(gè)用于開(kāi)發(fā)軟件和硬件的統一軟件平臺,使用 Vivado 和其他用于 Xilinx FPGA SoC 平臺(如 ZynqMP UltraScale+ 和 Alveo 卡)的組件。VITIS SDK 的關(guān)鍵組件 VITIS AI 運行時(shí) (VART) 為在邊緣和云上部署終端 ML/AI 應用程序提供了統一的接口。

機器學(xué)習中的推理是計算密集型的,需要高內存帶寬和高性能計算,以滿(mǎn)足各種終端應用程序的低延遲和高吞吐量要求。

Vitis AI 工作流程

Xilinx Vitis AI 提供了一個(gè)工作流,可使用簡(jiǎn)單的流程在 Xilinx 深度學(xué)習處理單元 (DPU) 上部署深度學(xué)習推理應用程序:

poYBAGK-kzmASgm-AAFdYdCFZ3o399.png

深度處理單元 (DPU) 是一種可配置的計算引擎,針對深度學(xué)習推理應用的卷積神經(jīng)網(wǎng)絡(luò )進(jìn)行了優(yōu)化,并置于可編程邏輯 (PL) 中。DPU 包含高效且可擴展的 IP 內核,可進(jìn)行定制以滿(mǎn)足許多不同應用的需求。DPU 定義自己的指令集,Vitis AI 編譯器生成指令。

VITIS AI 編譯器以?xún)?yōu)化的方式調度指令以獲得可能的最大性能。

在 Xilinx ZynqMP UltraScale+ SoC 平臺上運行任何 AI 應用程序的典型工作流程包括以下內容:

模型量化

模型編譯

模型優(yōu)化(可選)

構建 DPU 可執行文件

構建軟件應用程序

集成 VITIS AI 統一 API

編譯和鏈接混合 DPU 應用程序

在 FPGA 上部署混合 DPU 可執行文件

人工智能量化器

AI Quantizer 是一種用于量化過(guò)程的壓縮工具,通過(guò)將 32 位浮點(diǎn)權重和激活轉換為定點(diǎn) INT8。它可以在不丟失模型準確信息的情況下降低計算復雜度。定點(diǎn)模型需要更少的內存,因此比浮點(diǎn)實(shí)現提供更快的執行和更高的功率效率。

pYYBAGK-k0OAcg51AAEUfHmRVjg505.png

人工智能編譯

AI 編譯器將網(wǎng)絡(luò )模型映射到高效的指令集和數據流。編譯器的輸入是量化的 8 位神經(jīng)網(wǎng)絡(luò ),輸出是 DPU 內核 - 可執行文件將在 DPU 上運行。在這里,不支持的層需要部署在 CPU 中,或者可以自定義模型來(lái)替換和刪除那些不支持的操作。它還執行復雜的優(yōu)化,例如層融合、指令調度和片上存儲器的重用。

一旦我們能夠執行 DPU,我們需要使用 Vitis AI 統一 API 來(lái)初始化數據結構,初始化 DPU,在 CPU 上實(shí)現 DPU 不支持的層,并在 CPU 上添加預處理和后處理PL/PS 的需求基礎。

poYBAGK-k0uAGNFoAAD_TpKOAM8422.png

人工智能優(yōu)化器

借助其模型壓縮技術(shù),AI Optimizer 可以將模型復雜度降低 5-50 倍,而對準確性的影響最小。這種深度壓縮將推理性能提升到一個(gè)新的水平。我們可以實(shí)現所需的稀疏性并將運行時(shí)間減少 2.5 倍。

poYBAGK-k2CAB9qAAAGTFkNeeA4679.png

人工智能分析器

AI Profiler 可以幫助分析推理找到導致端到端管道瓶頸的警告。分析器為設計人員提供了 DPU/CPU/內存的通用時(shí)間線(xiàn)。此過(guò)程不會(huì )更改任何代碼,并且可以跟蹤功能并進(jìn)行分析。

poYBAGK-k2eAHrZEAAKq6M1K_js563.png

人工智能運行時(shí)

VITIS AI 運行時(shí) (VART) 允許應用程序使用統一的高級運行時(shí) API 進(jìn)行邊緣和云部署,使其無(wú)縫且高效。一些關(guān)鍵功能包括:

異步作業(yè)提交

異步作業(yè)收集

C++Python 實(shí)現

多線(xiàn)程和多進(jìn)程執行

Vitis AI 還提供 DSight、DExplorer、DDump 和 DLet 等,用于執行各種任務(wù)。

DSight & DExplorer

DPU IP 為特定內核提供了多種配置,以根據網(wǎng)絡(luò )模型進(jìn)行選擇。DSight 告訴我們每個(gè) DPU 核心的百分比利用率。它還提供了調度程序的效率,以便我們可以調整用戶(hù)線(xiàn)程。還可以查看每一層和每個(gè) DPU 節點(diǎn)的性能數據,例如 MOPS、運行時(shí)間和內存帶寬。

Softnautics選擇賽靈思 ZynqMP UltraScale+ 平臺進(jìn)行高性能和計算部署。它提供最佳的應用程序處理、高度可配置的 FPGA 加速功能和 VITIS SDK,以加速高性能 ML/AI 推理。我們針對的此類(lèi)應用之一是用于 Covid-19 篩查的面罩檢測。其目的是為戴口罩的人的 Covid-19 篩查部署多流推理,并根據各國政府對 Covid-19 預防措施指南的要求,實(shí)時(shí)識別違規行為。

pYYBAGK-k3GAIfo6AADA8d6GKDw058.png

我們準備了一個(gè)數據集并選擇了預訓練的權重來(lái)設計一個(gè)用于掩碼檢測和篩選的模型。我們通過(guò) TensorFlow 框架訓練和修剪我們的自定義模型。這是面部檢測和面具檢測的兩階段部署。如此獲得的訓練模型通過(guò)前面章節中介紹的 VITIS AI 工作流程傳遞。與 CPU 相比,我們觀(guān)察到推理時(shí)間的 10 倍速度。Xilinx 提供了不同的調試工具和實(shí)用程序,它們在初始開(kāi)發(fā)和部署期間非常有用。在我們最初的部署階段,我們沒(méi)有檢測到掩碼和非掩碼類(lèi)別。我們嘗試將基于 PC 的推理輸出與名為 Dexplorer 的調試實(shí)用程序之一的輸出相匹配。但是,調試模式和根本原因導致問(wèn)題進(jìn)一步調試。在運行量化器時(shí),我們可以使用更大的校準圖像、迭代和檢測來(lái)調整輸出,視頻輸入的準確率約為 96%。我們還嘗試使用 AI 分析器識別管道中的瓶頸,然后采取糾正措施以通過(guò)各種方式消除瓶頸,例如使用 HLS 加速來(lái)計算后處理中的瓶頸。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權轉載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習之用,如有內容侵權或者其他違規問(wèn)題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10526

    瀏覽量

    207451
  • Xilinx
    +關(guān)注

    關(guān)注

    70

    文章

    2129

    瀏覽量

    119697
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    27214

    瀏覽量

    264964
收藏 人收藏

    評論

    相關(guān)推薦

    Vitis AI Library體驗之OCR識別

    Vitis AI Library是一組高層次庫和 API,專(zhuān)為利用 DPU 高效執行 AI 推斷而構建。它是基于 Vitis AI運行時(shí)利用
    的頭像 發(fā)表于 10-17 08:23 ?727次閱讀
    <b class='flag-5'>Vitis</b> <b class='flag-5'>AI</b> Library體驗之OCR識別

    【KV260視覺(jué)入門(mén)套件試用體驗】Vitis AI Library體驗之OCR識別

    的接口。由此可簡(jiǎn)化深度學(xué)習神經(jīng)網(wǎng)絡(luò )的使用,對于不具備深度學(xué)習或 FPGA 知識的用戶(hù)也是如此。Vitis AI Library 使開(kāi)發(fā)者能夠專(zhuān)注于開(kāi)發(fā)自己的應用,而不是底層硬件。 二、
    發(fā)表于 10-16 23:25

    【KV260視覺(jué)入門(mén)套件試用體驗】KV260系列之Petalinux鏡像+Resnet 50探索

    Vitis AI 概述 AMD Vitis? AI 開(kāi)發(fā)環(huán)境可在 AMD 硬件平臺上
    發(fā)表于 10-16 04:22

    【KV260視覺(jué)入門(mén)套件試用體驗】Vitis AI 構建開(kāi)發(fā)環(huán)境,并使用inspector檢查模型

    Optimizer 等,以支持不同層次的開(kāi)發(fā)需求。 提供多種示例設計和教程,展示如何在賽靈思硬件平臺上實(shí)現各種 AI 應用場(chǎng)景。 Visits AI 怎么用? 第一步:
    發(fā)表于 10-14 15:34

    【KV260視覺(jué)入門(mén)套件試用體驗】Vitis-AI加速的YOLOX視頻目標檢測示例體驗和原理解析

    =vitis_ai_library_r3.0.0_video.tar.gz 開(kāi)發(fā)板上下載、解壓的命令為: # 跳轉到HOME目錄 cd ~ # 下載 tar.gz 文件 TGZ=[viti
    發(fā)表于 10-06 23:32

    基于Vitis AI的ADAS目標識別

    Vitis? AI開(kāi)發(fā)環(huán)境可在賽靈思硬件平臺上加速 AI 推斷,包括邊緣器件和 Alveo?
    的頭像 發(fā)表于 09-28 00:05 ?2698次閱讀
    基于<b class='flag-5'>Vitis</b> <b class='flag-5'>AI</b>的ADAS目標識別

    【KV260視覺(jué)入門(mén)套件試用體驗】基于Vitis AI的ADAS目標識別

    一、基礎知識 (一)Vitis? AI開(kāi)發(fā)環(huán)境 Vitis? AI開(kāi)發(fā)環(huán)境可在賽靈思硬件
    發(fā)表于 09-27 23:21

    【KV260視覺(jué)入門(mén)套件試用體驗】六、VITis AI車(chē)牌檢測&amp;車(chē)牌識別

    model = argv[1]; return vitis::ai::main_for_jpeg_demo( argc, argv, [model] { return vitis::ai
    發(fā)表于 09-26 16:28

    【KV260視覺(jué)入門(mén)套件試用體驗】五、VITis AI (人臉檢測和人體檢測)

    --clean 二、Vitis AI 人臉檢測 邊緣平臺或數據中心平臺上運行Vitis
    發(fā)表于 09-26 16:22

    【KV260視覺(jué)入門(mén)套件試用體驗】5、簡(jiǎn)單幾步體驗Vitis AI

    Vitis AIVitis 統一軟件平臺的重要組件,Vitis AI
    發(fā)表于 09-18 21:54

    Vitis AI RNN用戶(hù)指南

    Vitis AI 遞歸神經(jīng)網(wǎng)絡(luò ) (RNN) 工具是 Vitis? AI 開(kāi)發(fā)環(huán)境的一個(gè)子模塊,專(zhuān)注于在 Xilinx? 硬件
    發(fā)表于 09-13 17:32 ?0次下載
    <b class='flag-5'>Vitis</b> <b class='flag-5'>AI</b> RNN用戶(hù)指南

    【KV260視覺(jué)入門(mén)套件試用體驗】部署DPU鏡像并運行Vitis AI圖像分類(lèi)示例程序

    統一軟件平臺Vitis AI。 1.1 Vitis? 統一軟件平臺簡(jiǎn)介 來(lái)自Xilinx官網(wǎng)的簡(jiǎn)介,V
    發(fā)表于 09-10 23:01

    【KV260視覺(jué)入門(mén)套件試用體驗】Vitis AI 初次體驗

    計算加速平臺 (ACAP) 來(lái)充分發(fā)掘 AI 加速的全部潛能。Vitis AI
    發(fā)表于 09-10 13:15

    【KV260視覺(jué)入門(mén)套件試用體驗】部署vitis-ai環(huán)境以及測試demo

    /ug1354-xilinx-ai-sdk/%E4%B8%8B%E8%BD%BD-Vitis-AI-Library 安裝->設置目標->步驟1:安裝開(kāi)發(fā)板鏡像 開(kāi)始下載鏡
    發(fā)表于 08-27 23:35

    淺談Vitis AI 3.5發(fā)布亮點(diǎn)

    Vitis AI 平臺是為 AMD 器件、板卡及 Alveo 數據中心加速卡提供的一款綜合 AI 推斷開(kāi)
    的頭像 發(fā)表于 07-14 10:59 ?848次閱讀
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看