在 FPGA 上實施 AI/ML 的選項-電子發燒友網

現場可編程門陣列 (FPGA) 以加速人工智能/機器學習應用而聞名，但它是如何在 FPGA 中實現的，有哪些不同的方法？讓我們探索工程師的設計空間。

人工智能 (AI) 是云和邊緣應用程序中的熱門話題。在許多情況下，人工智能可以實現更安全、更高效和安全的系統。人工智能已經存在很長時間了，它于 1956 年由約翰·麥卡錫 (John McCarthy) 在第一次人工智能會議召開時首次使用。雖然幾十年來進行了大量研究，但僅在最近 5 到 10 年，人工智能系統才從實驗室和研究轉移到產品路線圖和產品中。

在云和邊緣環境中，部署最廣泛的 AI 形式之一是機器學習 (ML)。機器學習是對計算機算法的研究，它允許計算機程序通過經驗自動改進。這方面的一個例子是為 ML 網絡提供帶有標簽的圖像數據集。機器學習算法識別圖像的特征和元素，以便在輸入新的未標記的、以前未見過的圖像時，ML 算法確定圖像包含任何已學習特征和元素的可能性?？梢杂柧毚祟?ML 算法來檢測圖像中的對象、處理語音中的關鍵字以及分析傳感器數據的異常情況。典型應用包括視覺引導機器人、車輛自主操作以及工業和安全關鍵系統的預測。

因此，ML 學習算法分為兩個要素，第一個是針對訓練數據集對網絡進行訓練。第二個是訓練網絡領域的部署，這些元素分別稱為訓練和推理。訓練準確的模型需要一個帶標簽的大型數據集，并且通常在基于云的 GPU 上執行以加速訓練過程。設計工程師可以跨從 MCU 到 GPU 和 FPGA 的一系列技術部署訓練有素的網絡。

在 FPGA 中嵌入 AI

幾個非常流行的框架——Caffe、TensorFlow。和 Pytorch——幫助訓練和部署 AI/ML 系統。這些框架用于網絡定義、訓練和推理。

許多基于邊緣的人工智能系統的關鍵要素之一是能夠在確定的時間范圍內執行推理。例如，自動駕駛汽車必須快速檢測車輛、障礙物和行人以防止碰撞。這需要一個既響應又確定的解決方案，響應是因為傳感器數據必須以最小延遲快速處理，確定是因為每個輸入的響應時間必須相同并且不依賴于系統操作條件或資源使用，例如，使用共享 DDR 內存會減慢響應時間。

由于響應性和確定性的要求，基于邊緣的解決方案的開發人員通常以 FPGA 或基于異構 SoC 的解決方案為目標。這些為開發人員提供了可編程邏輯，是實現機器學習網絡的理想選擇，因為它的并行特性支持響應式應用程序和非常確定的解決方案。

在可編程邏輯中實現 ML 推理時，可以采用兩種方法。在使用浮點數學開發和訓練神經網絡時，無論采用哪種方法，FPGA 或異構 SoC 中的實現通常都使用定點實現。從浮點數到定點數的轉換過程稱為量化，推理精度會略有下降；然而，對于大多數應用程序，可以使用量化的權重和激活來執行額外的訓練以恢復準確性。

第一種方法直接在可編程邏輯中實現神經網絡。為推理訓練的權重被加載到網絡中。這可以在運行時或在設計的編譯/綜合期間實現。

這些神經網絡的一個例子是 AMD-Xilinx FINN 網絡，它可用于在 FPGA 中實現量化神經網絡。這些量化神經網絡被實現為具有二進制權重和兩位激活的量化神經網絡。

有了量化神經網絡，神經網絡可以在 FPGA 中實現，資源更少，因為不需要外部 DDR 或 SoC 支持。使該方法成為空間、組件和成本非常寶貴的受限開發的理想選擇。雖然它需要更多的專業知識才能集成到整體解決方案中，但它可能非常有效?？赡苁褂么祟惙椒ǖ牡湫褪纠赡苁枪I機械的預測，例如軸承磨損或振動等。

在 FPGA 邏輯中使用神經網絡直接實現的替代方法是使用高度專業化的神經網絡加速器。神經網絡加速器在可編程邏輯中實現，并與具有高帶寬鏈路的 DDR 存儲器以及異構 SoC 中的專用處理器緊密耦合。

在使用神經網絡加速器的應用程序中，它們由軟件應用程序提供網絡和權重/激活和偏差。因此，這使得 ML 推理更容易集成到整個應用程序中。神經網絡加速器的一個例子是 AMD-Xilinx 深度學習單元，它可以與 Pytorch、Caffe 和 TensorFlow 中定義的網絡一起工作，并為應用程序執行所有量化、再訓練和程序生成。這樣可以更輕松地集成到正在開發的應用程序中。這種方法的典型應用是基于視覺的高性能應用，例如視覺引導機器人、智能城市解決方案，當然還有提高汽車 SAE 自主水平。

最高的準確性和性能來自于使用專門的神經網絡加速器，并且易于集成通常提供更好的整體解決方案。因此，這種方法被多家供應商用于他們的 AI 解決方案。這種方法更容易與更高級別的軟件框架和抽象堆棧集成，這是利用整體性能的關鍵，因為 AI 通常只是整體解決方案的一小部分（但很重要）。

最后的想法

很多時候，選擇哪種解決方案取決于最終應用，即使 AI 可能是主要的營銷元素。在現實世界中，人工智能通常只是整個解決方案的一小部分，因為傳感器接口、預處理、執行器驅動和構成解決方案的其他元素也會有自己的限制和要求。

可編程邏輯使開發人員能夠構建具有響應性和確定性的 AI/ML 解決方案。通過將這些解決方案與行業標準框架相結合，開發人員可以使云和邊緣 AI/ML 應用程序更安全、更高效、更安全。

審核編輯黃昊宇

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

FPGA

FPGA

+關注

關注
1608

文章
21367

瀏覽量
594633

使用 Renesas RA8M1 MCU 快速地部署強大高效的 AI 和 ML 功能

新的工作負載會增加功耗，盡管要求設計人員盡量降低功耗并加快產品上市時間。設計人員需要一個計算選項，既能保持 MCU 的效率，又能增加專為低功耗應用定制的高性能功能。這一選項還應保留與傳統 MCU 相關的簡單部署模式，同時增加足夠的功能，以支持

發表于 05-05 10:14 ?217次閱讀

使用 Renesas RA8M1 MCU 快速地部署強大高效的 <b class='flag-5'>AI</b> 和 <b class='flag-5'>ML</b> 功能

基于 Renesas 的 RA8M1 實現 AI 和 ML 部署

發表于 04-23 15:04 ?731次閱讀

基于 Renesas 的 RA8M1 實現 <b class='flag-5'>AI</b> 和 <b class='flag-5'>ML</b> 部署

新型的FPGA器件將支持多樣化AI/ML創新進程

的來臨，而是包括GPU、FPGA和NPU等一眾數據處理加速器時代的來臨，就像GPU以更高的計算密度和能效勝出CPU一樣，各種加速器件在不同的AI/ML應用或者細分市場中將各具優勢，未來并不是只要貴的而是更需要對的。此次GTC上

發表于 04-02 15:25 ?173次閱讀

新型的<b class='flag-5'>FPGA</b>器件將支持多樣化<b class='flag-5'>AI</b>/<b class='flag-5'>ML</b>創新進程

為何高端FPGA都非常重視軟件

它們適用于AI推理加速任務，聲稱的TOPS / FLOPS性能功能以及片上互連，例如FPGA路由資源和片上網絡（NOC）。在第二部分，我們研究了內存架構，封裝內集成架構和高速串行IO功

發表于 03-23 16:48

FPGA在深度學習應用中或將取代GPU

，這使其在 AI 應用中面臨著一些挑戰。 Larzul 表示，想要解決這些問題的解決方案便是實現現場可編程門陣列 (FPGA)，這也是他們公司的研究領域。FPGA 是一種處理器，可以

發表于 03-21 15:19

是德科技推出AI數據中心測試平臺旨在加速AI/ML網絡驗證和優化的創新

2024年2月29日，是德科技（Keysight Technologies,Inc.）宣布，針對人工智能（AI）和機器學習（ML）基礎設施生態系統，推出了 AI數據中心測試平臺，旨在加速AI

發表于 02-29 09:32 ?339次閱讀

國際最新AI算力評測標準SPEC ML即將發布，浪潮信息連任SPEC ML主席

國際權威標準性能評估組織SPEC第35屆年會日前在美國舉行。會上，SPEC組織確定新一年工作計劃，為推動AI算力產業的更快發展，國際最新AI算力評測標準SPEC ML即將發布，該標準由浪潮

發表于 02-24 19:07 ?3272次閱讀

【國產FPGA+OMAPL138開發板體驗】（原創）5.FPGA的AI加速源代碼

if; end process; end architecture Behavioral; 本人寫的這個程序極度簡化了在FPGA上實現AI加速器的過程，例如并行處理、流水線

發表于 02-12 16:18

FPGA？開搞！

。該工具鏈使用 Yosys 和 OpenFPGALoader 等開源工具，并與 Cologne Chip 合作開發實施和比特流生成工具。在設計輸入方面，工程師可以使用 Verilog、VHDL（通過

發表于 01-11 00:52

超低功耗 Wi-Fi + AI/ML方案成為AIoT 串連云端的天作之合

現今在人工智能驅動（ AI-driven ）的新興風潮下，人工智能和機器學習（ AI/ML ）正快速朝向網絡的邊緣端（ Edge ）發展 - 即使是最小的物聯網設備也將很快得以運行 AI

發表于 10-18 19:25 ?297次閱讀

為什么以及如何將 Efinix FPGA 用于 AI/ML 成像 — 第 1 部分：入門指南

作者：Adam Taylor 編者按：全新的 FPGA 架構方法帶來了更精細的控制和更大的靈活性，以滿足機器學習（ML）和人工智能（AI）的需求。本系列文章包括兩部分，第 1部分介紹

發表于 10-03 14:45 ?416次閱讀

為什么以及如何將 Efinix FPGA 用于 AI/ML 成像第 2 部分：圖像采集和處理

作者：Adam Taylor 編者按：全新的 FPGA 架構方法帶來了更精細的控制和更大的靈活性，以滿足機器學習（ML）和人工智能（AI）的需求。本系列文章包括兩部分，第 1部分介紹

發表于 10-03 14:45 ?568次閱讀

利用 FPGA 快速路徑構建高性能、高能效邊緣 AI 應用

?，F場可編程門陣列（FPGA）為實施邊緣 AI所需的神經網絡（NN）推理引擎提供了特別有效的速度和效率效率組合。然而，對于不熟悉 FPGA 的開發人員來說，傳統

發表于 10-03 14:31 ?726次閱讀

利用擴展型 NAS 存儲加速 AI/ML 工作負載

虹科方案1AI&ML變革日常生活AI（人工智能）和ML（機器學習）的發展正逐漸滲透到我們的日常生活中，為我們帶來了翻天覆地的變化。從智能手機中的語音助手到智能家居設備，

發表于 08-05 08:11 ?472次閱讀

Ai 部署的臨界考慮電子指南

%數據中心的工作量。平方GPU對培訓工作量有效，但在人工智能的所有不同階段都不需要GPU。在2021年的一項研究中，56%的研究受訪者將成本列為他們面臨的最重大挑戰實施AI/ML解決方

發表于 08-04 07:25