<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

如何用OpenCL實現FPGA上的大型卷積網絡加速？

Xilinx zynq系列FPGA實現神經網絡評估

本篇目錄

1. 內存占用

1.1 FPGA程序中內存的實現方式

1.2 Zynq的BRAM內存大小

1.3 一個卷積操作占用的內存

2. PipeCNN可實現性

PipeCNN論文解析：用OpenCL實現FPGA上的大型卷積網絡加速

2.1 已實現的PipeCNN資源消耗

3. 實現大型神經網絡的方法

4. Virtex-7高端FPGA概覽、7系列FPGA相關文檔

正文

0Zynq7000系列概覽

1內存占用

1.1 FPGA程序中內存的實現方式

參閱xilinx文檔UG998

FPGA并沒有像軟件那樣用已有的cache，FPGA的HLS編譯器會在FPGA中創建一個快速的memory architecture以最好的適應算法中的數據樣式（data layout）。因此FPGA可以有相互獨立的不同大小的內部存儲空間，例如寄存器，移位寄存器，FIFOs和BRAMs。

寄存器：最快的內存結構，集成在在運算單元之中，獲取不需要額外的時延。

移位寄存器：可以被當作一個數據序列，每一個數據可以在不同的運算之中被重復使用。將其中所有數據移動到相鄰的存儲設備中只需要一個時鐘周期。

FIFO：只有一個輸入和輸出的數據序列，通常被用于循環或循環函數，細節會被HLS編譯器處理。

BRAM：集成在FPGA fabric模塊中的RAM，每個xilinx的FPGA中集成有多個這樣的BRAM?？梢员划斪饔幸韵绿匦缘腸ache：1.不支持像處理器cache中那樣的緩存一致性（cache coherency，collision），不支持處理器中的一些邏輯類型。2.只在設備有電時保持內存。3.不同的BRAM塊可以同時傳輸數據。

1.2 Zynq的BRAM內存大小

zynq 7z020的BRAM為4.9Mb，7z035的BRAM為17.6Mb（2.2MB）

1.3 一個卷積操作占用的內存

例如，我們實現的卷積函數，輸入27×600，卷積核16×27，輸出16×600，數據類型為float。

//convolution operation for （i = 0; i 《 16; i++） { for （j = 0; j 《 600; j++） { result = 0; for （k = 0; k 《 27; k++） { temp = weights［i*27+k］ * buf_in［k*600+j］; result += temp; } buf_out［i*600+j］ = result; } }

在HLS中生成的IPcore占用硬件資源為：

在vivado中搭建好系統，占用的資源為：

2PipeCNN可實現性

PipeCNN是一個基于OpenCL的FPGA實現大型卷積網絡的加速器。

PipeCNN解析文檔：

PipeCNN論文解析：用OpenCL實現FPGA上的大型卷積網絡加速

github地址：https://github.com/doonny/PipeCNN#how-to-use

2.1 已實現的PipeCNN資源消耗

對于Altera FPGA，運用 Intel‘s OpenCL SDK v16.1 toolset.

對于Xilinx FPGAs， the SDAccel development environment v2017.2 can be used.

Xilinx’s KCU1500 （XCKU115 FPGA）（已經有xilin的板子實現過pipeCNN，但是型號比zynq高很多）

硬件資源可以被三個宏調控，device/hw_param.cl. Change the following macros

VEC_SIZE

LANE_NUM

CONV_GP_SIZE_X

消耗資源為：

3實現大型神經網絡的方法

方案一：壓縮模型到《2.2MB，可實現在BRAM中

優點：1.速度快 2.實現方便

缺點：1.模型壓縮難度 2.難以實現大型網絡

方案二：用FPGA調用DDR

優點：1.速度中等 2.可實現大型網絡

缺點：調用DDR有難度，開發周期長

方案三：用片上單片機調用DDR（插入SD卡）分包傳入IPcore運算

優點：可實現大型網絡

缺點：速度較慢

4Virtex-7高端FPGA概覽

Virtex-7為高端FPGA，比Zynq高了一個檔次。

7系列FPGA相關文檔：

原文標題：Xilinx Zynq系列FPGA實現神經網絡中相關資源評估

文章出處：【微信公眾號：FPGA之家】歡迎添加關注！文章轉載請注明出處。

責任編輯：haq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

FPGA

FPGA

+關注

關注
1608

文章
21367

瀏覽量
594667
神經網絡

神經網絡

+關注

關注
42

文章
4591

瀏覽量
99293

原文標題：Xilinx Zynq系列FPGA實現神經網絡中相關資源評估

文章出處：【微信號：zhuyandz，微信公眾號：FPGA之家】歡迎添加關注！文章轉載請注明出處。

評論

相關推薦

基于FPGA的網絡加速設計實現

首先是FPGA硬件的變化太多，各個模塊可配參數的變化（比如卷積模塊并行數的變化），另外一個是網絡模型多種多樣以及開源的網絡模型平臺也很多（tensorflow，pytorch等）。

發表于 04-08 09:48 ?175次閱讀

基于<b class='flag-5'>FPGA</b>的<b class='flag-5'>網絡</b><b class='flag-5'>加速</b>設計<b class='flag-5'>實現</b>

verilog實現卷積運算

在Verilog中實現卷積運算，你可以使用以下示例代碼。這里假設輸入數據是有符號8位數，輸出數據也是有符號8位數。卷積在數字信號處理中通常指的是兩個序列的逐元素乘積的和，也就是點乘。 module

發表于 03-26 07:51

【國產FPGA+OMAPL138開發板體驗】（原創）5.FPGA的AI加速源代碼

if; end process; end architecture Behavioral; 本人寫的這個程序極度簡化了在FPGA上實現AI加速器的過程，例如并行處理、流水線

發表于 02-12 16:18

如何用FPGA加速神經網絡

到底純FPGA適不適合這種大型神經網絡的設計？這個問題其實我們不適合回答，但是FPGA廠商是的實際操作是很有權威性的，現在不論是Intel還是Xilinx都沒有在自己傳統的

的頭像

發表于 01-24 09:51 ?638次閱讀

如<b class='flag-5'>何用</b><b class='flag-5'>FPGA</b><b class='flag-5'>加速</b>神經<b class='flag-5'>網絡</b>

大佬們，問一下用FPGA實現卷積碼編解碼的難度，畢設選了這個

求助！大佬們，問一下用FPGA實現卷積碼編解碼的難度。

發表于 10-16 23:26

《 AI加速器架構設計與實現》+學習和一些思考

，如有錯誤還望大佬們指出，我馬上改正。目錄和進度目前閱讀到第一章，先更新到第一章的內容吧卷積神經網絡運算子系統的設計儲存子系統的設計架構優化技術安全與防護神經網絡加

發表于 09-16 11:11

《 AI加速器架構設計與實現》+第一章卷積神經網絡觀后感

《 AI加速器架構設計與實現》+第一章卷積神經網絡觀感 ? ?在本書的引言中也提到“一圖勝千言”，讀完第一章節后，對其進行了一些歸納（如圖1），第一章對常見的神經

發表于 09-11 20:34

卷積神經網絡的介紹什么是卷積神經網絡算法

卷積神經網絡的介紹什么是卷積神經網絡算法卷積神經網絡涉及的關鍵技術

發表于 08-21 16:49 ?1532次閱讀

卷積神經網絡層級結構卷積神經網絡的卷積層講解

像分類、目標檢測、人臉識別等。卷積神經網絡的核心是卷積層和池化層，它們構成了網絡的主干，實現了對圖像特征的提取和抽象。一、

發表于 08-21 16:49 ?5168次閱讀

卷積神經網絡的基本原理卷積神經網絡發展卷積神經網絡三大特點

卷積神經網絡的基本原理卷積神經網絡發展歷程卷積神經網絡三大特點?

發表于 08-21 16:49 ?1621次閱讀

卷積神經網絡三大特點

是一種基于圖像處理的神經網絡，它模仿人類視覺結構中的神經元組成，對圖像進行處理和學習。在圖像處理中，通常將圖像看作是二維矩陣，即每個像素點都有其對應的坐標和像素值。卷積神經網絡采用卷積

發表于 08-21 16:49 ?4415次閱讀

卷積神經網絡概述卷積神經網絡的特點 cnn卷積神經網絡的優點

卷積神經網絡概述卷積神經網絡的特點 cnn卷積神經網絡的優點?

發表于 08-21 16:41 ?2137次閱讀

卷積神經網絡python代碼

的卷積操作，將不同層次的特征進行提取，從而通過反向傳播算法不斷優化網絡權重，最終實現分類和預測等任務。在本文中，我們將介紹如何使用Python實現

發表于 08-21 16:41 ?740次閱讀

卷積神經網絡原理：卷積神經網絡模型和卷積神經網絡算法

卷積神經網絡原理：卷積神經網絡模型和卷積神經網絡算法卷積

發表于 08-17 16:30 ?1043次閱讀

基于 FPGA 的目標檢測網絡加速電路設計

適合加速卷積神經網絡，但與之對應的是 GPU 有著功耗高，空間占用大等缺點，很多場合對功耗有嚴格的限制，而 GPU 難以應用于這類需求。近些年來 FPGA 性能的不斷提升，同時

發表于 06-20 19:45

FPGA之家
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot JTAG簡介 JTAG和SWD之間的區別
Hot 常見電子元器件圖片及名稱

New Alpha半透明圖形疊加算法Matlab+Verilog的設計實現
New 視頻采集與處理入門：BT656標準介紹

精選推薦
更多

文章

資料

帖子

采用144核，能效提升66%！英特爾至強6處理器震撼上市，加速數據中心升級

章鷹觀察
10小時前

632 閱讀

如何移植FFmpeg

ElfBoard
2天前

534 閱讀

基于Arm Cortex-CM85內核的RA8D1作為控制器通過MIPI DSI實現LVGL顯示

瑞薩MCU小百科
2天前

756 閱讀

便攜式直流接地故障查找儀如何使用——每日了解電力知識

武漢摩恩
2天前

778 閱讀

重磅！英特爾發布intel3制程至強6能效核處理器，賦能數據中心能效升級

章鷹觀察
2天前

801 閱讀

rust-analyzer Rust編譯器前端實現

北冥有熊
2.79 MB

免費

2下載

Vim-Web像IDE一樣的Vim編輯器

張桂英
1.62 MB

免費

1下載

Tenacity跨平臺的音頻編輯器

李澤明
46.76 MB

免費

4下載

DPress博客系統

青sky
0.19 MB

免費

0下載

Elk用于嵌入式系統的微型JS引擎

chumowei
1.52 MB

免費

1下載

I.MX6ULL-飛凌 ElfBoard ELF1板卡 - 如何在Ubuntu中編譯OpenCV庫(X86架構）

jf_25331175
3天前

671 閱讀

鴻蒙原生應用元服務開發-設備管理USB服務開發場景與接口

李洋水蛟龍
3天前

292 閱讀

嵌入式學習-飛凌ElfBoard ELF 1板卡 - 如何在Ubuntu中編譯OpenCV庫

jf_25331175
3天前

858 閱讀

【留言有禮】佳節至，分享“粽”要記憶，傳遞溫馨祝福，贏取精美禮品！

ElecFans小喇叭
4天前

908 閱讀

無刷電機用的單電阻采樣的FOC，拿天線貼著電機線或者貼近采樣芯片，電機就會停轉

剛剛回國弄
4天前

1411 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看