<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

XIlinx利用HLS進行加速設計進度

據觀察，HLS的發展呈現愈演愈烈的趨勢，隨著Xilinx Vivado HLS的推出，intel也快馬加鞭的推出了其HLS工具。HLS可以在一定程度上降低FPGA的入門門檻（不用編寫RTL代碼），也可以在某些場合加速設計與驗證（例如在FPGA上實現OpenCV函數），但個人還是喜歡直接從RTL入手，這樣可以更好的把握硬件結構。Xilinx官方文檔表示利用HLS進行設計可以大大加速設計進度：

XIlinx官方文檔片段

所以為了緊隨時代潮流，所以也抽空玩了一下Xilinx的HLS工具，下面把整個過程分享給大家。我這里選擇Cordic算法作為我的實現目標。Cordic算法原理很簡單，所以這里不再贅述。首先介紹一下Vivado HLS設計流程：

Vivado HLS設計流程

可以看出我們需要做的是完成C/C++設計、Testbench編寫以及Constraints/directives的添加。其中Constraints/directives是指利用約束/指令使HLS綜合出的RTL代碼更符合要求。接著，我們就可以利用HLS進行C層仿真與驗證、C/RTL混合仿真與驗證以及RTL代碼的生成與打包。綜上，HLS設計的主要工作內容包括三點：C/C++設計、Testbench設計以及約束的添加。下面就從這三點開始介紹。

一. Cordic算法的C++實現

算法頭文件Cordic.h代碼如下：

#include #include #define WA 17#define FA 14#define WS 16#define FS 14typedef ap_fixed di_t;typedef ap_fixed do_t;typedef ap_uint<2> flag_t;const do_t Kn = 0.607252935;const di_t PI = 3.1415926;void cir_cordic(di_t alpha, do_t &mysin, do_t &mycos);

頭文件的重點是聲明數據類型。這里采用HLS中特有的定點數形式，包含ap_fixed.h與ap_int.h即可。由于輸入為有符號弧度制（-3.1415～+3.1415），輸出為-1～+1，所以定義兩種數據精度：

di_t ：17bits = 1bit符號位 + 2bit整數 + 14bit小數

do_t：16bits = 1bit符號位 + 1bit整數 + 14bit小數

接著聲明了函數與兩個算法所需參數。

算法文件Cordic.cpp代碼如下（注意：由于使用C++頭文件ap_fixed.h，所以必須采用.cpp文件，否則編譯出錯）：

#include"Cordic.h"void pre_cir_cordic(di_t full_alpha, di_t &alpha, flag_t &flag){ if(full_alpha > PI/2) { alpha = PI - full_alpha; flag = 2; } else if(full_alpha < -PI/2) { alpha = -PI - full_alpha; flag = 3; } else { alpha = full_alpha; flag = 0; }}void cir_cordic_calculate(di_t alpha, flag_t flag, do_t &mysin, do_t &mycos, flag_t &flag_delay){ const int N = 15; do_t xi[N]; do_t yi[N]; di_t zi[N]; flag_t flag_delay_a[N]; xi[0] = Kn; yi[0] = 0; zi[0] = alpha; flag_delay_a[0] = flag; const di_t myarctan[15] = { 0.7853981, 0.4636476, 0.2449787, 0.1243549, 0.0624188, 0.0312398, 0.0156237, 0.0078123, 0.0039062, 0.0019531, 0.0009765, 0.0004883, 0.0002441, 0.0001221, 0.0000610 }; int m = 0; for(m = 0; m= 0) { xi[m+1] = xi[m] - (yi[m] >> m); yi[m+1] = yi[m] + (xi[m] >> m); zi[m+1] = zi[m] - myarctan[m]; } else { xi[m+1] = xi[m] + (yi[m] >> m); yi[m+1] = yi[m] - (xi[m] >> m); zi[m+1] = zi[m] + myarctan[m]; } flag_delay_a[m+1] = flag_delay_a[m]; } mysin = yi[N-1]; mycos = xi[N-1]; flag_delay = flag_delay_a[N-1];}void post_cir_cordic(do_t mysin, do_t mycos, flag_t flag_delay, do_t &sin_out, do_t &cos_out){ switch(int(flag_delay)) { case 2: sin_out = mysin; cos_out = -mycos; break; case 3: sin_out = mysin; cos_out = -mycos; break; default: sin_out = mysin; cos_out = mycos; break; }}void cir_cordic(di_t full_alpha, do_t &sin_out, do_t &cos_out){ di_t alpha; flag_t flag; do_t mysin; do_t mycos; flag_t flag_delay; pre_cir_cordic(full_alpha, alpha, flag); cir_cordic_calculate(alpha, flag, mysin, mycos, flag_delay); post_cir_cordic(mysin, mycos, flag_delay, sin_out, cos_out);}

算法主要有三個函數組成：

1.pre_cir_cordic：將輸入角度從-π～+π映射到 -π/2～+π/2中。

2.cir_cordic_calculate：利用旋轉公式進行Cordic算法計算，這里設置旋轉次數為15次，精度較高。

3.post_cir_cordic：根據輸入角度矯正輸出值正負。

最后，通過cir_cordic函數實現上述三個函數的整合。至此，Cordic算法的C++設計結束。

二. Testbench設計

為了驗證設計的正確性，需要編寫Testbench對C++代碼以及綜合后的RTL進行測試。本文的Testbench.cpp代碼如下：

#include "Cordic.h"#include #include #include #include #include #include using namespace std;#define RAND (rand()%181) - (rand()%181)#define Test_round 100#define STANDARD 0.01int main(){ srand(RAND_MAX); int i; for(i=0; iSTANDARD || abs((float)(cos_ref - cos_out))>STANDARD) { cout<<"Error: error is too big"<

本測試平臺利用隨機數生成-π～+π的測試向量對程序進行測試。以math.h中的三角函數作為評判標準。為了縮短時間，選擇100組測試向量進行測試，若算法誤差大于給定值，則報錯；若算法誤差均小于給定值，則輸出驗證通過信息。C驗證平臺設計完成。

三. 驗證與directives的添加

1.初步算法的C仿真與綜合

根據上述代碼，可以對工程進行C仿真，仿真結果如下：

C仿真結果

可以看出C仿真通過，算法正確。接著綜合工程，得到綜合結果如下：

C綜合報告

可以看出代碼時鐘符合要求，但是Latency（延遲）和Interval（吞吐量倒數）較大。此時吞吐量較小，64個時鐘輸出一個計算結果，并沒有發揮FPGA的并行優勢，所以需要添加Directives對工程綜合進行約束。

2.Directives添加

由于Cordic算法中旋轉公式部分為循環，所以將循環展開并加入流水線可以大大減小延時以及增加吞吐量。同時也對計算函數加入流水線以提高吞吐量。建立一個新的solution：Add_Directives，其Directive添加結果如下：

Directive添加結果

此時再對算法進行綜合，得到綜合報告對比如下：

綜合報告對比

可以看出添加Directives后，吞吐量大大提高，已經達到最大值，即每個時鐘都輸出一個計算結果。算法延時也從63個clk減小到4個clk，此時RTL代碼已經較為理想。

3.C/RTL聯合仿真

由上，代碼設計部分與約束添加已經全部完成，下面進行聯合仿真，對RTL代碼進行驗證。驗證報告如下：

混合仿真報告

可以看出RTL仿真與C仿真均通過，說明設計正確。利用Vivado simulator打開RTL仿真波形，如下：

RTL仿真波形

可以看出RTL波形中明顯體現出4 clk的Latency和1 clk的Interval，并且利用計算器進行驗算，證明計算結果正確，所以RTL代碼綜合成功。

四. IP打包

直接利用HLS進行IP打包即可生成IP核。在相應工程中引入IP核路徑（在對應solution內的impl文件夾內）即可調用HLS生成的IP核。本IP核接口如下：

Cordic IP

那么根據上節仿真波形進行接口輸入的描述就可以使用該IP。至此，整個HLS設計過程結束。

五. 總結

整個HLS設計過程還是比較清晰的，重點在于了解HLS的支持范圍以編寫符合規范的高層次代碼，其次是對硬件有一定認識以引入合適的directives。HLS的確在很大程度上加快了設計進度，使用也非常方便，所以我以后決定還是從RTL層面進行設計，因為那樣覺得自己更NB一點。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

RTL

RTL

+關注

關注
1

文章
382

瀏覽量
59155
HLS

HLS

+關注

關注
1

文章
127

瀏覽量
23708

原文標題：利用Xilinx HLS將C++代碼快速部署于FPGA（Cordic算法）

文章出處：【微信號：zhuyandz，微信公眾號：FPGA之家】歡迎添加關注！文章轉載請注明出處。

評論

相關推薦

Vivado HLS視頻庫加速Zynq-7000 All Programmable SoC OpenCV應用

SoC器件上快速地加速和集成您的計算機視覺應用。本次研討會將通過對一個具體案例的流程進行“逐層拆解（Step-by-Step）一個設計案列”的方式，向您介紹如何利用Vivado HLS

發表于 12-30 16:09

熟悉Vivado HLS基本功能要多少時間？

您好Xilinx的用戶和員工，我們正在考慮購買Zynq 7000用于機器視覺任務。我們沒有編程FPGA的經驗，并希望使用Vivado HLS來指導和加速我們的工作。關于這種方法的一些問題：您對

發表于 03-25 09:04

【正點原子FPGA連載】第一章HLS簡介-領航者ZYNQ之HLS 開發指南

主要可以從“設計的重用”和“抽象層級的提升”這兩個方面來考慮。Xilinx推出的Vivado HLS工具可以直接使用C、C++或System C來對Xilinx系列的FPGA進行編程，

發表于 10-10 16:44

嵌入式硬件開發學習教程——Xilinx Vivado HLS案例（流程說明）

對Xilinx可編程邏輯器件進行開發，可加速算法開發的進程，縮短產品上市時間。本次案例用到的是創龍科技的TLZ7x-EasyEVM-S開發板，它是一款基于Xilinx Zynq-700

發表于 11-11 09:38

嵌入式HLS 案例開發步驟分享——基于Zynq-7010/20工業開發板（4）

(High-Level Synthesis，高層次綜合) 工具支持將 C 、C++等語言轉化成硬件描述語言，同時支持基于 OpenCL 等框架對 Xilinx 可編程邏輯器件進行開發，可加速算法開發的進程，縮短

發表于 01-01 23:46

嵌入式HLS 案例開發步驟分享——基于Zynq-7010/20工業開發板（3）

綜合) 工具支持將 C 、C++等語言轉化成硬件描述語言，同時支持基于 OpenCL 等框架對 Xilinx 可編程邏輯器件進行開發，可加速算法開發的進程，縮短產品上市時間。測試板卡是基于創龍科技

發表于 01-01 23:50

嵌入式HLS 案例開發步驟分享——基于Zynq-7010/20工業開發板（3）

，高層次綜合) 工具支持將 C 、C++等語言轉化成硬件描述語言，同時支持基于 OpenCL 等框架對 Xilinx 可編程邏輯器件進行開發，可加速算法開發的進程，縮短產品上市時間。測試板卡是基于創

發表于 08-24 14:52

嵌入式HLS 案例開發步驟分享——基于Zynq-7010/20工業開發板（4）

(High-Level Synthesis，高層次綜合) 工具支持將 C 、C++等語言轉化成硬件描述語言，同時支持基于 OpenCL 等框架對 Xilinx 可編程邏輯器件進行開發，可加速算法開發的進程，縮短

發表于 08-24 14:54

【KV260視覺入門套件試用體驗】硬件加速之—使用PL加速矩陣乘法運算（Vitis HLS）

四、硬件加速之—使用PL加速矩陣乘法運算（Vitis HLS）前四期測評計劃：一、開箱報告，KV260通過網線共享PC網絡二、Zynq超強輔助-PYNQ配置，并使用XVC(Xilinx

發表于 10-13 20:11

關于ZYNQ HLS圖像處理加速總結的分享

HLS工具以個人的理解，xilinx將HLS（高層次綜合）定位于更方便的將復雜算法轉化為硬件語言，通過添加某些配置條件HLS工具可以把可并行化的C/C++的代碼轉化為vhdl或ver

發表于 10-12 17:34 ?2100次閱讀

利用Vivado HLS加速運行慢的軟件

大，我是否能夠利用Vivado HLS完成這項要求較高的運算呢？我開始從軟件方面考慮這個轉換，我開始關注軟件界面。畢竟，HLS創建專用于處理硬件接口的硬件。幸好Vivado HLS支

發表于 02-09 02:15 ?336次閱讀

利用Vitis HLS tcl shell一鍵跑通視覺加速例程

? 本文給想直接使用Vitis HLS 工具在 Standalone 模式下調用 Xilinx Vision Library L1 API 的小伙伴提供了一個非常容易上手的腳本文件。在論壇上遇到

發表于 12-29 11:12 ?3197次閱讀

重點介紹hls軟件的使用方法和優化方法

本系列教程演示如何使用xilinx的HLS工具進行算法的硬件加速。

發表于 06-17 10:20 ?6417次閱讀

基于Vitis HLS的加速圖像處理

Vitis Vision庫是OpenCV和Vision功能的加速庫，可在Vitis環境中使用，這些庫的L1目錄是示例設計。為了適應各種用戶環境，從2020.1版本開始，Xilinx不再

發表于 02-16 16:21 ?2118次閱讀

如何使用HLS加速FPGA上的FIR濾波器

電子發燒友網站提供《如何使用HLS加速FPGA上的FIR濾波器.zip》資料免費下載

發表于 06-14 15:28 ?1次下載

FPGA之家
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot JTAG簡介 JTAG和SWD之間的區別
Hot 常見電子元器件圖片及名稱

New Alpha半透明圖形疊加算法Matlab+Verilog的設計實現
New 視頻采集與處理入門：BT656標準介紹

精選推薦
更多

文章

資料

帖子

FPGA核心板上市！紫光同創Logos-2和Xilinx Artix-7系列

米爾電子
20小時前

121 閱讀

一種新的微帶線和矩形波導集成形結構研究

機電信息雜志
14小時前

264 閱讀

小體積大能量|Giada杰和科技桌面云終端Y-BOX S2拆機測評

焦點訊
14小時前

357 閱讀

一文詳解LDO電源的基礎知識設計及應用

云深之無跡
17小時前

365 閱讀

全國產RK3568J + FPGA的PCIe、FSPI通信實測數據分享！

Tronlong創龍科技
17小時前

153 閱讀

美國CELL-DYN 1700血細胞計數儀電路原理分析

一刀兩斷
128

免費

195下載

基于TC962_Typical Application直流到直流單輸出電源的參考設計

kasdlak
385.07KB

免費

5下載

Netflix Servo應用運行指標監控

kasdlak
0.41 MB

免費

3下載

NgKeyboardTracker iOS鍵盤

劉玉蘭
7.85 MB

免費

0下載

ESP32 AT指令集與使用示例

jf_00080687
4.84 MB

免費

18下載

源碼系列：基于 FPGA 的 USB2.0 設計

FPGA技術江湖
1天前

112 閱讀

嵌入式學習-飛凌嵌入式ElfBoard ELF 1板卡-VMware設置成橋接模式后沒有VMnet0

jf_13411809
1天前

600 閱讀

淺談Pango_Design_Suite工具的安裝

yinwuqing
1天前

278 閱讀

一文通曉FPC軟板，從基礎到工藝的深度解讀

鄒夢雨
2天前

300 閱讀

嵌入式學習-飛凌嵌入式ElfBoard ELF 1板卡-如何移植NCNN？

jf_13411809
2天前

427 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看