<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

RA8 Cortex-M85 Helium入門指南（2）

Helium指令集

這里介紹的是Helium的匯編語言指令集，雖然大部分程序員不會直接使用這些指令，而是通過C語言或者高級語言編程實現，但是了解匯編語言指令集，可以有如下收獲：

在優化C代碼時，為了確定其是否被充分地矢量化，能夠審視編譯器的輸出以及熟悉指令集是非常有幫助的。

當調試不能正常工作的代碼時，通過閱讀反匯編代碼去理解每一行發生了什么，對于尋找代碼的問題是非常有用的。

了解指令集可能有助于編寫高效的代碼，甚至節省功耗，尤其是在使用原語函數的情況下。

Helium指令結構和其他Cortex-M處理器中的VFP（浮點）指令結構是相似的。

Helium指令格式如下：

Helium指令都是以字母V開始的，然后跟著如下符號，符合中的{}是可選的，<>是必須出現的：

mod：指令修飾符，可能沒有，也可能是Q（saturating）飽和，H（halving）減半，D（doubling）加倍，R（rounding）四舍五入中的一個。

op：具體操作，例如ADD（相加），SUB（相減），CMP（比較）等。

shape：有些指令中，可以選擇性的指定L（long）或N（narrow），這是 “形態” 相關的修飾符。

- L：Long表示輸入元素在操作前會被擴寬。1個8位的元素可能會被擴寬為16位或32位，或者1個16位元素被擴寬為32位。

- N：Narrow表示輸入元素在操作前會被壓縮。

extra：有些指令中的特定修飾符，可能是T（top），B（bottom），A（accumulate），X（exchange）或者V（across）中的一個。

cond：此處指定的條件僅適用于VPT（Predication）模塊?？赡苁荰（Then）或者E（Else）。

.dt：數據類型，可能是F（float）浮點，I（integer）整數，S（signed）有符號，U（unsigned）無符號。

dst：目標寄存器，可以是通用寄存器（R）或者矢量寄存器（Q）。

src：源寄存器，可以是通用寄存器（R）或者矢量寄存器（Q）。

rot：旋轉，用于一些操作復數的指令。

下面給出一條指令示例展示：

VLDRW.U32 Q0, [R0]

該指令中的首字母是V，表示這是一條Helium（或是Neon，或者浮點）指令，LDR表示寄存器從內存加載內容，W表示按字大小操作，，，都為空，數據類型是U32，無符號32位整數。加載的目標是128位寄存器Q0（矢量寄存器），源是標量寄存器R0指向的內存地址。該指令表示將從R0存儲的地址中加載4個32位寬的數據到Q0寄存器中。

Helium指令分類如下：

Helium編程方式

Helium編程方式目前來說，一共4種。

矢量庫

自動矢量化

原語函數（intrinsics）編程

匯編指令編程

矢量庫

目前，ARM CMSIS DSP和NN是已經對Helium優化好的Helium矢量庫。使用矢量庫來進行Helium編程，是最簡單的方法。

CMSIS DSP是數字信號處理函數庫，具有針對8位整數，16位整數，32位整數和32位浮點數的不同函數，提供了豐富的函數，包括基本數學函數，復數數學函數，濾波器函數，變換函數，矩陣操作函數，電機控制函數，插值函數，統計函數等。該庫包含了這些函數的Helium優化版本，并不斷更新迭代中。

CMSIS NN是神經網絡函數庫，以最小的內存開銷針對Cortex-M處理器優化的軟件內核，同樣地，這些函數也可以利用Helium得到最優性能。

CMSIS矢量庫中的函數代碼有3個C預處理器定義來選擇Helium版本。

#define ARM_MATH_HELIUM
#define ARM_MATH_MVEI    //支持整型Helium
#define ARM_MATH_MVEF    //支持浮點型Helium

比如CMSIS DSP中的 arm_clip_f32函數，可以看到該函數已經使用了Helium原語函數。

比如CMSIS NN中的arm_nn_lstm_update_cell_state_s16函數，可以看到該函數使用了Helium原語函數。

當使用矢量庫的時候，不同編譯器中的MVE設置

Keil MDK 5（5.38以上版本）

在圖標“Options for target”中選擇“Target”頁面中的“Vector Extensions”,通過下拉列表選擇

“Not Used”（不使用helium，即宏ARM_MATH_HELIUM沒有被定義，使用標量相關函數）。

“Integer”（宏ARM_MATH_HELIUM和ARM_MATH_MVEI被定義，使用整型Helium）。

“Integer + Floating Point” （宏ARM_MATH_HELIUM，ARM_MATH_MVEI和ARM_MATH_MVEF被定義，使用整型和浮點型Helium）。

IAR EWARM（v9.40.1以上版本）

通過右鍵選擇項目名稱后，在 “Options”中的“General Options”頁面下的“32-bit”中的“Advanced SIMD(NEON/HELIUM)”。

勾選（即選中，ARM_MATH_HELIUM，ARM_MATH_MVEI和ARM_MATH_MVEF被定義，使用整型和浮點型Helium）。

不勾選（即不選中），編譯的時候會報“MVE support not enable”錯誤。

e2 studio

e2 studio中可以使用LLVM或者GCC工具鏈，在使用矢量庫的時候，不需要設置，默認是啟用的。如果通過設置編譯參數來禁用，編譯的時候會報“MVE support not enable”錯誤。

自動矢量化

自動矢量化就是編譯器在C/C++代碼中自動檢測到可以使用Helium指令并執行優化的過程。優化后的代碼在速度和尺寸方面可能與手工優化的匯編代碼或包含原語函數的C代碼一樣高效，這只需要很少的時間去編寫和調試代碼，而且無須對目標微架構有詳細了解。C代碼也更有可移植性。

如下面的代碼，這是一種很常見的普通寫法，一個for循環里面做一些邏輯判斷處理。

點擊可查看大圖

通過使用自動矢量化后的反匯編代碼如下，紅色框部分的代碼里面已經出現了Helium的匯編指令。

自動矢量化和編譯器的優化等級設置有關，當Arm Complier 6和LLVM編譯器的優化等級為-O2或者更高時，自動矢量化默認使能，在MDK ArmComplier 6中可以使用“-fno-vectorize”選項可以禁止自動矢量化。當優化等級為-O1時，自動矢量化默認禁止，使用“-fvectorize”選項可以使能自動矢量化，當優化等級為-O0時，自動矢量化總是被禁止。其他編譯器的行為可能不同，具體可以查閱對應的文檔。

原語函數（intrinsics）編程

原語函數是允許利用Helium而不必直接編寫匯編代碼的一組C/C++函數。ACLE文檔中包括Helium原語規范。目前最新的文檔為mve-2021Q4。原語函數的實現包含在arm_mve.h文件中。函數包含簡短的匯編語言部分，它們被內聯到調用的代碼中。

使用原語函數有如下優點：

程序員能夠直接訪問Helium指令集，這允許編寫充分優化的代碼，利用所有Helium特性。

C/C++可用于大多數代碼，只有當需要優化而矢量化C編譯器無法執行優化時，才會使用Helium原語。這就意味著只有在必要時才使用底層代碼。

相比于采用匯編語言編寫的代碼，含有Helium原語的C和C++代碼可以移植到一個新的平臺，僅需要少量修改，甚至無須修改。

使用原語避免了很多與直接使用匯編語言編碼相關的難點。

原語函數中，Helium矢量數據類型名字模式如下所示，這在“arm_mve.h”中有詳細定義和描述。

x_t

type：元素類型，可能是int整形，uint無符號整形，float浮點。

size：元素大小，可能是8位，16位，32位。

number_of_lanes：通道總數?？梢允?6通道，8通道，或者4通道。

如：

uint8x16_t是一個描述16個無符號8位的矢量。

int16x8_t是一個描述8個16位的矢量。

float16x8_t是一個描述4個16位浮點數（半精度）的矢量。

float32x4_t是一個描述4個32位浮點數（單精度）的矢量。

注：Helium是128位寄存器，它的元素大小和通道總數相乘的結果只能是128，不能是64，也就是說，不支持int8x8_t/uint8x8_t/int16x4_t/uint16x4_t/float16x4_t/float32x2_t數據類型。這點和Neon是不同的。Neno可以支持64和128。

Helium矢量數組結構體類型如下：

xx_t

可以發現，矢量數組結構體名字只比單個矢量數據類型多了一個length_of_array。它表示一共有幾個helium寄存器組成，即helium寄存器的數量。在該結構體中，包含一個名為val的元素，此結構體類型映射Helium加載和存儲操作訪問的寄存器，Helium可以用一條指令加載/存儲多達4個寄存器。結構定義示例如下：

struct int16x8x2_t

{

int16x8_t val[2];

};

此結構類型僅由加載、存儲、轉置、交織和去交織指令使用；要對實際數據執行操作，請從各個寄存器中選擇元素。如：.val[0] 和.val[1]。

下圖代碼片段是使用原語函數進行矢量相乘的例子。

原語編程里面還涉及原語預測，原語尾部處理等知識，本處不在展開說明，詳細信息可以訪問arm官網查閱相關文檔了解和學習。

匯編語言編程

在匯編代碼中直接編寫Helium指令是很沒有必要的，通常只會在特殊的場景下才會這樣做。即當編程人員可以比編譯器更好地分配寄存器時，比如有太多重寫變量和輸入輸出變量。

下圖所示為復數矢量點積的匯編語言代碼。

審核編輯：劉清

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

處理器

處理器

+關注

關注
68

文章
18538

瀏覽量
223694
電機控制

電機控制

+關注

關注
3484

文章
1740

瀏覽量
265397
C語言

C語言

+關注

關注
180

文章
7548

瀏覽量
131335
LDR

LDR

+關注

關注
0

文章
93

瀏覽量
7489
Cortex-M85

Cortex-M85

+關注

關注
0

文章
13

瀏覽量
497

原文標題：RA8 Cortex-M85 Helium入門指南（2）

文章出處：【微信號：瑞薩MCU小百科，微信公眾號：瑞薩MCU小百科】歡迎添加關注！文章轉載請注明出處。

評論

相關推薦

RA8 Cortex-M85 Helium技術入門指南（1）

瑞薩電子在2023年10月底推出強大的RA8系列MCU，具備突破性的3000 CoreMark，并可滿足客戶應用所需的完全確定性、低延遲及實時操作要求。

的頭像

發表于 05-14 14:30 ?494次閱讀

<b class='flag-5'>RA8</b> <b class='flag-5'>Cortex-M85</b> <b class='flag-5'>Helium</b>技術<b class='flag-5'>入門</b><b class='flag-5'>指南</b>（1）

Arm Cortex-M處理器—Cortex-M85介紹

Arm發布了新一代的Cortex-M處理器，Cortex-M85。簡單粗暴的打個比方：Cortex-M85 ≈ Cortex-M7TrustZoneHelium（

發表于 07-15 14:59

Arm Cortex-M85在安全設計上除了*** 還有哪些提升嗎？

Arm Cortex-M85在安全設計上除了*** 還有哪些提升嗎？

發表于 09-20 14:46

請問一下Arm Cortex-M85性能的提升是對總線進行了優化嗎？

請問一下Arm Cortex-M85性能的提升是對總線進行了優化嗎？

發表于 09-21 11:28

請問Arm Cortex-M85內核相對于M7內核有哪些提升

請問Arm Cortex-M85內核相對于M7內核有哪些提升？有沒有哪位大神科普一下

發表于 09-22 10:37

IAR為瑞薩RA8系列MCU開發提供支持

嵌入式開發軟件和服務的全球領導者IAR今日宣布，其最新發布的IAR Embedded Workbench for Arm 9.40.2版本中無縫集成了對瑞薩（Renesas）RA8系列MCU的支持，為基于Arm Cortex-M85的R

發表于 11-02 17:08 ?729次閱讀

業界首款基于Arm Cortex-M85的超高性能MCU

瑞薩電子重磅發布了業界首款基于Arm Cortex-M85處理器的全新超高性能MCU：RA8M1系列微處理器。 RA8系列產品具備業界卓越的6.39 CoreMark/MHz測試分數，縮小了MCU與MPU之間的性能差距。

發表于 11-10 09:44 ?321次閱讀

新品發布 | 瑞薩推出面向圖形顯示應用和語音/視覺多模態AI應用的全新RA8 MCU產品群

的各類圖形顯示和語音/視覺多模態AI要求。所有RA8系列MCU均利用Arm Cortex-M85處理器和Arm的Helium 技術所帶來的高性能

發表于 12-15 16:00 ?412次閱讀

瑞薩電子推出全新RA MCU家族產品RA8

瑞薩電子推出的全新RA MCU家族產品RA8，是業界首款搭載Arm Cortex-M85內核超高性能MCU，可滿足工業自動化、家電、智能家居、消費電子、樓宇/家庭自動化、醫療和AI領域的各種計算密集型應用。

發表于 12-20 12:25 ?606次閱讀

AMEYA360 | 皇華：瑞薩面向電機控制應用推出性能卓越的RA8 MCU

AMEYA360 | 皇華：瑞薩面向電機控制應用推出性能卓越的RA8 MCU：全球半導體解決方案供應商瑞薩電子今日宣布推出基于Arm? Cortex?-M85處理器的RA8T1微控

發表于 02-02 16:02 ?284次閱讀

瑞薩電子發布業界首款基于Cortex-M85處理器的全新超高性能MCU

去年10月，瑞薩電子重磅發布了業界首款基于Cortex-M85處理器的全新超高性能MCU：RA8M1系列微處理器。今年，瑞薩將舉辦RA8巡回技術研討會。

發表于 02-26 10:27 ?301次閱讀

Cortex-M85內核單片機如何快速上手

2022年4月，Arm推出了全新的MCU級內核Cortex-M85。截止目前（2024年2月），Cortex-M85是最新、最強的Cortex-M內核。

發表于 02-29 09:35 ?318次閱讀

業界首款基于Arm Cortex-M85處理器的MCU

所有RA8系列MCU均利用Arm Cortex-M85處理器和Arm的Helium技術所帶來的高性能，結合矢量/SIMD指令集擴展，能夠在數字信號處理器（DSP）和機器學習（ML）的實施方面獲得相比

發表于 03-05 14:14 ?233次閱讀

瑞薩電子RA家族推出RA8系列高算力通用MCU

瑞薩電子RA家族推出RA8系列高算力通用MCU，是業界首款基于Arm? Cortex?-M85（CM85）內核的32位MCU，主頻高達480

發表于 04-02 14:14 ?519次閱讀

RA8 Cortex-M85 Helium入門指南（3）

我們將通過一個RGBA圖像數據中的R（紅色），G（綠色），B（藍色）3種色彩通道數據分離的例子，介紹使用helium原語函數的解交織（deinterleaving）功能。

發表于 05-16 14:33 ?156次閱讀

瑞薩MCU小百科
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 【方案分享】新型光伏MPPT寬壓、高效控制方案
Hot IIR濾波器簡介（下）

New 基于Arm Cortex-CM85內核的RA8D1作為控制器通過MIPI DSI實現LVGL顯示
New 求一種基于RX13T的風扇電機控制方案

精選推薦
更多

文章

資料

帖子

采用144核，能效提升66%！英特爾至強6處理器震撼上市，加速數據中心升級

章鷹觀察
8小時前

568 閱讀

如何移植FFmpeg

ElfBoard
2天前

525 閱讀

基于Arm Cortex-CM85內核的RA8D1作為控制器通過MIPI DSI實現LVGL顯示

瑞薩MCU小百科
2天前

747 閱讀

便攜式直流接地故障查找儀如何使用——每日了解電力知識

武漢摩恩
2天前

771 閱讀

重磅！英特爾發布intel3制程至強6能效核處理器，賦能數據中心能效升級

章鷹觀察
2天前

793 閱讀

cam350軟件下載

duke劉
未知

免費

859下載

自適應信號處理抗干擾算法的研究

lanlanw
920 KB

免費

35下載

McDonalds Fries Font麥當勞薯條字體

張桂蘭
0.66 MB

免費

2下載

monitor_agent主機監控節點

張霞
0.02 MB

免費

2下載

輸入/輸出功能評估板ADT7473EBZEVB數據手冊

12.16 MB

免費

0下載

I.MX6ULL-飛凌 ElfBoard ELF1板卡 - 如何在Ubuntu中編譯OpenCV庫(X86架構）

jf_25331175
3天前

655 閱讀

鴻蒙原生應用元服務開發-設備管理USB服務開發場景與接口

李洋水蛟龍
3天前

288 閱讀

嵌入式學習-飛凌ElfBoard ELF 1板卡 - 如何在Ubuntu中編譯OpenCV庫

jf_25331175
3天前

840 閱讀

【留言有禮】佳節至，分享“粽”要記憶，傳遞溫馨祝福，贏取精美禮品！

ElecFans小喇叭
4天前

891 閱讀

無刷電機用的單電阻采樣的FOC，拿天線貼著電機線或者貼近采樣芯片，電機就會停轉

剛剛回國弄
4天前

1382 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看