<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Arm架構是如何開發的

Arm社區 ? 來源:Arm社區 ? 2023-11-23 16:31 ? 次閱讀

作者:Arm 架構與技術部產品管理總監 Martin Weidmann

隨著人工智能 (AI) 的興起和安全威脅的加劇,計算需求不斷提高。全球各種設備所依賴的基礎計算架構也必須持續向前推進。為此,我們的工程團隊不斷地在應用廣泛的 Arm 架構中加入新的功能和技術,同時我們的軟件團隊也在努力讓軟件能夠順利地適配這些未來的功能和技術。

Arm 架構是如何開發的

Arm 每年都會發布 Arm 指令集架構 (ISA) 的更新,這些更新是通過與 Arm 生態系統中的各類合作伙伴合作參與創建的。該流程涉及芯片合作伙伴、操作系統供應商、OEM 廠商,以及 Arm 內部的工程團隊和多家標準組織。

經過精心設計的 ISA 可確保軟件在未來數年內持續兼容新舊硬件。Arm 與 Linaro 等眾多合作伙伴緊密協作,讓諸如 Linux 內核和發行版等廣泛使用的軟件上游社區能支持 Arm ISA,以便建立龐大的開發者生態系統。

每年九月,我們都會發表一篇技術博客,分享該年度對 A-Profile 架構所作的一些重要增添。同時,我們也會在 Arm 開發者網站上發布完整的指令集和系統寄存器文檔[1]。

完整的 Arm 架構參考手冊[2] (Arm Architecture Reference Manual, Arm ARM) 也會每年更新一次。預計 2024 年初會發布包含 2023 年擴展內容的更新版?!皩W習架構 (Learn the Architecture)”[3]頁面同樣會在 2023 年和 2024 年更新。

技術博客和文檔的發布只是部署新架構的一小步。接下來我們還要同生態合作伙伴一起努力,確保一旦硬件準備就緒,開源軟件就能即刻支持新的架構功能。

2023 年,Arm 推出新特性以加強對人工智能 (AI)、機器學習 (ML) 和安全性的支持。Arm 架構的首要任務之一是讓安全的 AI 無處不在,而神經網絡 (NN) 的訓練是 AI 不斷進步和發展的關鍵。因此,2023 年的架構擴展增加了已在神經網絡中廣泛使用的新八位浮點格式,名為 FP8。為了提高安全性,我們還增加了“經檢查的指令運算 (Checked Pointer Arithmetic)”功能,該功能基于 Arm 內存標記擴展 (MTE)[4] 的現有支持而打造,可以幫助開發者快速發現內存安全違規,節省應用開發的成本和時間。

以下為今年新增的功能:

FP8

2022 年,Arm、Intel 和 Nvidia 宣布針對 FP8 展開合作。FP8 是一種交換格式,可以讓軟件生態系統輕松共享神經網絡模型,并讓 AI 計算能力不斷提高。作為 2023 年擴展的一部分,SME2、SVE2 和 Advanced SIMD (Neon) 增加了對 FP8 的支持。

FP8 支持兩種數據格式:E5M2 和 E4M3。這兩種格式在精度和范圍上有不同的取舍。

aa8b2f5a-7855-11ee-939d-92fbcf53809c.png

使用哪種格式由 FPMR 寄存器中的字段選擇。對于一條指令的不同輸入,可以選擇不同的格式,從而有效地處理各種格式的數據集。我們堅信,圍繞八位浮點格式的行業共創將帶來一系列好處,同時可使開發者專注于真正重要的創新和差異化。我們非常高興看到 FP8 將推動未來 AI 的發展。

熱遷移

熱遷移是指將虛擬機 (VM) 從一臺主機移動到另一臺主機上,而不影響其可用性和狀態。能夠高效地進行熱遷移對于大規模數據中心管理而言非常重要。

為了實現熱遷移,虛擬機管理程序要在 VM 仍在舊主機上運行時,就把它所占用的頁面復制到新主機上。這個過程通常要反復進行幾次,因為 VM 可能會修改已經復制的頁面。解決這個問題有不同的方法,但都要面對三項挑戰:

記錄:記錄 VM 修改過(污染過)的頁面。

調查:根據記錄判斷哪些頁面需要重新復制。

清理:每次迭代時重置記錄機制。

2023 年的擴展增加了幾項功能,可以幫助優化上述的三項挑戰。

FEAT_HDBSS 讓我們可以記錄日志,記錄 Stage 2 已被污染的頁面或塊。該機制解決了“記錄”成本問題,因為內存管理單元 (MMU) 可以在不中斷 VM 執行的情況下高效創建日志。日志也解決了“調查”成本問題,因為生成的數據是虛擬機管理程序可以有效使用的格式。

aad8ab18-7855-11ee-939d-92fbcf53809c.png

為了解決“清理”成本問題,FEAT_HACDBS 增加了一個加速器來清理 Stage 2 轉換表中的污染狀態。引擎利用污染頁面日志來定位需要更新的 Stage 2 轉換表描述符。

這些功能結合起來可以大幅提高熱遷移的性能和效率。

經檢查的指令運算

AArch64 支持多項功能,這些功能讓我們可以重新利用保存地址的寄存器高位。例如,Armv8.0-A 中引入的標記指針 (Tagged Pointer) 和 Armv8.5-A 中引入的 MTE。

軟件經常需要操作指針,比如給一個基地址加上一個偏移量。這通常是用加法或減法等常規算術運算來完成的。如果地址計算出現溢出,就可能會破壞寄存器中非地址位的信息。例如,如果使用 MTE,地址操作則可能會改變指針中存儲的標記。損壞的標記可能會導致處理器無法檢測到內存安全違規,如下所示:

aadcd8be-7855-11ee-939d-92fbcf53809c.png

2023 年的擴展引入了專門用于指針操作的新指令。這些指令包含多種針對指針的檢查,包括檢查 bits[63:56] 是否被修改并防止溢出。使用 尋址模式的內存加載和存儲指令也可以配置為保留 bits[63:56]。

以前面的 MTE 為例,新功能讓處理器能夠檢測指針的前八位是否已被修改。這意味著,如果 MTE 標記損壞,則會向軟件發出報告。

其他功能

其他新引入的增強功能包括:

當生成或檢查指針驗證 (PAC) 碼時,支持組合使用程序計數器 (Program Counter, PC) 和當前選擇的堆棧指針 (Stack Pointer, SP) 作為修飾符。

支持啟用了機密領域管理擴展 (RME)[5] 的設計,可以在 Granule Protection Tables 中支持 non-secure only,也可以禁用某些物理地址空間 (PAS)。

EL3 配置寫入陷阱。

斷點支持地址范圍和 mismatch 觸發,而無需鏈接。

支持將 SError 從 EL3 高效委派給 EL2 或 EL1 處理。

在接下來的幾個月,Arm 將與合作伙伴一起努力,確保軟件生態系統能夠在未來處理器上市后盡快利用發揮這些功能的優勢。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • ARM
    ARM
    +關注

    關注

    134

    文章

    8708

    瀏覽量

    362609
  • AI
    AI
    +關注

    關注

    87

    文章

    26909

    瀏覽量

    264693
  • 人工智能
    +關注

    關注

    1780

    文章

    44560

    瀏覽量

    231301
  • ARM架構
    +關注

    關注

    14

    文章

    168

    瀏覽量

    36021

原文標題:Arm A-Profile 架構 2023 擴展

文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    聯發科或將與英偉達開發Arm架構AI PC處理器

    據悉,聯發科正與英偉達合作,共同開發基于Arm架構的AI PC處理器。這款新芯片預計將在第三季度完成設計定案,第四季度進入驗證階段。
    的頭像 發表于 05-13 10:18 ?253次閱讀

    arm架構和x86架構區別 linux是x86還是arm

    ARM架構和x86架構是兩種不同的計算機處理器架構,它們在體系結構、指令集、應用領域等方面有著明顯的區別。Linux操作系統則具有廣泛的適配性,可以運行在各種
    的頭像 發表于 01-30 13:46 ?6906次閱讀

    x86與arm架構區別主板還是cpu

    開發的一種32位和64位計算機處理器架構,廣泛應用于個人計算機和服務器領域。ARM架構則是英國公司ARM Holdings
    的頭像 發表于 12-21 17:08 ?1060次閱讀

    Arm架構學習—開啟Armv9時代

    在上一篇文章“從A76到A78——在變化中學習Arm架構”中,我們了解了Arm處理器微架構的基本組成,介紹了Armv8架構最后幾代經典處理
    的頭像 發表于 11-27 16:46 ?702次閱讀
    <b class='flag-5'>Arm</b>微<b class='flag-5'>架構</b>學習—開啟Armv9時代

    AMD計劃生產基于Arm架構的CPU

    英偉達已經開始設計基于 Arm 架構的 CPU。該處理器將運行微軟 Windows 操作系統。此外,AMD 也計劃生產基于 Arm 架構的 CPU。
    的頭像 發表于 10-27 10:53 ?743次閱讀

    X86架構ARM架構的主要區別

    X86和ARM是兩種主要的CPU架構,X86架構的CPU是PC服務器行業的老大,而ARM架構的CPU則是移動端的老大。它們在設計理念、性能、
    的頭像 發表于 09-22 08:23 ?5736次閱讀
    X86<b class='flag-5'>架構</b>與<b class='flag-5'>ARM</b><b class='flag-5'>架構</b>的主要區別

    從電源架構遷移到ARM的應用說明

    本文檔的目的是強調那些參與將軟件應用程序從Power架構遷移到ARM平臺的人員感興趣的領域。 本文并不試圖將一種體系結構提升到另一種體系結構之上,只是為了清楚地解釋將現有軟件應用程序從一種體系結構
    發表于 08-22 06:09

    m3芯片相當于英特爾什么水平?

    m3芯片相當于英特爾什么水平? M3芯片是一種用于移動設備的處理器芯片,由ARM架構開發,可以用于智能手機、平板電腦和其他移動設備。它最初是由華為公司自主設計并制造的,后來被其他廠商采用。那么,M3
    的頭像 發表于 08-16 11:33 ?7097次閱讀

    rk3566和rk3588的區別

    不同,因此兩者的功能也略有不同。本文將詳細介紹RK3566和RK3588的異同之處,并分析它們在不同應用場景下的優劣勢。 一、處理器架構 RK3566處理器基于ARM架構開發,采用
    的頭像 發表于 08-15 17:44 ?8379次閱讀

    ARM體系結構參考手冊

    ARM體系結構已經發展到支持跨多種性能點實施的程度。 超過20億個部件的出貨量,使其成為許多細分市場的主導架構。 ARM處理器的架構簡單性傳統上導致了非常小的實現,而小實現允許設備具有
    發表于 08-11 07:10

    Arm架構的擴展詳解

    Arm架構的補充以版本增量的形式提供,稱為擴展。擴展允許我們根據合作伙伴的需求定期發布新功能,而無需制作主要架構的主要變化。 Arm每年都會發布一個新的擴展。Cortex cpu,它
    發表于 08-02 06:08

    米爾ARM+FPGA架構開發板PCIE2SCREEN示例分析與測試

    本次測試內容為基于ARM+FPGA架構的米爾MYD-JX8MMA7開發板其ARM端的測試例程pcie2screen并介紹一下FPGA端程序的修改。
    的頭像 發表于 07-08 14:38 ?481次閱讀
    米爾<b class='flag-5'>ARM</b>+FPGA<b class='flag-5'>架構</b><b class='flag-5'>開發</b>板PCIE2SCREEN示例分析與測試

    米爾ARM+FPGA架構開發板PCIE2SCREEN示例分析與測試

    本次測試內容為基于ARM+FPGA架構的米爾MYD-JX8MMA7開發板其ARM端的測試例程
    的頭像 發表于 07-07 14:15 ?488次閱讀
    米爾<b class='flag-5'>ARM</b>+FPGA<b class='flag-5'>架構</b><b class='flag-5'>開發</b>板PCIE2SCREEN示例分析與測試

    兩大架構RISC-V 和 ARM 的各種關系

    一、RISC-V 和 ARM 的相似之處 RISC-V 和 ARM 基本上都是 RISC(精簡指令集計算機)。RISC-V 和 ARM 都使用加載-存儲架構。意思是數據從內存中加載,在
    發表于 06-21 20:31

    X86架構Arm架構的區別

    X86架構ARM架構是主流的兩種CPU架構,X86架構的CPU是PC服務器行業的老大,ARM
    的頭像 發表于 06-16 12:50 ?1w次閱讀
    X86<b class='flag-5'>架構</b>與<b class='flag-5'>Arm</b><b class='flag-5'>架構</b>的區別
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>