<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Arm推動生成式AI落地邊緣!全新Ethos-U85 AI加速器支持Transformer 架構,性能提升四倍

花茶晶晶 ? 來源:電子發燒友 ? 作者:黃晶晶 ? 2024-04-16 09:10 ? 次閱讀

電子發燒友網報道(文/黃晶晶)在嵌入式領域,邊緣與端側AI推理需求不斷增長,Arm既有Helium 技術使 CPU 能夠執行更多計算密集型的 AI 推理算法,也有Ethos 系列 AI 加速器,以滿足更高性能和更復雜的 AI 工作負載。Ethos-U NPU系列是業界首款 AI 微加速器,英飛凌、恩智浦半導體、奇景光電 (Himax)、Alif Semiconductor 和 Synaptics 等領先企業均已推出搭載 Ethos-U 的量產芯片。最近,Arm發布Arm Ethos-U85 AI加速器,這款加速器在性能、算力、應用場景方面進一步拓展,著眼于未來幾年的邊緣AI的應用所需。

全新Arm Ethos-U85 AI加速器

與上一代產品相比,Ethos-U85 性能提升四倍,能效提高 20%,它支持MAC 單元從 128 個擴展到 2048 個(在 1GHz 時,算力實現 4 TOPs)。Ethos-U85 提供了相同的一致工具鏈,實現無縫的開發者體驗。全新 Ethos-U85 NPU 支持TensorFlow Lite 和 PyTorch 等 AI 框架。Ethos-U85可滿足于智能家居、零售、工業等新興的邊緣 AI 場景對更高性能計算的需求。

wKgZomYclwuAXCUGAAKIwINsqQs457.png
圖:Arm Ethos-U85 提供卓越的神經網絡加速功能


Ethos-U85支持Transformer 架構和卷積神經網絡 (CNN) 以實現 AI 推理。Arm 物聯網事業部業務拓展副總裁馬健Chloe Ma分析,Ethos-U85 不僅僅提供卷積神經網絡 (CNN) 所需的權重矩陣乘的運算,還支持矩陣相乘,這是 Transformer 架構網絡的一個基本組成部分。Ethos-U85 增加對Transformer 架構網絡的支持,這是優化大模型邊緣落地微調時間、提升模型泛化的一個關鍵特性。

馬健表示:“基于 Transformer 的模型具有優異的泛化功能,它將更快地驅動新 AI 應用的發展。Transformer 在視覺和生成式 AI 用例中,比如視頻理解、圖文結合,圖像增強與生成、圖像分類和目標檢測等方面都極有價值。Transformer 架構網絡的注意力機制容易利用并行計算來實現,提高硬件使用效率,使得這些模型能夠部署在計算資源有限的邊緣設備上。開發者可以通過選用針對 Transformer 架構網絡優化的設計,發掘邊緣 AI 的新機遇,使這些應用享有更快的推理、更優化的模型性能和可擴展性?!?br />
Ethos-U85 不僅支持低功耗MCU的AI加速。在高性能邊緣計算系統中,Ethos-U85與Armv9 Cortex-A CPU相結合,為基于應用處理器智能物聯網平臺上運行的AI任務實現加速。這將使 Ethos-U85 能夠在工業機器視覺、邊緣網關、可穿戴設備和消費類機器人等應用中,帶來高效能的邊緣推理。

全新Arm Corstone-320智能物聯網參考設計平臺

Corstone-320 包含了 Cortex-M 系列最高性能的嵌入式處理器 Cortex-M85,Ethos-U85 NPU AI 加速器以及Arm Mali-C55 ISP等,以實現為視覺應用優化的低功耗系統。與此前推出的Arm物聯網參考設計一致,Corstone-320 不僅僅提供芯片計算子系統 IP 組合,還附帶了軟件、AI 模型庫和開發工具,以實現軟件的復用,同時也利用了 Arm 強大的生態系統。它還附帶了仿真 Corstone-320 完整系統的 Arm 虛擬硬件,以及單獨的 CPU 和 NPU 的固定虛擬平臺 (FVP) 模型,以簡化開發并加速產品設計,支持軟硬件并行協同開發。這種提供邊緣 AI 和智能物聯網計算子系統全套軟硬件和工具鏈的方法,使得合作伙伴能夠在一系列性能點上快速開發,并聚焦于打造差異化價值。

wKgZomYclyuAcbh3AAE7eIyZSLw925.png
圖:Arm 助力加速邊緣 AI 設備部署進程


馬健介紹,全新的參考設計是針對實際工作負載開發的,參考用例包括部署在智能家居中的電池供電攝像系統,以及在工業和零售系統中的低幀率網絡攝像頭。同時,Corstone-320 參考設計提供了有安全保證的軟硬件組合,使得在此參考設計基礎上開發的合作伙伴們能夠順利地通過 PSA Certified Level 2 認證,實現對區域和全球安全標準的合規??傊?,通過 Corstone-320 預先集成、預先驗證的參考設計模版,Arm 能幫助合作伙伴減少邊緣智能芯片開發的成本和時間。

基于 Arm 平臺的 AI 軟件生態系統

“只有 Arm 計算平臺才能提供 AI 從云到端、現代敏捷開發和部署流程中所需的特性和功能,實現基于量產驗證的一致架構,并采用統一工具鏈完成AI 轉型?!瘪R健說道。實際上,一致性的工具鏈和平臺對于開發者而言非常重要,尤其是面對物聯網碎片化,加上AI功能引入的復雜性,如果缺少一個良好的生態、工具支持,將耗費開發者大量的開發時間。

隨著邊緣 AI 的持續擴展,簡單易用才更適于普及推廣,因此物聯網生態鏈上下游的芯片與系統供應商、算法軟件開發者與集成商們匯聚在Arm計算平臺。目前,包括開發者、數據科學家、學術界在內的 AI 研究開發社區,不僅持續受益于 Arm 生態系統與合作伙伴提供的豐富信息與知識,也圍繞 Arm 計算平臺構建日益增長的軟件和工具生態系統,以及開源軟件庫和 AI 框架,以更簡化的開發流程,擴展邊緣 AI 的部署。

wKgZomYclzqAGsH9AAFhwlxkXtU102.png
圖:基于 Arm 平臺的 AI 軟件生態系統

馬健舉例說:“大家熟知的 PyTorch 開源 ML 框架,廣泛用于構建和訓練神經網絡模型,而我們也很高興看到 PyTorch 基金會投資邊緣 AI,發布針對移動和邊緣設備推理工具包 ExecuTorch,提供了輕量級運行時 (Runtime) 和算子注冊表,覆蓋了PyTorch生態系統中的各類模型。此外,由于 Arm 特有的 IP 授權許可模式和開放生態,OEM 和 ODM 可以有多種基于 Arm 架構和計算平臺的芯片與模組選擇,更靈活地開發適于最終應用的系統方案?!?br />
小結:

隨著邊緣 AI 的持續發展,Arm 始終處于推動市場和技術進步的核心地位,從 Cortex-M 嵌入式處理器的 Helium 矢量增強指令集,到 Cortex-A 應用處理器的 SVE、SVE2、SME 對矢量和矩陣運算的優化,再到 Ethos-U AI 加速器,Arm 不斷豐富產品線并拉高性能。

馬健表示,Arm 不會止步于此。隨著大模型持續通過量化、剪枝和聚類技術來縮減優化模型,使大模型適于在邊緣和超級終端設備部署,Arm認為大小模型云邊端結合成為未來 AI 產品的重要發展趨勢,也是 AI 應用賦能行業發展的重要方向。而 Arm 已經為此做好準備,來挑戰物聯網與大模型、多模態 AI 結合的性能與效率極限。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • ARM
    ARM
    +關注

    關注

    134

    文章

    8635

    瀏覽量

    361584
  • AI
    AI
    +關注

    關注

    87

    文章

    26322

    瀏覽量

    263922
  • AI加速器
    +關注

    關注

    1

    文章

    61

    瀏覽量

    8553
收藏 人收藏

    評論

    相關推薦

    Arm推第三代邊緣AI加速器Arm Ethos-U85

    除了Ethos-U85之外,Arm還推出了全新的物聯網參考設計平臺Corstone-320。該平臺將Arm最高性能的Cortex-M
    發表于 04-16 11:09 ?58次閱讀
    <b class='flag-5'>Arm</b>推第三代<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b><b class='flag-5'>加速器</b>:<b class='flag-5'>Arm</b> <b class='flag-5'>Ethos-U85</b>

    Arm發布第三代NPU,適用于工業自動化等場景,性能提升四倍

    Ethos-U85 在能源效率上相比前作提高了 20%,且可兼容常用神經網絡以達 85% 的利用率。其設計適配基于 Arm Cortex-M / A 處理器內核的系統,對內存延遲有較強適應性。
    的頭像 發表于 04-12 16:13 ?391次閱讀

    Arm Ethos-U85:滿足物聯網面向AI時代的高性能需求

    隨著人工智能 (AI) 不斷對我們的日常生活產生越來越大的影響,其推理任務也逐漸從云端遷移到邊緣側和端側。
    的頭像 發表于 04-09 17:04 ?434次閱讀
    <b class='flag-5'>Arm</b> <b class='flag-5'>Ethos-U85</b>:滿足物聯網面向<b class='flag-5'>AI</b>時代的高<b class='flag-5'>性能</b>需求

    Arm推出新一代Ethos-U AI加速器全新物聯網參考設計平臺

    Arm 控股有限公司(納斯達克股票代碼:ARM,以下簡稱“Arm”)今日宣布推出 Arm Ethos-U85 神經網絡處理器 (NPU),是
    的頭像 發表于 04-09 17:02 ?485次閱讀
    <b class='flag-5'>Arm</b>推出新一代<b class='flag-5'>Ethos</b>-U <b class='flag-5'>AI</b><b class='flag-5'>加速器</b>及<b class='flag-5'>全新</b>物聯網參考設計平臺

    安謀科技趙永超:生成AI加速落地,行業應用創新從“芯”突破

    AI的發展機遇,以及企業要如何面對生成AI落地難題。 ? 隨著ChatGPT等生成AI
    的頭像 發表于 12-26 14:32 ?657次閱讀
    安謀科技趙永超:<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b><b class='flag-5'>加速</b><b class='flag-5'>落地</b>,行業應用創新從“芯”突破

    PCIe在AI加速器中的作用

    從線上購物時的“猜你喜歡”、到高等級自動駕駛汽車上的實時交通信息接收,再到在線視頻游戲,所有的這些都離不開人工智能(AI加速器。AI加速器是一種高
    的頭像 發表于 11-18 10:36 ?1193次閱讀
    PCIe在<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>中的作用

    AI加速器架構設計與實現》+第2章的閱讀概括

    首先感謝電子發燒友論壇提供的書籍和閱讀評測的機會。 拿到書,先看一下封面介紹。這本書的中文名是《AI加速器架構設計與實現》,英文名是Accelerator Based on CNN Design
    發表于 09-17 16:39

    AI加速器架構設計與實現》+學習和一些思考

    AI加速器設計的學習和一些思考 致謝 首先感謝電子發燒友論壇提供的書籍 然后為該書打個廣告吧,32K的幅面,非常小巧方便,全彩印刷,質量精良,很有質感。 前言 設計神經網絡首先要考慮的幾個問題
    發表于 09-16 11:11

    AI加速器架構設計與實現》+第一章卷積神經網絡觀后感

    AI加速器架構設計與實現》+第一章卷積神經網絡觀感 ? ?在本書的引言中也提到“一圖勝千言”,讀完第一章節后,對其進行了一些歸納(如圖1),第一章對常見的神經網絡結構進行了介紹,舉例了一些結構
    發表于 09-11 20:34

    阿里平頭哥發布首個 RISC-V AI 軟硬全棧平臺

    平臺通過軟硬件深度協同,較經典方案提升超 8 成性能,支持運行 170 余個主流 AI 模型,推動 RISC-V 進入高
    發表于 08-26 14:14

    Arm Ethos-U NPU處理入門指南

    感謝您使用Arm Ethos-U NPU處理系列。為您提供最好的使用Arm Ethos-U NPU開發機器學習(ML)應用程序的經驗設計我
    發表于 08-08 06:17

    Arm Ethos-U NPU應用程序開發概述

    到嵌入系統中,并使用兩個Arm連接到嵌入或外部存儲AMBA 5 AXI接口,M0和M1。 ?為了優化Ethos-U NPU的
    發表于 08-02 06:37

    【書籍評測活動NO.18】 AI加速器架構設計與實現

    經驗總結圖解NPU算法、架構與實現,從零設計產品級加速器當前,ChatGPT和自動駕駛等技術正在為人類社會帶來巨大的生產力變革,其中基于深度學習和增強學習的AI計算扮演著至關重要的角色。新的計算范式需要
    發表于 07-28 10:50

    亞馬遜云科技推出七項生成AI創新

    (Agents)功能,助力基礎模型完成復雜任務;Amazon EC2 P5實例正式可用,加速生成AI和高性能計算應用;Amazon OpenSearch Serverless
    的頭像 發表于 07-27 16:19 ?532次閱讀
    亞馬遜云科技推出七項<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>創新

    AI邊緣計算盒子是如何推動邊緣AI應用落地

    AI邊緣計算盒子(AI Edge Computing Box)是一種集成了邊緣計算和AI算法處理能力的設備,可以用于
    的頭像 發表于 05-26 14:08 ?678次閱讀
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>