<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

提高TinyML、ML-DSP和深度學習工作負載的能效

CEVA ? 來源:CEVA ? 作者:CEVA ? 2023-11-09 13:10 ? 次閱讀

近來,對實時決策、降低數據吞吐量以及注重隱私的需求,已將人工智能處理的很大一部分工作轉移到邊緣。這一轉變催生了大量邊緣人工智能應用,每種應用都有著不同的要求,面臨著不同的挑戰。

據預測,2025年人工智能SoC市場規模將達到500億美元(資料來源:Pitchbook Emerging Tech Research),邊緣人工智能芯片預計將在這一市場中占據重要地位。

人工智能處理向邊緣轉移及提高能效勢在必行

人工智能處理向邊緣轉移標志著一系列應用(從物聯網傳感器到自主系統)進入了實時決策的新時代。這一轉移有助于:減少延遲,這對即時響應起到決定性作用;通過本地處理提高數據隱私保證;支持離線功能,確保在遠程或具有挑戰性的環境中不間斷運行。由于這些邊緣應用在電池供電的設備上運行,能效有限,因此能效在這一變革中會成為焦點。

邊緣人工智能工作負載本質多元

確保邊緣人工智能處理能效的關鍵難題之一是工作負載本質多元。不同應用的工作負載大不相同,帶來獨特挑戰??傮w而言,所有人工智能處理工作負載可大致分為TinyML、ML-DSP深度學習工作負載。

TinyML:聲音分類、關鍵詞識別及人體存在檢測等任務需要在傳感器附近進行低延遲、實時處理。此處涉及的工作負載稱為TinyML,牽涉到在資源有限的邊緣設備上運行輕量級機器學習模型。TinyML模型專為特定硬件定制,支持順利執行人工智能任務。定制硬件處理器和高度優化的軟件庫對于滿足TinyML嚴格至極的功耗要求至關重要。

深度學習:相較而言,深度學習應用程序是一種計算密集型工作負載。此類應用程序涉及運行復雜的計算,通常出現在高級計算機視覺、自然語言處理及其他經典和生成式人工智能密集型任務中。深度學習具有計算密集型特性,通常需要專門的硬件,如神經處理單元 (NPU)。NPU采用多層神經網絡結構,能夠高效地處理各種復雜的計算任務。NPU可為高級人工智能任務提供所需的計算能力,而且能效很高。

ML-DSP:介于上述兩類工作負載之間的是ML-DSP工作負載,涉及DSP處理、過濾及清理信號,然后才能執行人工智能感知任務。雷達屬于此類工作負載,是一種涉及點云圖像分析的常見應用。

工作負載決定采用的架構

為了應對邊緣人工智能工作負載的多面性及其帶來的能效挑戰,人們開發了各種架構和硬件引擎。為各工作負載選擇有針對性的架構和硬件是為了在提供最佳計算性能的同時最大限度地降低功耗。就此而言,TOPS/Watt(每秒萬億次運算/瓦)是常用的能效指標。選擇合適的架構來處理TinyML、ML-DSP及深度學習工作負載,是滿足所需能效指標的關鍵。

標量處理架構最適合TinyML工作負載,此類負載通常涉及用戶界面管理、基于時間數據制定決策以及非密集型計算需求。矢量處理架構非常適合同時處理多個數據元素的運算,及在人工智能感知之前涉及信號處理的工作負載。張量和矩陣處理架構是涉及復雜矩陣運算、圖像識別、計算機視覺及自然語言處理等深度學習任務的理想選擇。能夠以盡量高的能效高效處理涉及大型矩陣和神經網絡的任務。人工智能處理器通常結合利用這些架構來高效處理各種任務。請參閱下圖。

wKgZomVMataAGTK_AANiyugdJck222.png

CEVA產品可應對各種人工智能工作負載

CEVA提供一系列產品,希望滿足TinyML、ML-DSP 及深度學習工作負載的需求。我們的產品包括CEVA-BX、SensPro2及NeuPro-M,品質優越,既能支持搭載人工智能功能的邊緣設備,也能確保能效。

CEVA-BX處理器高度靈活,能夠根據具體應用配置和優化,包括音頻、語音處理及人工智能相關的工作負載。其架構旨在實現性能和能效平衡,因此適用于廣泛的邊緣計算應用。

CEVA的SensPro2是一種高度可配置且獨立的矢量DSP架構,針對浮點和整數數據類型進行標量和矢量處理。專為計算機視覺和其他傳感器中的并行高帶寬數據應用而設計。能夠高效處理多達5 TOPS的人工智能工作負載,集成多達1,000個MAC。SensPro2是需要高帶寬數據和人工智能處理能力的視覺和雷達系統的合適選擇。

CEVA的NeuPro-M是一款神經處理單元(NPU)IP,涵蓋在CEVA深度學習人工智能處理器NeuPro系列中。NeuPro-M旨在處理當今大多數經典和生成式人工智能網絡模型,包括Transformer。專門針對低功耗、高效率處理優化,包括一個矢量處理單元(VPU)和許多其他異構處理引擎,如稀疏性、壓縮和激活邏輯。隨著人工智能網絡模型快速發展,NeuPro-M憑借內置VPU,可以為邊緣人工智能應用提供經得起未來考驗的功能。NeuPro-M目前無法處理的更新、更復雜的人工智能網絡層,可以利用VPU得到高效管理。

CEVA的音頻人工智能處理器、傳感器中樞 DSP、NeuPro-M NPU IP以及相關軟件工具和開發套件可滿足所有邊緣人工智能處理工作負載的需求。

wKgZomVMataATAFOAAMoVpwGluE002.png

本文作者:Moshe Sheier, Vice President of Marketing, CEVA

關于CEVA

CEVA是排名前列的無線連接和智能傳感技術以及集成IP解決方案授權商,旨在打造更智能、更安全、互聯的世界。我們為傳感器融合、圖像增強、計算機視覺、語音輸入和人工智能應用提供數字信號處理器、人工智能處理器、無線平臺、加密內核和配套軟件。許多世界排名前列的半導體廠商、系統公司和OEM利用我們的技術和芯片設計技能,為移動、消費、汽車、機器人、工業、航天國防和物聯網等各種終端市場開發高能效、智能、安全的互聯設備。

我們基于DSP的解決方案包括移動、物聯網和基礎設施中的5G基帶處理平臺;攝像頭設備的高級影像技術和計算機視覺;適用于多個物聯網市場的音頻/語音/話音應用和超低功耗的始終開啟/感應應用。對于傳感器融合,我們的Hillcrest Labs傳感器處理技術為耳機、可穿戴設備、AR/VR、PC機、機器人、遙控器、物聯網等市場提供廣泛的傳感器融合軟件和慣性測量單元 (“IMU”) 解決方案。在無線物聯網方面,我們的藍牙(低功耗和雙模)、Wi-Fi 4/5/6/6E (802.11n/ac/ax)、超寬帶(UWB)、NB-IoT和GNSS 平臺是業內授權較為廣泛的連接平臺。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • dsp
    dsp
    +關注

    關注

    545

    文章

    7667

    瀏覽量

    344878
  • CEVA
    +關注

    關注

    1

    文章

    175

    瀏覽量

    75563
  • ML
    ML
    +關注

    關注

    0

    文章

    140

    瀏覽量

    34324
  • 深度學習
    +關注

    關注

    73

    文章

    5256

    瀏覽量

    120049
  • TinyML
    +關注

    關注

    0

    文章

    42

    瀏覽量

    1128

原文標題:提高TinyML、ML-DSP和深度學習工作負載的能效

文章出處:【微信號:CEVA-IP,微信公眾號:CEVA】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    利用TinyML在MCU上實現AI/ML推論工作

    眾所皆知,MCU運算力有限(相對于IoT網關、手機、計算機),而AI/ML向來耗用運算力,如此TinyML的技術主張豈不矛盾?事實上,MCU的運算力也非如刻板印象中那樣一直不堪,MCU運算力也在提升,如此可用來執行簡單(相對于云端機房、邊緣運算)的AI/
    發表于 09-20 11:10 ?1906次閱讀

    開發TinyML系統必須考慮的四大指標

    最近,隨著機器學習ML, Machine Learning)的進步出現了分歧,分為兩個規模:一個是傳統的大型ML(云ML),模型越來越大,以實現準確性方面的最佳性能;另外一個是新興的
    的頭像 發表于 01-11 12:10 ?2148次閱讀

    【先楫HPM5361EVK開發板試用體驗】:4、TinyML測試(1)

    是在這些設備上實現低功耗、低延遲和隱私保護的機器學習應用。 TinyML的發展受益于多個技術進步,包括模型壓縮、量化、剪枝和量化訓練等技術。這些技術允許將大型的深度學習模型壓縮到足夠小
    發表于 12-22 10:12

    深度學習及無線通信熱點問題介紹

    利用ML構建無線環境地圖及其在無線通信中的應用?使用深度學習的收發機設計和信道解碼基于ML的混合學習方法,用于信道估計、建模、預測和壓縮 使
    發表于 07-01 10:49

    在Arduino和超低功耗微控制器上如何運行ML

    TinyML 簡介1. 概要Pete Warden 與Daniel Situnayake 合著了一本介紹在 Arduino 和超低功耗微控制器上如何運行 ML 的書,TinyML:Machine
    發表于 08-06 06:22

    什么是TinyML?微型機器學習

    了解一個叫做微型機器學習(Tiny Machine Learning,TinyML)的機器學習分部,它是什么,它的應用,硬件和軟件需求,以及它的好處。機器學習(
    發表于 04-12 10:20

    Arm Neoverse V1的AWS Graviton3在深度學習推理工作負載方面的作用

    ML 工作負載。MLCommons 是一個開放的工程聯盟,通過基準、指標、數據集和最佳實踐來支持和改進機器學習行業。在此分析中,我們為兩個廣泛使用的
    發表于 08-31 15:03

    優化用于深度學習工作負載的張量程序

    華盛頓大學計算機系博士生陳天奇、以及上海交通大學和復旦大學的研究團隊提出一個基于學習的框架,以優化用于深度學習工作負載的張量程序。
    的頭像 發表于 05-23 15:32 ?2256次閱讀
    優化用于<b class='flag-5'>深度</b><b class='flag-5'>學習</b><b class='flag-5'>工作</b><b class='flag-5'>負載</b>的張量程序

    微軟要讓ML.NET框架也能用于開發深度學習應用

    模型評分轉換(TensorFlow Transform)。微軟提到,深度學習是人工智能和機器學習的子集,能夠透過實例來學習人類自然習得的能力,與傳統機器
    的頭像 發表于 09-27 10:33 ?3615次閱讀

    TinyML推動深度學習和人工智能發展

    TinyML深度學習和人工智能領域的最新技術。它帶來了在隨處可見的微控制器(幾乎是最小的電子芯片)中運行機器學習模型的能力。
    的頭像 發表于 11-03 14:58 ?1870次閱讀

    一文知道TinyML的演變

    TinyML是世界上最新的深度學習和人工智能技術。它增強了微控制器中運行機器學習模型的能力。
    的頭像 發表于 11-11 17:02 ?3207次閱讀
    一文知道<b class='flag-5'>TinyML</b>的演變

    英飛凌全新ModusToolbox? ML助力TinyML,為AIoT保駕護航

    ModusToolbox ML允許開發人員使用他們首選的深度學習框架(如TensorFlow),直接部署到PSoC MCU上。
    發表于 06-08 10:47 ?1124次閱讀

    機器學習概述、工作原理及重要性

    本文旨在為硬件和嵌入式工程師提供機器學習(ML)的背景,它是什么,它是如何工作的,它為什么重要,以及 TinyML 是如何適應的
    發表于 06-12 09:27 ?1097次閱讀

    如何在 MCU 上快速部署 TinyML

    您對人工智能 (AI) 和機器學習 (ML) 感到好奇嗎?您想知道如何在您已經使用過的微控制器上使用它嗎?在本文中,我們向您介紹了微控制器上的機器學習。該主題也稱為微型機器學習 (
    的頭像 發表于 07-19 10:24 ?1539次閱讀
    如何在 MCU 上快速部署 <b class='flag-5'>TinyML</b>

    什么是TinyML?

    了解機器學習ML) 的一個子部分,稱為微型機器學習TinyML)、它是什么、它的應用程序、硬件和軟件要求以及它的優勢。 機器學習
    的頭像 發表于 01-27 16:51 ?7836次閱讀
    什么是<b class='flag-5'>TinyML</b>?
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>