0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區
會(huì )員中心
創(chuàng )作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內不再提示

TinyML計算機視覺(jué)正在通過(guò)microNPU(μ NPU)變?yōu)楝F實(shí)

eeDesign ? 來(lái)源:Elad Baram ? 作者:Elad Baram ? 2024-05-06 15:50 ? 次閱讀

今天的計算機視覺(jué)(CV)技術(shù)正處于一個(gè)轉折點(diǎn),主要趨勢正在融合,使云技術(shù)在微小的邊緣AI設備中變得無(wú)處不在。技術(shù)進(jìn)步使這種以云為中心人工智能技術(shù)能夠擴展到邊緣,新的發(fā)展將使邊緣的人工智能視覺(jué)無(wú)處不在。

有三個(gè)主要的技術(shù)趨勢使這種演變。新的精益神經(jīng)網(wǎng)絡(luò )算法適合微型設備的內存空間和計算能力。新的硅架構為神經(jīng)網(wǎng)絡(luò )處理提供了比傳統微控制器MCU)高幾個(gè)數量級的效率。用于較小微處理器的AI框架正在成熟,減少了在邊緣開(kāi)發(fā)微型機器學(xué)習(ML)實(shí)現(tinyML)的障礙。

當所有這些元素結合在一起時(shí),毫瓦級的微型處理器可以擁有強大的神經(jīng)處理單元,這些單元可以執行非常高效的卷積神經(jīng)網(wǎng)絡(luò )(CNN)-視覺(jué)處理中最常見(jiàn)的ML架構-利用成熟且易于使用的開(kāi)發(fā)工具鏈。這將在我們生活的各個(gè)方面實(shí)現令人興奮的新用例。

邊緣CV的承諾

數字圖像處理(過(guò)去的叫法)用于從半導體制造檢測到高級駕駛員輔助系統(ADAS)功能(如車(chē)道偏離警告和盲點(diǎn)檢測),再到移動(dòng)的設備上的圖像美化和操作等各種應用。展望未來(lái),邊緣CV技術(shù)正在實(shí)現更高級別的人機界面(HMI)。

HMI在過(guò)去十年中發(fā)生了重大變化。除了鍵盤(pán)和鼠標等傳統界面之外,我們現在還擁有觸摸顯示屏、指紋識別器、面部識別系統和語(yǔ)音命令功能。在明顯改善用戶(hù)體驗的同時(shí),這些方法還有一個(gè)共同點(diǎn)它們都對用戶(hù)操作做出反應。HMI的下一個(gè)層次將是通過(guò)上下文感知來(lái)理解用戶(hù)及其環(huán)境的設備。

情境感知設備不僅能感知用戶(hù),還能感知它們所處的環(huán)境,所有這些都是為了做出更好的決策,實(shí)現更有用的自動(dòng)化交互。例如,筆記本電腦可以在視覺(jué)上感知用戶(hù)何時(shí)注意,并相應地調整其行為和電源策略。Synaptics的Emza Visual Sense技術(shù)已經(jīng)實(shí)現了這一點(diǎn),OEM可以使用該技術(shù)在用戶(hù)不觀(guān)看顯示器時(shí)自適應調暗顯示器以?xún)?yōu)化功耗,從而降低顯示器的能耗。通過(guò)跟蹤旁觀(guān)者的眼球(旁觀(guān)者檢測),該技術(shù)還可以通過(guò)提醒用戶(hù)并隱藏屏幕內容來(lái)增強安全性,直到海岸清晰。

另一個(gè)例子:智能電視機感知是否有人在觀(guān)看以及從哪里觀(guān)看,然后相應地調整圖像質(zhì)量和聲音。它可以自動(dòng)關(guān)閉,以保存電力時(shí),沒(méi)有人在那里?;蛘?,空調系統根據房間占用情況優(yōu)化電力和氣流,以保存能源成本。這些和其他建筑物中智能能源利用的例子在家庭-辦公室混合工作模式下變得更加重要。

工業(yè)領(lǐng)域中,視覺(jué)感測也有無(wú)窮無(wú)盡的用例,從用于安全監管的物體檢測(即,限制區、安全通道、防護裝備執行)直到用于制造過(guò)程控制的異常檢測。在農業(yè)技術(shù)中,作物檢查以及CV技術(shù)實(shí)現的狀態(tài)和質(zhì)量監控都至關(guān)重要。

無(wú)論是在筆記本電腦、消費電子產(chǎn)品、智能建筑傳感器還是工業(yè)環(huán)境中,當微型和負擔得起的微處理器、微型神經(jīng)網(wǎng)絡(luò )和優(yōu)化的人工智能框架使設備更加智能和節能時(shí),這種環(huán)境計算能力就可以實(shí)現。nbsp;

神經(jīng)網(wǎng)絡(luò )視覺(jué)處理的發(fā)展

2012年是CV開(kāi)始從啟發(fā)式CV方法轉向深度卷積神經(jīng)網(wǎng)絡(luò )(DCNN)的轉折點(diǎn),Alex Krizhevsky和他的同事發(fā)表了AlexNet。DCNN在那年贏(yíng)得ImageNet大規模視覺(jué)識別挑戰賽(ILSVRC)后就再也沒(méi)有回頭路了。

從那時(shí)起,地球儀的團隊一直在尋求更高的檢測性能,但對底層硬件的效率沒(méi)有太多的關(guān)注。所以CNN仍然是數據和計算饑渴的。這種對性能的關(guān)注對于在云基礎設施中運行的應用程序來(lái)說(shuō)是很好的。

2015年,ResNet152被引入。它有6000萬(wàn)個(gè)參數,單次推理操作需要超過(guò)11gigaflops,并且在ImageNet數據集上表現出94%的前5名準確率。這繼續推動(dòng)CNN的性能和準確性。但直到2017年,隨著(zhù)谷歌的一組研究人員發(fā)表了MobileNets,我們才看到了效率的提升。

MobileNets-針對智能手機-比當時(shí)現有的神經(jīng)網(wǎng)絡(luò )(NN)架構輕得多。例如,MobileNetV 2有350萬(wàn)個(gè)參數,需要336 Mflops。這種大幅減少最初是通過(guò)艱苦的勞動(dòng)實(shí)現的-手動(dòng)識別深度學(xué)習網(wǎng)絡(luò )中的層,這并沒(méi)有增加太多的準確性。后來(lái),自動(dòng)化的架構搜索工具允許進(jìn)一步改進(jìn)層的數量和組織。在內存和計算負載方面,MobileNetV 2比ResNet 192大約“輕”20倍,表現出90%的前5名準確率。一組新的移動(dòng)友好應用程序現在可以使用AI。

硬件也在不斷發(fā)展

通過(guò)更小的NN和對所涉及的工作負載的清晰理解,開(kāi)發(fā)人員現在可以為微型AI設計優(yōu)化的硅。這導致了微神經(jīng)處理單元(微NPU)。通過(guò)嚴格管理內存組織和數據流,同時(shí)利用大規模并行性,這些小型專(zhuān)用核心可以比典型MCU中的獨立CPU快10倍或100倍地執行NN推理。一個(gè)例子是Arm Ethos U55微型NPU。


wKgaomY4j9mAPrGkAAfTR9pn1Xg183.png

圖2:復雜的CNN模型,如身體關(guān)鍵點(diǎn)估計,正在新一代微控制器上運行。(圖片來(lái)源:Synaptics)

讓我們來(lái)看看microNPU(μ NPU)影響的一個(gè)具體示例。CV的基本任務(wù)之一是對象檢測。物體檢測本質(zhì)上需要兩個(gè)任務(wù):定位,確定物體在圖像中的位置,以及分類(lèi),識別檢測到的物體(圖2)。

Emza在Ethos U55 μNPU上實(shí)現了一個(gè)人臉檢測模型,訓練了一個(gè)對象檢測和分類(lèi)模型,該模型是單鏡頭檢測器的輕量級版本,由Synaptics優(yōu)化,僅用于檢測人臉類(lèi)別。結果令我們驚訝,模型執行時(shí)間不到5毫秒:這與強大的智能手機應用處理器(如Snapdragon 845)的執行速度相當。當在使用四個(gè)Cortex A53內核的Raspberry Pi 3B上執行相同的模型時(shí),執行時(shí)間要長(cháng)六倍。

AI框架和民主化

廣泛采用任何像ML這樣復雜的技術(shù)都需要良好的開(kāi)發(fā)工具。TensorFlow Lite for MicrocontrollersTFLM)是一個(gè)框架,旨在更輕松地為tinyML訓練和部署AI。對于完整TensorFlow所涵蓋的運算符子集,TFLM會(huì )發(fā)出微處理器C代碼,用于在μNPU上運行解釋器和模型。來(lái)自Meta的PyTorch移動(dòng)的框架和Glow編譯器也針對這一領(lǐng)域。此外,現在有很多AI自動(dòng)化平臺(稱(chēng)為AutoML)可以自動(dòng)化針對微小目標的AI部署的某些方面。例如Edge Impulse、Deeplite、Qeexo和SensiML。

但要在特定硬件和μ NPU上執行,必須修改編譯器和工具鏈。Arm開(kāi)發(fā)了Vela編譯器,可以?xún)?yōu)化U55 μ NPU的CNN模型執行。Vela編譯器通過(guò)自動(dòng)在CPU和μ NPU之間分割模型執行任務(wù),消除了包含CPU和μ NPU的系統的復雜性。

更廣泛地說(shuō),Apache TVM是一個(gè)開(kāi)源的,端到端的ML編譯器框架,用于CPU,GPU,NPU和加速器。TVM micro的目標是微控制器,其愿景是在任何硬件上運行任何AI模型。AI框架、AutoML平臺和編譯器的這種演變使開(kāi)發(fā)人員更容易利用新的μ NPU來(lái)滿(mǎn)足他們的特定需求。

無(wú)處不在的邊緣AI

在邊緣無(wú)處不在的基于ML的視覺(jué)處理的趨勢是明確的。硬件成本正在下降,計算能力正在顯著(zhù)提高,新的方法使訓練和部署模型變得更加容易。所有這些都減少了采用的障礙,并增加了CV AI在邊緣的使用。

但是,即使我們看到越來(lái)越普遍的微小邊緣AI,仍然有工作要做。為了使環(huán)境計算成為現實(shí),我們需要服務(wù)于許多細分領(lǐng)域的長(cháng)尾用例,這些用例可能會(huì )帶來(lái)可擴展性挑戰。在消費品、工廠(chǎng)、農業(yè)、零售和其他領(lǐng)域,每個(gè)新任務(wù)都需要不同的算法和獨特的數據集進(jìn)行訓練。解決每個(gè)用例所需的研發(fā)投資和技能組合仍然是當今的主要障礙。

這一差距最好由人工智能公司通過(guò)開(kāi)發(fā)豐富的模型示例集("模型動(dòng)物園")和應用程序參考代碼來(lái)圍繞其N(xiāo)PU產(chǎn)品升級軟件來(lái)填補。通過(guò)這樣做,他們可以為長(cháng)尾提供更廣泛的應用,同時(shí)通過(guò)針對目標硬件優(yōu)化正確的算法來(lái)確保設計成功,以在定義的成本、大小和功耗限制范圍內解決特定的業(yè)務(wù)需求。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權轉載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習之用,如有內容侵權或者其他違規問(wèn)題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1781

    文章

    44785

    瀏覽量

    231982
  • 計算機視覺(jué)
    +關(guān)注

    關(guān)注

    8

    文章

    1611

    瀏覽量

    45705
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    226

    瀏覽量

    18192
  • 邊緣AI
    +關(guān)注

    關(guān)注

    0

    文章

    56

    瀏覽量

    4805
  • TinyML
    +關(guān)注

    關(guān)注

    0

    文章

    42

    瀏覽量

    1137
收藏 人收藏

    評論

    相關(guān)推薦

    什么是計算機視覺(jué)?計算機視覺(jué)的三種方法

    計算機視覺(jué)是指通過(guò)計算機賦予人類(lèi)視覺(jué)這一技術(shù)目標,從而賦能裝配線(xiàn)檢查到駕駛輔助和機器人等應用。計算機
    的頭像 發(fā)表于 11-16 16:38 ?3464次閱讀
    什么是<b class='flag-5'>計算機</b><b class='flag-5'>視覺(jué)</b>?<b class='flag-5'>計算機</b><b class='flag-5'>視覺(jué)</b>的三種方法

    機器視覺(jué)計算機視覺(jué)的關(guān)系簡(jiǎn)述

    初涉機器視覺(jué)領(lǐng)域,總是容易將其與計算機視覺(jué)這一概念混淆。實(shí)際上兩者確實(shí)存在一定的相同之處,但也不能因此而將這兩者視為同一概念,因為這兩者還存在著(zhù)顯著(zhù)的差別。而與此同時(shí),兩者也還有著(zhù)密不可分的關(guān)系
    發(fā)表于 05-13 14:57

    計算機視覺(jué)基礎知識

    計算機視覺(jué)基礎題目
    發(fā)表于 06-05 16:33

    學(xué)習計算機視覺(jué)的建議有哪些

    初學(xué)計算機視覺(jué)的切身建議
    發(fā)表于 06-18 10:12

    什么是計算機視覺(jué)看了就知道

    什么是計算機視覺(jué)
    發(fā)表于 01-11 07:47

    計算機視覺(jué)論文速覽

    AI視野·今日CS.CV 計算機視覺(jué)論文速覽transformer、新模型、視覺(jué)語(yǔ)言模型、多模態(tài)、clip、視角合成
    發(fā)表于 08-31 08:46

    深度學(xué)習與傳統計算機視覺(jué)簡(jiǎn)介

    文章目錄1 簡(jiǎn)介1.1 深度學(xué)習與傳統計算機視覺(jué)1.2 性能考量1.3 社區支持2 結論3 參考在計算機視覺(jué)領(lǐng)域中,不同的場(chǎng)景不同的應用程序需要不同的解決方案。在本文中,我們將快速回顧
    發(fā)表于 12-23 06:17

    計算機視覺(jué)及其在焊接中的應用

    簡(jiǎn)要闡述了計算機視覺(jué)的基本原理、系統結構和計算機視覺(jué)的基本處理方法,并著(zhù)重講解了在焊接自動(dòng)化領(lǐng)域的應用情況。關(guān)鍵詞:計算機
    發(fā)表于 07-18 10:19 ?9次下載

    計算機視覺(jué)講義

    計算機視覺(jué)講義:機器視覺(jué)是研究用計算機來(lái)模擬生物外顯或宏觀(guān)視覺(jué)功能的科學(xué)和技術(shù).機器視覺(jué)系統的首
    發(fā)表于 03-19 08:08 ?0次下載

    計算機視覺(jué)賈云德pdf版

    計算機視覺(jué)
    發(fā)表于 05-09 11:00 ?0次下載

    計算機視覺(jué)與機器視覺(jué)區別

     “計算機視覺(jué)”,是指用計算機實(shí)現人的視覺(jué)功能,對客觀(guān)世界的三維場(chǎng)景的感知、識別和理解。計算機視覺(jué)
    的頭像 發(fā)表于 12-08 09:27 ?1.2w次閱讀

    計算機視覺(jué)常用算法_計算機視覺(jué)有哪些分類(lèi)

    本文主要介紹了計算機視覺(jué)常用算法及計算機視覺(jué)的分類(lèi)。
    的頭像 發(fā)表于 07-30 17:34 ?1.3w次閱讀

    計算機視覺(jué)的工作流程與主要應用

    計算機視覺(jué)的主要目的是讓計算機能像人類(lèi)一樣甚至比人類(lèi)更好地看見(jiàn)和識別世界。計算機視覺(jué)通常使用C++、Python和MATLAB等編程語(yǔ)言,是
    的頭像 發(fā)表于 01-08 14:06 ?5026次閱讀

    計算機視覺(jué)的基礎概念和現實(shí)應用

    本文將介紹計算機視覺(jué)的基礎概念和現實(shí)應用,對任何聽(tīng)說(shuō)過(guò)計算機視覺(jué)但不確定它是什么以及如何應用的人,本文是了解
    的頭像 發(fā)表于 11-08 10:10 ?1215次閱讀

    淺析4個(gè)計算機視覺(jué)領(lǐng)域常用遷移學(xué)習模型

    使用SOTA的預訓練模型來(lái)通過(guò)遷移學(xué)習解決現實(shí)計算機視覺(jué)問(wèn)題。
    的頭像 發(fā)表于 04-23 18:08 ?1268次閱讀
    淺析4個(gè)<b class='flag-5'>計算機</b><b class='flag-5'>視覺(jué)</b>領(lǐng)域常用遷移學(xué)習模型
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看