<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

靈活應變的計算平臺滿足嵌入式AI的要求

4dD0_chinacmos ? 來源:未知 ? 作者:工程師曾玲 ? 2018-10-02 09:45 ? 次閱讀

人工智能新興應用通過帶可配置加速的片上系統器件來滿足日益嚴格的性能和效率需求

隨著智能安全、機器人無人駕駛汽車等應用越來越依靠嵌入式人工智能技術來提高性能,交付全新的用戶體驗,傳統計算平臺上的推斷引擎很難在有限的功耗、時延和物理尺寸限制下滿足實際要求。推斷引擎必須滿足嚴格定義的推斷精度,還受限于總線寬度,而且存儲器難以為最佳速度、效率和芯片面積進行調整優化。我們需要靈活應變的計算平臺來滿足運行一流卷積神經網絡 (CNN) 的嵌入式 AI 的要求。

放眼未來,適應于更多前沿神經網絡的靈活性是我們的主要關注點。今天廣受歡迎的 CNN 正加速被新型的先進架構所取代。然而,傳統的 SoC 設計要使用當前的神經網絡架構知識,從開發開始到未來部署通常需要大約三年時間。RNN 或 Capsule Network 等新型神經網絡可能會讓傳統 SoC 變得低效,也難以提供保持競爭力所需的性能。

嵌入式 AI 要滿足最終用戶期望,特別是要跟上可預見的未來不斷提升的需求,就必須采用更加靈活的自適應計算平臺。我們可利用用戶可配置的多核片上系統 (MPSoC) 器件,整合主應用處理器和可擴展的可編程邏輯結構,包含可配置的存儲器架構和滿足可變精度推斷所需的信號處理技術,從而滿足上述要求。

推斷精度

在傳統的 SoC 中,決定性能的特性如存儲器架構和計算精確度等是固定的。最小值通常為 8 位,由核心 CPU 定義,不過就給定的算法而言最佳精度可能更低。MPSoC 支持可編程邏輯優化至晶體管層面,這就能根據需要讓推斷精度降低到 1 位。此外,這類器件還包含成千上萬可配置的 DSP slice,能高效處理乘積累加 (MAC) 計算。

能自由優化推斷精度,根據平方律提供剛好滿足需求的計算效率,也就是說單位的運算用 1 位核心執行,相對于用 8 位核心完成相同計算而言,所需的邏輯僅為 1/64。此外,MPSoC 能讓推斷精度針對神經網絡的每層做出不同優化,從而以最大的效率提供所需的性能。

存儲器架構

除了通過改變推斷精度來提高計算效率之外,配置可編程片上存儲器的帶寬和結構能進一步提高嵌入式 AI 的性能和效率。定制 MPSoC 相對于運行相同推斷引擎的傳統計算平臺而言,片上存儲器可能達到 4 倍多,存儲器—接口帶寬可能達到 6 倍。存儲器的可配置性使得用戶能減少瓶頸,并優化芯片資源的利用率。此外,典型的子系統只有有限的片上集成高速緩存,必須與片外存儲設備頻繁交互,這就會增加時延和功耗。在 MPSoC 中,大多數存儲器交換都在片上進行,這就會大幅提高速度,而且相對于片外存儲器交互而言功耗降低超過 99%。

芯片面積

解決方案的尺寸也越來越重要,特別就采用移動 AI 的無人機、機器人或無人/自動駕駛汽車而言尤其如此。MPSoC 的 FPGA 結構上實現的推斷引擎可能僅占用傳統 SoC 八分之一的芯片面積,這就能讓開發人員在更小的器件中構建功能更強大的引擎。

此外,MPSoC 器件系列為設計人員提供了實現推斷引擎的豐富選擇,能支持最節能、成本效率最高、面積占用最小的方案,從而滿足系統性能要求。一些通過汽車應用認證的部件具備硬件功能安全特性,達到業界標準的 ISO 26262 ASIL-C 安全規范,這對自動駕駛應用而言至關重要。比如賽靈思的 Automotive XA Zynq UltraScale+ 系列采用 64 位四核 ARM Cortex-A53 和雙核 ARM Cortex-R5 處理系統以及可擴展的可編程邏輯結構,這就能在單個芯片上整合控制處理、機器學習算法和安全電路,同時提供故障容錯功能。

今天,嵌入式推斷引擎可用單個 MPSoC 器件實現,功耗低至 2 瓦,這對移動機器人或自動駕駛汽車而言都是比較合適的功耗水平。傳統計算平臺即便現在也無法用這么低的功耗運行實時 CNN 應用,未來也不太可能在更嚴格的功耗限制條件下滿足更快響應和更復雜功能的日益嚴格的要求?;诳删幊?MPSoC 的平臺能夠提供更高的計算性能,更高的效率,也能在 15瓦以上的功率水平下減小面積和減輕重量。

如果開發人員不能在自己的項目中輕松地實現這些優勢,那么這種可配置型多平行計算架構的優勢就僅限于學術領域。成功需要適當的工具來幫助開發人員優化目標推斷引擎的實現。為了滿足有關需求,賽靈思不斷擴展開發工具生態系統和機器學習軟件堆棧,并與專業合作伙伴合作,一起簡化和加速計算機視覺和視頻監控等應用的實現。

面向未來的靈活性

利用 SoC 的可配置性為手頭應用創建最佳平臺,也使得 AI 開發人員能夠靈活地跟上神經網絡架構快速發展演進的要求。業界可能遷移到新型神經網絡的可能性,對于平臺開發人員來說是一個巨大的風險??芍嘏渲玫?MPSoC 通過重配置并用當前最先進的策略來構建最高效的處理引擎,能夠讓開發人員靈活地響應神經網絡架構方式的變化。

AI 越來越多地嵌入到各種設備中,包括工業控制、醫療設備、安全系統、機器人和自動駕駛汽車等。利用可編程邏輯結構的 MPSoC 器件的靈活應變加速技術,是提供保持競爭力所需的快速響應和高級功能的關鍵。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 存儲器
    +關注

    關注

    38

    文章

    7212

    瀏覽量

    162350
  • soc
    soc
    +關注

    關注

    38

    文章

    3798

    瀏覽量

    216057
  • 人工智能
    +關注

    關注

    1780

    文章

    44671

    瀏覽量

    231431

原文標題:【展會】2018CIMF第三屆生物識別、攝像頭展震撼來襲(11月15—17日)

文章出處:【微信號:chinacmos,微信公眾號:攝像頭觀察】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Xilinx隆重發布Vitis統一軟件平臺,賦予軟件開發者靈活應變的硬件

    Vitis將賦予軟件開發者靈活應變的硬件,同時將提高硬件設計者的工作效率。
    發表于 10-09 16:22 ?1055次閱讀

    嵌入式計算與視頻大數據——基于TI嵌入式處理器

    :大的計算資源2:功耗消耗3:智慧城市和智慧海洋4:WSN (Ad-hoc)5:嵌入式計算平臺已經開始了……很多處理器廠商已經設計了類型的嵌入式
    發表于 07-19 14:27

    一個基于Linux2.6.16的嵌入式風力發電監控系統開發平臺構建

    房若民,陳國定(浙江工業大學,浙江杭州310014)0引言為了適應不同的應用場合,同時考慮到計算機系統的靈活性、可伸縮性以及可裁剪性,一種以應用為中心、以計算機技術為基礎、軟硬件可裁剪的嵌入式
    發表于 07-25 06:56

    為什么需要嵌入式AI?

    為什么需要嵌入式AI?嵌入式AI還有瓶頸半導體廠商的新商機
    發表于 01-22 06:14

    如何滿足嵌入式系統的靈活需求?

    嵌入式程序開發基本概念如何滿足嵌入式系統的靈活需求開發高效程序的技巧是什么
    發表于 04-28 06:07

    工業嵌入式計算平臺開發招聘

    西電移動計算與通信團隊招聘:嵌入式軟件開發(專職或兼職)研究方向:工業嵌入式計算平臺開發。需求人數:1人
    發表于 10-12 09:32

    嵌入式AI平臺有哪些?

    11.2.2 修剪神經網絡 21.2.3 嵌入式終端優化 21.3 GPU 21.4 ARM 31.5 FPGA結構的并行計算 41.5.1 介紹 41.5.2 流水線計算 41.5.3 分布
    發表于 10-27 06:45

    嵌入式Linux的靈活

    嵌入式Linux的靈活性,為嵌入式計算而設計的高效、節能的處理器的可用性,以及新處理器的低成本,使許多工業公司在嵌入式處理器的基礎上開發新的
    發表于 11-04 08:51

    嵌入式系統的三個基本的核心要素

    硬件平臺、相關支撐硬件、嵌入式操作系統、支撐軟件以及應用軟件組成。其中,“嵌入性”、“專用性”與“計算機系統”是嵌入式系統的三個基本的核心要
    發表于 11-08 07:20

    嵌入式系統的三個基本的核心要素

    靈活性,主要由嵌入式硬件平臺 、 相關支撐硬件 、 嵌入式操作系統 、 支撐軟件以及應用軟件組成。其中, “ 嵌入性 ”、“ 專用性 ”
    發表于 12-22 07:52

    Xilinx推出革命性的新型靈活應變計算產品

    Acceleration Platform,靈活應變計算加速平臺)。ACAP 是一個高度集成的多核異構計算平臺,能根據各種應用與工作負載的需求從硬件層對其進行
    發表于 03-20 03:42 ?981次閱讀

    靈活應變計算平臺滿足運行一流卷積神經網絡的嵌入式AI要求

    能自由優化推斷精度,根據平方律提供剛好滿足需求的計算效率,也就是說單位的運算用 1 位核心執行,相對于用 8 位核心完成相同計算而言,所需的邏輯僅為 1/64。此外,MPSoC 能讓推斷精度針對神經網絡的每層做出不同優化,從而以
    的頭像 發表于 09-28 15:50 ?3000次閱讀

    靈活應變計算平臺才能滿足運行卷積神經網絡的嵌入式 AI要求

    在傳統的 SoC 中,決定性能的特性如存儲器架構和計算精確度等是固定的。最小值通常為 8 位,由核心 CPU 定義,不過就給定的算法而言最佳精度可能更低。
    的頭像 發表于 07-26 16:42 ?1289次閱讀

    Xilinx Versal? Premium專為靈活應變的云提供商而設計

    。Versal Premium 系列具備高度集成且功耗優化的網絡硬核,是業界帶寬最高、計算密度最高的自適應平臺。Versal Premium 專為在散熱條件和空間受限的環境下運行最高帶寬網絡,以及那些需要可擴展、靈活應變應用加速
    的頭像 發表于 03-12 15:00 ?2143次閱讀

    Versal Premium ACAP:在靈活應變平臺上突破性集成功耗優化的網絡IP

    電子發燒友網站提供《Versal Premium ACAP:在靈活應變平臺上突破性集成功耗優化的網絡IP.pdf》資料免費下載
    發表于 09-15 10:48 ?0次下載
    Versal Premium ACAP:在<b class='flag-5'>靈活應變</b>的<b class='flag-5'>平臺</b>上突破性集成功耗優化的網絡IP
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>