<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

知存科技助力AI應用落地:WTMDK2101-ZT1評估板實地評測與性能揭秘

存內計算開發者 ? 來源:jf_13681693 ? 作者:jf_13681693 ? 2024-05-16 15:09 ? 次閱讀

一、前言

隨著當今數據迅速增長,傳統的馮諾依曼架構內存墻正在成為計算性能進一步提升的阻礙。新一代的存內計算(IMC)和近存計算(NMC)架構有望突破這一瓶頸,顯著提升計算能力和能源效率。本文將探討存算一體芯片的發展歷程、當前研究狀態,以及基于多種存儲介質(例如傳統的DRAM、SRAM和Flash,以及新型的非易失性存儲器如ReRAM、PCM、MRAM、FeFET等)的存內計算基本原理、優勢與面臨的挑戰。通過對知存科技WTM2101量產芯片的深入解析與評測,重點展示存內計算芯片的電路結構及其應用現狀。最后,將對存算一體芯片未來的發展前景和挑戰進行詳細分析。

二、深入了解存算一體技術

2.1 什么是存算一體

存算一體是指在計算機體系結構中將存儲和計算功能整合到一起的概念。這種結合旨在減少數據在處理器和存儲單元之間的頻繁傳輸,從而提高數據處理速度和效率。

存算一體的兩個主要形式是近存計算和存內計算:

近存計算:在近存計算中,計算單元與高速存儲單元(如高速緩存)緊密集成。這意味著處理器和高速存儲單元之間的距離很近,可以快速訪問數據并進行計算,減少了數據從內存傳輸到處理器的時間。

存內計算:存內計算是將計算功能直接放置在存儲單元內部的概念。這意味著存儲單元本身具有一定的計算能力,可以在存儲位置進行部分計算任務,避免了數據在存儲和處理單元之間的頻繁移動。存內計算的核心理念是在存儲單元內部完成部分計算任務,避免頻繁的數據傳輸,從而提高效率。這種方式允許處理器直接訪問存儲單元,將計算任務和數據處理在存儲內部進行,而不是在傳統的分離存儲和處理的架構中進行。通過存內計算,數據不必在存儲和處理單元之間頻繁傳輸,減少了數據移動的時間和能耗。這種方式對于處理大規模數據和計算密集型任務特別有利,能夠提高計算效率和響應速度。在人工智能、機器學習等領域,存內計算技術能夠加速模型訓練和推理過程。研究一些資料后博主自己總結:存內計算技術的發展對于提高計算設備的整體性能、降低能耗并改善數據處理效率具有重要意義。值得一提的是,我國知存科技推出的 WTM2101 芯片即采用存內計算這種方式。

近存計算和存內計算都是存算一體架構的重要組成部分,目的是在硬件層面上優化數據處理流程,使得計算機系統能夠更快速、更有效地處理大規模數據和計算密集型任務。這些技術的發展對于越發火熱的人工智能、大數據處理等領域的發展具有重要意義。

2.2 存算一體技術發展歷程

個人查閱了相關的很多資料,大致總結出來下面的存算一體技術發展歷程,方便我們更加深入的了解存算一體技術的發展

1969年: 存算一體的概念最早提出。

1997年: 展示了智能內存(Intelligent RAM)方案,將處理器和DRAM集成在單顆芯片上,算力達到Cray T-90的5倍。

1999年: 提出了靈活內存(FlexRAM)方案,仿真結果表明該芯片架構可使計算性能提升25~40倍。但由于缺少大數據處理需求、昂貴的制造成本和復雜的設計,技術仍然停留在研究階段。

2015年以后: 隨著摩爾定律逐漸失效和馮諾依曼架構的局限性明顯,大數據應用的驅動,工藝水平不斷提高,存算一體技術重新受到關注。

2016年,郭昕婕博士(知存科技聯合創始人及首席科學家)終于研發出全球第一個3層神經網絡的浮柵存內計算深度學習芯片(PRIME架構),首次驗證了基于浮柵晶體管的存內計算在深度學習應用中的效用。相較于傳統馮諾伊曼架構的傳統方案,PRIME可以實現功耗降低約20倍、速度提升約50倍,引起產業界廣泛關注。隨著人工智能等大數據應用的興起,存算一體技術得到國內外學術界與產業界的廣泛研究與應用。

2017年: 微處理器頂級年會(Micro2017)上,多所高校和企業推出了存算一體芯片或系統原型,包括蘇黎世聯邦理工學院、加利福尼亞大學圣巴巴拉分校、英偉達、英特爾、微軟、三星等。當提及圣巴巴拉分校時,值得關注的是他們在基于 RRAM 的存內計算領域的突破。這種新型存儲技術具有高密度、低功耗和快速讀寫等優勢,非常適合存內計算需求。研究團隊專注于將RRAM與計算過程結合,實現內部存儲和計算的融合。這項技術有望提高人工智能和其他計算密集型應用的效率,通過在芯片內部集成存儲和計算功能,加速數據處理速度、降低能耗,并提供更快速、更靈活的計算解決方案。他們的研究成果可能為未來計算設備和系統帶來革命性變革,使其更加智能、高效和可靠。

wKgaomZFsQOAeXPZAAI73Y_Do64138.jpg

這些年里,基于不同存儲介質的存算一體芯片研究不斷涌現,包括 SRAM、DRAM、Flash、ReRAM、PCM、FeFET、MRAM 等各類存儲介質。國內外企業積極研發,其中臺積電、Mythic 和知存科技最接近產業化,已經推出了一系列基于不同存儲介質的存算一體芯片研究成果。

2.3 基于不同存儲介質的存內計算芯片性能比較

目前,用于存算一體的成熟存儲器類型包括 NOR FLASH、SRAM、DRAM、RRAM 和 MRAM 等 NVRAM。

廣泛使用的 FLASH 是一種非易失性存儲介質,具有低成本和高可靠性的優勢,但其工藝制程方面存在明顯的瓶頸。

SRAM 在速度和能效方面具有優勢,尤其在存內邏輯技術發展之后,展現出了高能效和高精度的特點。

DRAM 具有低成本和大容量的優點,但速度較慢,并且需要持續供電進行刷新。

新型適用于存算一體的存儲器類型包括 PCAM、MRAM、RRAM 和 FRAM 等。其中,憶阻器 RRAM 在神經網絡計算中具有特殊優勢,被視為除了 SRAM 存算一體之外的下一代主流研究方向。盡管 RRAM 目前仍需 2-5 年的工藝成熟期,而且材料穩定性尚不確定,但其高速和簡單結構的特點,使其有望成為未來發展速度最快的新型存儲器。

工業界的研發趨勢來看,SRAM 和 RRAM 均被認為是未來主流存算一體的存儲介質,下面基于不同存儲介質的存內計算芯片性能進行一個比較,方便大家更加了解內存芯片的性能。

標準 SRAM DRAM Flash ReRAM PCM FeFET MRAM
非易失性
多比特存儲能力
面積效率 一般
功耗效率
工藝微縮性 較差 較好
成本 較高 較低

三、國產存算一體,重大進展

國產存算一體技術的重大進展已在新一輪算力攻堅賽中得到彰顯。存算一體架構的突破傳統馮·諾依曼架構的范式探索成為重要趨勢。這種架構改變了存算分離的局面,類似于“在家辦公”一樣,消除了數據“往返通勤”的能量消耗和時間延遲,大大提高了AI算力的能效比。近期,清華大學團隊研制的全球首款支持高效片上學習的憶阻器存算一體芯片引發關注。這一突破展示了存算一體技術的能效潛力和算力潛力,并為本地數據處理和動態更新帶來可能,減少了對云端算力和網絡帶寬的依賴。

在存算一體領域,全球參與者可分為國際巨頭和新興企業兩大陣營。國際巨頭如英特爾、IBM、特斯拉等早已布局存算技術,并推出代表未來趨勢的產品。而新興企業則更靈活選擇存內計算路線,如國內的知存科技、九天睿芯等,希望實現更高性能、更通用的算力場景。

這些公司在三個主要差異上有所體現:

技術路徑: 近存計算和存內計算是兩種主要路徑。前者保留了經典馮·諾依曼架構的數據處理特點,而后者通過存儲器件參與計算操作,實現存算真正融合。

存儲介質: 不同存儲介質如SRAM、DRAM等各有優缺點,影響著算力的性能和成本。目前,多數公司選擇成熟的SRAM以及Flash設計存算一體芯片,但也在投入新興存儲介質的研發,如MRAM、RRAM等,以期獲得更大競爭優勢。

數字或模擬: 存算一體的計算可分為數字存算模擬存算。數字存算更靈活適用于通用性場景,而模擬存算在能量效率方面具有優勢,但其擴展性相對不足;模擬存算的優勢在于其能夠更有效地處理大規模、復雜的問題,尤其是涉及到實時數據處理和復雜模型的情況。相比傳統的計算方式,模擬存算能夠更快速地進行計算并解決問題,因為它模擬了物理系統的行為,能夠并行處理數據和任務。知存科技采用模擬存算的方法可能意味著他們更有可能處理復雜的任務并加快問題解決的速度。這種方法可能在處理大規模數據、復雜模型和實時計算方面有很大的優勢。值得一提的是,我們國內知存科技目前用的是模擬存算。

這些技術突破正迎合市場需求,使存算一體技術迎來了產業化的拐點。新興企業在探索新技術應用和大算力布局方面更具前瞻性。隨著技術和應用的不斷成熟,這些企業勢必在存算一體領域發揮重要作用。

3.1 知存科技:我國存算一體領域的研發領導者

存算一體技術作為解決馮諾依曼架構下存儲墻問題的重要方案,吸引了國內外眾多企業的研發投入,其中知存科技成為這一領域的引領者之一。

在全球范圍內,存算一體技術的研究和實踐正由傳統芯片巨頭如三星電子、SK海力士、臺積電、美光、IBM、英特爾等主導。SK海力士也展示了其基于GDDR的存內計算產品,大幅提高了計算速度并降低了功耗。其他如臺積電、美光、IBM、英特爾等也都在存內計算領域取得了積極進展,探索將存儲與計算緊密結合的創新方案。

在國內,新興AI和存儲企業的蓬勃發展也為存算一體技術注入了新的活力。知存科技作為其中一員,在存內計算芯片的研發和推廣方面處于領先地位。他們的WTM2101基于nor flash存儲介質,40nm的制程實現了超低功耗以及高算力。特別適用于智能語音和智能健康等領域。該公司不僅在技術上取得了突破,2023年1月還獲得了2億元的B2輪融資,顯示了市場對其發展的認可和期待。

知存科技的成就不僅在于技術上的創新,更在于其成功將存算一體技術落地并投入量產。這種領先地位使得知存科技成為國內存算一體領域的重要代表之一,為未來的技術發展和產業進步貢獻著不可或缺的力量。

國產存算一體進展統計(收集自企業官網、新聞報道等公開信息,僅供參考)

序號 企業 存儲器介質 產品型號 量產進程 應用場景 融資
1 知存科技 Flash WTM-2系列
WTM-8系列
WTM2101已量產商用;WTM-8系列已完成投片 智能語音、智能健康、高性能圖像、空間計算等 B2輪
2 后摩智能 SRAM/RRAM 鴻途?H30 2021年8月完成首款芯片驗證流片 智能駕駛、泛機器人、邊緣端等 Pre-A+輪
3 蘋芯科技 SRAM S200 已完成流片,處于外部測試階段 可穿戴設備、無人機、攝像頭、安防領域 Pre-A輪
4 億鑄科技 ReRAM 未公布 未公布 數據中心自動駕駛 天使輪
5 智芯科 SRAM AT680X 已量產,2021年9月推向市場 針對超低功耗智能語音AIOT市場 天使輪
6 千芯科技 SRAM 未公布 產品己完成樣機驗證,處于小批量驗證優化階段 云計算、自動駕駛、智能安防等 已完成數千萬人民幣融資
7 九天睿芯 未知 ADA100、ADA200 ADA 100己量產 應用于AIoT等對低功耗延時需求強烈的領域 A輪
8 恒爍半導體 NOR Flash CiNOR V1、CiNOR V2 流片成功,完成系統演示; CiNOR V2,在研發中 物聯網領域 上市公司

四、知存科技新型 WTM2101 SOC 評估板使用評測

非常有幸能夠體驗使用知存科技 WTM2101 SOC 評估板 WTMDK2101-ZT1,下面我會對該評估板進行詳細的評測。

4.1 WTMDK2101-ZT1 實驗評測目標概述

我們主要是使用WTMDK2101-ZT1 評估板,在準備安裝好后,我們會在測試環境模擬正常人說話聲音大小的聲音(20-30分貝)連接耳機完成后,會出現高分貝的雜音嘯叫(30分貝左右);當板子被啟用后,這些雜音立即消失(時間延遲<1ms),這展示了ZT1開發板成功抑制嘯叫的效果。

4.2 WTMDK2101-ZT1 評估板介紹與安裝

4.2.1 WTMDK2101-ZT1 評估板介紹

收到評估板后,馬上開箱打開,我們可以看下圖來仔細看一下 WTMDK2101-ZT1 評估板實物:

wKgZomZFsQOAOEPFAEkwrzFJetE879.jpg

可以看到中心區域就是我們的 WTM2101 芯片,在兩測分別有 IO 接口,其中右側包括:兩個 Flash,一個 I2S接口和 J Tag 接口,還有一個音頻模塊的耳機接口;在測試板的下方的 IO 接口中包括 3個按鍵,兩排 LED,一級一組主控芯片接口。

我們接下來的實驗中就會用到音頻模塊的耳機接口。

為了方便我們了解開發板構造,我們可以詳細參看下面的開發板系統框圖:

4.2.2 評估板組件安裝

這里測試的 WTMDK2101-ZT1 評估板有3個組件

含有 WTMDK2101 芯片的主測試版

嘯叫測試耳機

測試子板(用于測試版燒錄時使用)

測試主板圖以及接口說明參照如下:

wKgaomZFsQWAOpXzADE1lu2kT6o629.jpg

測試耳機,可以按照上圖標注部分進行連接耳機。

wKgaomZFsQuAWKCKADyHNfG0PxE210.jpg

測試子板,可以看到我們測試子板有六根連接線,并且不同線有其不同標注,如果需要鏈接測試主板,需要依據線類型進行鏈接。

wKgZomZFsQ6AFwZ-AA7d-vKKdHY487.jpg

4.3 評估板調試

我們依次將評估板耳機與子板鏈接到測試主板,并且接通USB電源到 Windows操作系統電腦中。這里可以注意,我們使用的是USB接入電源連接在電腦中,你也可以是用其他的電源接入即可。

wKgaomZFsQ-ACx6pACGeG1Lt6_0598.jpg

如下圖所示,將拔碼開關打開到USB一側,代表使用USB連接供電,當然如果我們直接使用電池供電,則需要將拔碼開關撥到右側。當我們成功供電后,會看到LED3的燈已經亮起。

wKgZomZFsRGAB-P7ACkbcf8VO90663.jpg

4.4 嘯叫音識別測試

我們先進行第一個測試,使用開發板來識別嘯叫音

我們在模擬測試環境后,在播放音樂進行耳機監聽測試的時候,耳機會傳出聲音迅速被放大的識別后雜音被抑制,這個時間非常短暫。

首先是我們模擬環境,我們找到了同事的電腦,直接播放一個大約和人聲分貝大小的一段音樂,之后我們的麥克風進行識別,這樣的時候我們的開發板回對嘯叫音進行識別。

wKgaomZFsRKAam8TAAQUBnrCfsc587.jpg

當我們播放音樂后,使用音頻頻譜檢測軟件進行監聽嘯叫的聲音一段時間,經過測試后從下面測試圖中可以明顯看到,當出現嘯叫音的時候,我們的開發主板能夠精準的檢測出來。這個測試給我個人的感受是知存科技的 WTMDK2101的強大之處是精準識別出嘯叫,并且能夠無聲處理,精準度非常高且速度快。

4.5 嘯叫音抑制測試

接下來我們驗證嘯音抑制功能,不知道你是否有在 KTV 唱歌或者參加會議拿著話筒講話的經歷,如果有的話,你一定會遇到過你講話的時候突然出現了嘯音,那種特別鳴的聲音,下面我們使用WTMDK2101-ZT1 評估板來測試一下知存科技產品的嘯音抑制功能。

我們首先在一臺電腦中準備好知存科技助聽控制臺程序,該程序可以打開或者關閉降噪(NR)功能,這樣方便我們進行對比。

首先我們準備嘯音進行檢測,我們的做法是先將助聽器測試控制臺的算法開關處于關閉狀態。

wKgZomZFsROAAVYPAADQVy2y-u4111.jpg

調整好,來檢測耳機中的測試音,顯示的圖譜如圖所示:

因為測試環境的原因,中間可能有部分的干擾音,如果小伙伴們進行測試的時候建議清晨或者晚上比較安靜的地方進行測試。

wKgaomZFsROALBfdAAS6jGhiAPw033.jpg

之后我們將開發板的算法開關相應的開關打開,之后在進行監聽耳機音頻,并輸出音頻圖譜。

注意:其中的 NR 開關就包括了抑制嘯音的算法功能。

wKgaomZFsRSAa8S2AAFt6P76J5s200.jpg

開發板開啟嘯音抑制功能后的音頻圖譜。

wKgZomZFsRWAGnu3AAbjV0buork917.jpg

從我們前后嘯音抑制后的圖譜對比中可以看出,在開啟降噪(嘯音抑制)功能前,從圖譜中可以看到嘯音明顯,并且其平均的聲音分貝是:42.2分貝;當我們開啟開發板的嘯音抑制功能后,嘯音得到明顯的抑制,并且平均分貝為:38.9分貝??梢苑治龅贸鲋婵萍嫉膶[音抑制功能非常顯著。

五、文末總結

我回顧調查資料以及動手進行實驗的過程中,深刻的感受到存內計算對數據處理的強大,也期待下次可以加入知存的線下實操訓練營,更深度的體驗存內計算技術。知存科技的成就代表著存算一體技術邁向產業化的重要一步。然而,技術和市場仍需面對挑戰,需要更多創新和探索。整體來看,存算一體技術發展前景廣闊,但仍需持續關注并推動其朝著更高效、智能的方向發展。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • DRAM
    +關注

    關注

    40

    文章

    2231

    瀏覽量

    182365
  • AI
    AI
    +關注

    關注

    87

    文章

    27061

    瀏覽量

    264831
  • 憶阻器
    +關注

    關注

    8

    文章

    69

    瀏覽量

    19567
  • 存內計算
    +關注

    關注

    0

    文章

    28

    瀏覽量

    1316
收藏 人收藏

    評論

    相關推薦

    【大語言模型:原理與工程實踐】大語言模型的評測

    和優化至關重要,它們能夠提供準確的反饋,指導模型在訓練和調優過程中的改進方向。 大語言模型對話能力評測:對話能力評測是大語言模型性能評估的核心環節,涉及多種交互場景,如閑聊、常識問答
    發表于 05-07 17:12

    內計算WTM2101編譯工具鏈 資料

    領先的內計算芯片企業。公司針對AI應用場景,在全球率先商業化量產基于內計算技術的神經網絡芯片。憑借顛覆性的技術創新,科技突破傳統計算
    發表于 05-16 16:33

    科技助力AI應用落地WTMDK2101-ZT1評估板實地評測性能揭秘

    聯網領域上市公司四、科技新型 WTM2101 SOC 評估板使用評測 非常有幸能夠體驗使用
    發表于 05-16 16:38

    評估通過Python快速開發異構處理器FPGA應用性能(PYNQ評測

    本帖最后由 lee_st 于 2018-6-21 02:18 編輯 評估通過Python快速開發異構處理器FPGA應用性能(PYNQ評測
    發表于 06-19 08:36

    Firefly支持AI引擎Tengine,性能提升,輕松搭建AI計算框架

    的計算圖表示。ARM專用AI引擎 Tengine支持了Firefly平臺,可以輕松搭建AI計算框架,性能大幅度提升,助力AI開發。在Fire
    發表于 08-13 15:58

    揭秘乎是如何布局AI技術整個體系架構的

    一文揭秘乎是如何搞 AI 的技術頭條
    發表于 04-03 15:54

    揭秘AI 的神話與現實

    使用AI解決問題提供了第1次經驗,但它導致了分散的跨組織的ML算法。不幸的是,這種分散的ML算法不能完全釋放數據中隱藏的價值,也不能充分利用組織所擁有的寶貴業務知識。此外,它們還會給公司帶來潛在風險。分散
    發表于 05-06 16:46

    聲打磨四年的AI芯片出爐

    聲打磨四年的AI芯片出爐,中國造芯勢力群起
    發表于 05-05 09:11

    EdgeBoard FZ5 邊緣AI計算盒及計算卡

    科技攜手百度,推出系列高性能及高性價比EdgeBoard 邊緣AI計算卡/計算盒,助力AI項目落地??伸`活適配海量的且不斷迭代的
    發表于 08-31 14:12

    Tir-RK3399+movidius AI深度學習評估板有哪些性能

    Tir-RK3399+movidius是什么呢?Tir-RK3399+movidius AI深度學習評估板有哪些性能呢?RK3399的板卡配置主要有哪幾點呢?
    發表于 03-07 07:51

    評估板DMDB2101性能_電路圖_材料清單和PCB布局圖

    ,馬達電壓范圍高達60V,馬達電流高達5A,板上提供5V和3.3V電壓源,三個半橋可用于三相BLDC馬達驅動。本文介紹了評估板DMDB2101主要性能,電路圖,材料清單和PCB布局圖。
    的頭像 發表于 05-01 15:33 ?3218次閱讀

    英特爾于AI的七重助力

    「破局」AI規?;?b class='flag-5'>落地,英特爾至強的七重助力
    的頭像 發表于 08-23 09:46 ?2326次閱讀

    怎么評估算法的性能

    我在很多文章里都有吐槽大規模預訓練模型的性能差,落地成本高,這一期就和大家講講,怎么評估算法的性能的。
    的頭像 發表于 08-11 10:40 ?1365次閱讀

    云知聲入選AI商業落地TOP100榜單與綜合型AI服務廠商TOP30榜單

    《2022年中國AI商業落地報告》重點關注AI企業的技術與服務、安全與效率、業務拓展與場景實踐能力等,對國內AI企業的商業落地潛力做出
    發表于 09-16 11:05 ?457次閱讀

    國際最新AI算力評測標準SPEC ML即將發布,浪潮信息連任SPEC ML主席

    國際權威標準性能評估組織SPEC第35屆年會日前在美國舉行。會上,SPEC組織確定新一年工作計劃,為推動AI算力產業的更快發展,國際最新AI算力評測
    的頭像 發表于 02-24 19:07 ?3273次閱讀
    國際最新<b class='flag-5'>AI</b>算力<b class='flag-5'>評測</b>標準SPEC ML即將發布,浪潮信息連任SPEC ML主席
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>