<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

奔向大模型時代，存算一體成為突破算力瓶頸的關鍵技術？

電子發燒友網報道（文/李彎彎）大模型的訓練和推理需要高性能的算力支持。以ChatGPT為例，據估算，在訓練方面，1746億參數的GPT-3模型大約需要375-625臺8卡DGXA100服務器訓練10天左右，對應A100GPU數量約3000-5000張。

在推理方面，如果以A100GPU單卡單字輸出需要350ms為基準計算，假設每日訪問客戶數量高達5,000萬人時，按單客戶每日發問ChatGPT應用10次，單次需要50字回答，則每日消耗GPU的計算時間將會高達243萬個小時，對應的GPU需求數量將超過10萬個。

大模型的訓練和推理依賴通用GPU

算力即計算能力，具體指硬件對數據收集、傳輸、計算和存儲的能力，算力的大小表明了對數字化信息處理能力的強弱，常用計量單位是FLOPS（Floating-pointoperationspersecond），表示每秒浮點運算次數。

當前大模型的訓練和推理多采用GPGPU。GPGPU是一種由GPU去除圖形處理和輸出，僅保留科學計算、AI訓練和推理功能的GPU。GPU芯片最初用于計算機系統圖像顯示的運算，但因其相比于擅長橫向計算的CPU更擅長于并行計算，在涉及到大量的矩陣或向量計算的AI計算中很有優勢，GPGPU應運而生。

在這波ChatGPT浪潮中長期押注AI的英偉達可以說受益最多，ChatGPT、包括各種大模型的訓練和推理，基本都采用英偉達的GPU。目前國內多個廠商都在布局GPGPU，包括天數智芯、燧原科技、壁仞科技、登臨科技等，不過當前還較少能夠應用于大模型。

事實上業界認為，隨著模型參數越來越大，GPU在提供算力支持上也存在瓶頸。在GPT-2之前的模型時代，GPU內存還能滿足AI大模型的需求，近年來，隨著Transformer模型的大規模發展和應用，模型大小每兩年平均增長240倍，實際上GPT-3等大模型的參數增長已經超過了GPU內存的增長。傳統的設計趨勢已經不能適應當前的需求，芯片內部、芯片之間或AI加速器之間的通信成為了AI計算的瓶頸。

存算一體技術如何突破算力瓶頸

而存算一體作為一種新型架構形式受到關注，存算一體將存儲和計算有機結合，直接在存儲單元中處理數據，避免了在存儲單元和計算單元之間頻繁轉移數據，減少了不必要的數據搬移造成的開銷，不僅大幅降低了功耗，還可以利用存儲單元進行邏輯計算提高算力，顯著提升計算效率。

大模型的訓練和部署不僅對算力提出了高要求，對能耗的要求也很高，從這個角度來看，存算一體降低功耗，提升計算效率等特性在大模型方面確實更具優勢。

因為獨具優勢，過去幾年已經有眾多企業進入到存算一體領域，包括知存科技、千芯科技、蘋芯科技、后摩智能、億鑄科技等。各企業的技術方向也有所不同，從介質層面來看，有的采用NORFlash，有的采用SRAM，也有的采用RRAM。

從目前的情況來看，基于NORFlash的存算一體產品，在算力上難以做大，應用場景主要是對算力要求不高，對功耗要求高的可穿戴設備等領域；基于SRAM的存算一體算力可以更大些，能夠用于自動駕駛領域；而真正能夠在算力上實現突破，可以稱之為大算力AI芯片的，目前只有億鑄科技主推的基于RRAM的存算一體技術。

在大模型對大算力的需求背景下，億鑄科技近期更是提出了存算一體超異構計算。超異構計算能夠把更多的異構計算整合重構，從而各類型處理器間充分地、靈活地進行數據交互而形成的計算。

簡單來說，就是結合DSA、GPU、CPU、CIM等多個類型引擎的優勢，實現性能的飛躍：DSA負責相對確定的大計算量的工作；GPU負責應用層有一些性能敏感的并且有一定彈性的工作；CPU啥都能干，負責兜底；CIM就是存內計算，超異構和普通異構的主要區別就是加入了CIM，由此可以實現同等算力，更低能耗，同等能耗，更高算力。另外，CIM由于器件的優勢，能負擔比DSA更大的算力。

億鑄科技創始人、董事長兼CEO熊大鵬博士表示,存算一體超異構計算的好處在于：一是在系統層,能夠把整體的效率做到最優；二是在軟件層,能夠實現跨平臺架構統一。

基于存算一體超異構概念，億鑄科技提出了自己的技術暢想：若能把新型憶阻器技術(RRAM)、存算一體架構、芯粒技術（Chiplet）、3D封裝等技術結合，將會實現更大的有效算力、放置更多的參數、實現更高的能效比、更好的軟件兼容性、從而突破性能瓶頸，抬高AI大算力芯片的發展天花板。

圖源：億鑄科技

目前國內已公開的能夠實現存算一體AI大算力的芯片公司僅有億鑄科技，其基于RRAM的存算一體AI大算力芯片將在今年回片。

小結

無論是大模型的訓練還是部署，對大算力芯片的需求都很大，從目前的情況來看，大模型的訓練在很長時間都將要依賴于英偉達的GPU芯片。

而在大模型的推理部署方面，除了GPU,存算一體將是非常合適的選擇。未來大模型的部署規模會很大，從前不久英偉達專門推出適合大型語言模型部署的芯片平臺也能看出來。據億鑄科技透露，公司規劃的產品，在同等功耗下，性能將超越英偉達H100系列的推理芯片。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
26804

瀏覽量
264465
大數據

大數據

+關注

關注
64

文章
8696

瀏覽量
136668
存算一體

存算一體

+關注

關注
0

文章
95

瀏覽量
4156
大模型

大模型

+關注

關注
2

文章
1704

瀏覽量
1326

評論

相關推薦

集特一體機

顯卡一體機

jf_67464575

發布于 :2024年05月22日 09:05:55

知存科技助力AI應用落地：WTMDK2101-ZT1評估板實地評測與性能揭秘

中得到彰顯。存算一體架構的突破傳統馮·諾依曼架構的范式探索成為重要趨勢。這種架構改變了存

發表于 05-16 16:38

存內計算WTM2101編譯工具鏈資料

存內計算是突破物理極限的下一代算力技術- AIGC等人工智能新興產業的快速發展離不開

發表于 05-16 16:33

【算能RADXA微服務器試用體驗】Radxa Fogwise 1684X Mini 規格

ChatGLM2-6B、AIGC、Llama2、SAM、Whisper等超大參數模型還有一份詳細的英文的規格表：另外，算能RADXA微服務器服務器，還是大學生集成電路創新創業大賽之# 第八屆集創賽杯賽題目

發表于 02-28 11:21

iBeLink KS MAX 10.5T大算力領跑KAS新領域

有8G的顯存，可以處理復雜的算法，提高挖掘穩定性。iBeLink ks max10.5T的超大特點是它的高效節能，它采用了先進的“存算一體”高通量算

發表于 02-20 16:11

大茉莉X16-P，5800M大算力稱王稱霸

算力

Rykj365
發布于 :2024年01月25日 14:54:52

人臉考勤打卡一體機

一體機

jf_66410442
發布于 :2024年01月09日 11:09:22

人形機器人產業化需要突破哪些關鍵技術呢？

人形機器人已經成為全球科技界看好的發展熱點之一。隨著政策和產業兩方面發力，中國人形機器人的產業化有望提速，不過也還有不少關鍵技術需要突破。　

發表于 12-01 09:36 ?699次閱讀

#清華 #芯片 #存算一體化清華研制出全球首顆存算一體芯片

芯片

深圳市浮思特科技有限公司
發布于 :2023年10月10日 18:03:59

c語言算時間for延時，怎么算時間？

c語言算時間 for延時，怎么算時間？for(i=;;)

發表于 10-08 07:46

視覺導航關鍵技術及應用

由于視覺導航技術的應用越來越普及 ,因此 ,有必要對視覺導航中的關鍵技術及應用進行研究。文章對其中的圖像處理技術和定位與跟蹤技術進行了詳細研究 ,并與此相對應 ,介紹的相關的應用。

發表于 09-25 08:09

面向OpenHarmony終端的密碼安全關鍵技術

研究中心主任。內容來源第一屆開放原子開源基金會OpenHarmony技術峰會——安全及機密計算分論壇 ? 正文內容終端設備的密碼安全通過哪些關鍵技術保障，在OpenHarmony上有哪些方面可以

發表于 09-13 19:20

21.5寸安卓工業一體機嵌入式工控一體機微嵌工業平板電腦廠家

一體機

jf_91874718
發布于 :2023年07月05日 16:44:25

國產化一體機

一體機

jf_22764069
發布于 :2023年06月27日 14:38:48

揚宇光電人臉測溫一體機

一體機

jf_22764069
發布于 :2023年06月27日 14:36:57

Carol Li
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 國內最值得關注的10家人工智能語音識別公司
Hot 國內外 18 家藍牙芯片廠商及產品型號集合

New AI視覺檢測系統在多方面實現技術創新
New 大模型端側部署加速，都有哪些芯片可支持？

精選推薦
更多

文章

資料

帖子

PO系列機床測頭助力零部件自動化生產

中圖儀器
13小時前

57 閱讀

ArkUI-X開發指南：【SDK配置和構建說明】

jf_46214456
4小時前

201 閱讀

鴻蒙OS開發：典型頁面場景【一次開發，多端部署】實戰（音樂專輯頁2）

jf_46214456
4小時前

188 閱讀

鴻蒙開發ArkUI-X基礎知識：【ArkUI代碼工程及構建介紹】

jf_46214456
4小時前

202 閱讀

鴻蒙OS開發：典型頁面場景【一次開發，多端部署】實戰（音樂專輯頁）

jf_46214456
1天前

100 閱讀

HSD-20 USB接口微功率數傳模塊使用手冊

余溫重顧
159 KB

免費

59下載

ARM匯編語言工具v16.9.0.lts用戶指南

secret000
2.02 MB

1積分

0下載

epan基于SpringBoot的在線云盤

djfldsthtr
1.14 MB

免費

1下載

mac2imgur imgur.com截圖上傳

南中南
6.01 MB

免費

4下載

WSLg在Windows上無縫運行Linux GUI程序

siyugege
1.38 MB

免費

0下載

瑞米派Ubuntu系統移植指南-米爾RemiPi

blingbling111
1天前

142 閱讀

2個不共地的控制器控制4個燈遇到的問題

rgb2251
1天前

489 閱讀

在全志H616核桃派開發板GPIO基礎實驗之UART串口通訊

corkia
1天前

293 閱讀

在全志H616核桃派開發板GPIO基礎實驗之有源蜂鳴器

corkia
1天前

284 閱讀

AD8421單電源設計

jf_81610172
1天前

768 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看