<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

存內計算——助力實現28nm等效7nm功效

算力是數字經濟時代的核心生產力，并且近年來需求劇增。而我國當前的算力供給上仍面臨巨大的挑戰，一方面，國外的高端算力芯片被美國禁售，另一方面，國內的芯片產業仍處于發展階段[1]。如何獲取算力提升，成為當前時代芯片研究的重要命題。

一．算力突破

研究如何獲取算力提升，要從算力的來源上考慮。芯片算力可大致總結為以下計算公式：

因此，獲取算力提升的主要切入點是晶體管密度、芯片面積、單位晶體管的算力，這三個方面分別主要涉及制作工藝、光刻口徑、計算架構。

（1）晶體管密度：

晶體管密度的主要影響因素是制造工藝、基板材料，同樣的面積內，封裝的可用晶體管越多，就能提供越強的算力。

制造工藝方面，受限于美國的無理封鎖，當前國內量產芯片的最先進制造工藝為14nm，國際上量產芯片最先進的制造工藝為3nm。清華大學尹首一教授認為，國內芯片制造工藝將長期處于在14nm，國內芯片產業與研究不能指望通過制造工藝獲得性能提升。在國際領域，雖然芯片制造商仍能享受到制程工藝帶來的升級，但從蘋果A17Pro芯片的性能表現、高通仍然采用基于4nm的升級工藝制造今年旗艦芯片的市場行為來看，產業界最先進的工藝制程已經不及預期。

基板材料方面，隨著制造工藝步入埃米級別，芯片制造工藝受到硅原子性質的影響越來越大，產業界和學界也在探索新的材料用于制造芯片，通過“彎道超車”的方式提升晶體管密度，比如英特爾等廠商正在研發的玻璃基芯片[3]、北京大學彭練矛教授團隊正在研發的碳基芯片[4]。

（2）芯片面積

芯片面積和晶體管密度考慮的是類似的問題，在一顆芯片內提供更多的可用晶體管，就意味著能提供更多的算力。但是在當前，GPU的單芯片面積基本已經達到上限，想通過面積獲得進一步的算力提升，可以從拓展角度考慮，有兩個探索的方向：平面拓展和垂直拓展。

平面拓展就是在光刻時使用光照拼接技術，實現兩個曝光區域的物理連接，來把芯片做大，通過計算架構的優化設計，保證晶圓中晶體管的可用性，Cerebras公司和Tesla公司已經實現了晶圓級芯片。垂直拓展就是把芯片或其中的部分器件三維堆疊起來，如AMD的3D緩存技術。

（3）單位晶體管提供的算力：

單位晶體管提供的算力和計算架構息息相關，計算架構的優化改進或使用新的計算架構，能夠對芯片算力產生更根本的影響。計算架構上面臨的主要問題有：基本器件的設計架構不同導致的晶體管數量不同，需要探索更優的基本器件結構設計；馮諾依曼架構的“存儲墻”導致的訪存瓶頸，限制了算力的發揮，需要降低帶寬對算力的限制；功耗限制導致的darkselect問題，即為了保證芯片功耗，不能同時點亮芯片上的所有晶體管，需要優化設計來避免。

面對以上的部分問題，產業界和學界已經給出了相應的解決方案。在計算架構的優化方面，有數據流、可重構、存算一體三條路徑。首先，數據流芯片嘗試不使用指令而是直接通過數據驅動計算，避免外部存儲訪問，來解決晶體管利用率低的問題。Google的TPU芯片已經證明了，這種方式雖然在單芯片性能上遜于GPU，但能在系統級算力上實現超越[1]。具體來講，單核TPU v4的性能是低于A100 GPU的，只有它的88%，但1024顆TPU v4的集群性能，超過了A100 GPU的集群性能，最高達到了1.96倍。4096顆TPUv4芯片示意圖如下圖3所示。

圖 34096顆TPUv4芯片集成[6]

可重構芯片嘗試在芯片內布設可編程的計算資源，根據計算任務的數據流特點，動態構造出最適合的計算架構，國內團隊設計并在12nm工藝下制造的CGRA芯片，已經在標準測試集上實現了和7nm的GPU基本相當的性能。存算一體嘗試通過集成存儲和計算在一個芯片甚至一個容器內，來突破訪存限制，發揮芯片的最大算力。下面我們將重點介紹存算一體技術。

二．存算一體

存算一體是一種新型計算架構，直接利用存儲器本身進行數據處理，從根本上消除數據搬運，實現存儲與計算融合一體化，成為后摩爾時代集成電路領域的重點研究方向之一。

（1）存算一體技術優勢：

存算一體技術具有很大的優勢，存算融合的特點使其天然具備較大算力、低延遲、高帶寬等優勢。相比傳統架構，存算一體大算力芯片不僅僅是能效比有數量級的提升，更重要的是將大大緩解存儲墻問題，簡化AI服務器集群的互聯網絡及其管理和各類成本，包括高速互聯、DPU和能耗等。因此，存算一體技術是實現芯片算力突破的重要途徑，可助力實現28nm等效7nm功效。

（2）傳統工藝芯片算力提升實例：

目前已有一些企業和高校，通過存算一體技術，實現28nm制程芯片的能效算力提升。

憶鑄科技于2021年10月于上海成立，是一家基于ReRAM設計和落地數字存算一體芯片的企業。在公司的技術暢想中，他們嘗試將新型憶阻器、存算一體架構、Chiplet技術、3D封裝等技術結合，實現大算力、高能效比的芯片。據其官網信息，億鑄第一代算力芯片采用的工藝為28nm，其能效比可以實現目前主流算力板卡的10倍以上[7]。

2023年8月29日，華為的麒麟9000s芯片隨著Mate 60 Pro成功發布，該款芯片一經發出，就引發業界討論：“麒麟9000s的工藝制程究竟是多少？”在2023年中國集成電路設計業（ICCAD）年會上，清華大學魏少軍教授在演講中提出：“能夠用14nm，甚至28nm做成7nm的產品性能才是真正的高手”。據悉，華為并未公布麒麟9000s真正的工藝制程，知名科技解析機構TechInsights對麒麟9000s深入解析結果顯示，該芯片確實擁有7nm工藝制程的特性。

圖 4 華為麒麟9000s芯片

知存科技的WTM2101量產芯片采用40nm制程，將神經網絡部署在芯片中，已經實現了滿足端側算力需求的語音識別等功能。即將量產的WTM8芯片，采用28nm制程，作為新一代存內AI計算視覺芯片，能夠實現圖像的AI超分、插幀、HDR識別和檢測這樣復雜的功能[8]，現有的一些研究也已經證明存算一體可以實現16bit、32bit的浮點計算，具備進入高算力芯片的能力。

圖 5知存科技WTM-8系列芯片示意圖

三．未來展望

隨著工藝的進步，先進工藝制程已從28nm發展至3nm，蘋果新發布的A17Pro已采用了tsmc 3nm工藝。據悉，tsmc也將投資近萬億新臺幣建造1nm晶圓廠。在未來，有沒有一種全新的方案解決算力不足、工藝制程發展空間受限的局面？存算一體便是答案之一。

綜上所述，存算一體技術因為其特殊優勢，可以大大提升芯片算力，從而使得成熟28nm制程芯片能夠實現等效于7nm制程芯片的性能。當然這其中還有很多難點需要突破，需要科研工作著的不斷努力，期待未來基于存算一體技術的芯片可以更好地突破芯片制程的限制。

[1] 尹首一教授報告：以“架構”創新，突破算力卡脖子問題.

[2] 極客灣 space.bilibili.com/25876945.

[3] 第八屆未來芯片論壇中英特爾中國研究院的報告.

[4] 北京大學新聞網：專訪北大碳基芯片團隊：我們換道走了20年，覺得能走下去（news.pku.edu.cn）.

[5] AMD官網 amd.com.

[6] Jouppi N, Kurian G, Li S, et al. Tpu v4: An optically reconfigurable supercomputer for machine learning with hardware support for embeddings[C]//Proceedings of the 50th Annual International Symposium on Computer Architecture. 2023: 1-14.

[7] 憶鑄科技官網（yizhu-tech.com）.

[8] 知存科技官網（witintech.com）.

[9] 從7nm到5nm，半導體制程 - 吳建明wujianming - 知乎（zhuanlan.zhihu.com/）.

審核編輯黃宇

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

芯片

芯片

+關注

關注
447

文章
48292

瀏覽量
411479
AI

AI

+關注

關注
87

文章
27061

瀏覽量
264825
芯片制程

芯片制程

+關注

關注
0

文章
51

瀏覽量
4566
算力

算力

+關注

關注
1

文章
709

瀏覽量
14426
存內計算

存內計算

+關注

關注
0

文章
28

瀏覽量
1316

評論

相關推薦

Altera 28nm FPGA助力NEC提升LTE基站性能

Altera的28nm FPGA所具有的靈活性和性能指標滿足了下一代基站各種LTE系統級特性的需求，而且沒有犧牲功效。近日Altera宣布NEC將使用其28nm FPGA，助力提高其L

發表于 11-19 09:09 ?767次閱讀

采用低功耗28nm降低系統總成本

本資料是關于如何采用低功耗28nm降低系統總成本

發表于 07-31 21:25

請問FPGA中的nm是什么意思？

像我們看到的Xilinx 28nm Virtex 7 28mm或者20nm 的UltraScale啊。nm在FPGA里面具體指什么呢

發表于 10-08 17:18

什么是Altera最新28nm FPGA技術？

1月22日，Altera 在北京展示了號稱業界最全面的28nm 最新技術及強大解決方案。Altera公司的多位工程師為在京的媒體人士進行了講解。

發表于 08-21 07:37

如何利用28nm高端FPGA實現功耗和性能的平衡？

　從工藝選擇到設計直至投產，設計人員關注的重點是以盡可能低的功耗獲得最佳性能。Altera在功耗和性能上的不斷創新，那其28nm高端FPGA如何實現功耗和性能的平衡？具體有何優勢？　

發表于 09-17 08:18

10nm、7nm等制程到底是指什么？宏旺半導體和你聊聊

隨著半導體產業技術的不斷發展，芯片制程工藝已從90nm、65nm、45nm、32nm、22nm、14nm

發表于 12-10 14:38

請問C2000系列產品的制程是45nm還是28nm？

請問工程師，C2000系列產品的制程是45nm還是28nm？同一款新片可能采用不同的制程生產嗎？

發表于 06-17 14:41

Fusion Design Platform?已實現重大7nm工藝里程碑

? 在設計人員的推動下，加快部署7nm Fusion Design Platform，在具有挑戰性的設計方面，不僅設計實現質量提升了20%，設計收斂速度也提高了兩倍多。? Fusion Design

發表于 10-22 09:40

芯片工藝從目前的7nm升級到3nm后，到底有多大提升呢？

10nm、7nm等到底是指什么？芯片工藝從目前的7nm升級到3nm后，到底有多大提升呢？

發表于 06-18 06:43

請大神解釋一下28nm下是沒有MIM電容了嗎？

之前只用過tsmc 65nm的，在設置電感時候是有indcutor finder的工具的，28nm下沒有了嗎？只能自己掃描參數一個一個試？28nm下是沒有MIM電容了嗎？相關的模擬射頻器件（比如

發表于 06-24 06:18

求一份tsmc 7nm standard cell library

求一份tsmc 7nm standard cell library求一份28nm或者40nm 的數字庫

發表于 06-25 06:39

從7nm到5nm，半導體制程精選資料分享

從7nm到5nm，半導體制程芯片的制造工藝常常用XXnm來表示，比如Intel最新的六代酷睿系列CPU就采用Intel自家的14nm++制造工藝。所謂的XXnm指的是集成電路的MOSFET晶體管柵極

發表于 07-29 07:19

降低賽靈思28nm 7系列FPGA的功耗

本白皮書介紹了有關賽靈思 28 nm 7 系列 FPGA 功耗的幾個方面，其中包括臺積電 28nm高介電層金屬閘 (HKMG) 高性能低功耗（28nm HPL 或

發表于 03-07 14:43 ?41次下載

臺積電張忠謀談大陸28nm工藝：增長很快

已經量產了28nm工藝，TSMC董事長張忠謀日前談到了大陸28nm工藝的競爭，他表示大陸公司的28nm產能增長很快，其中有部分原因是政府背后支持。

發表于 10-27 14:15 ?1564次閱讀

半導體制程發展：28nm向3nm的“大躍進”

雖然高端市場會被 7nm、10nm以及14nm/16nm工藝占據，但40nm、28nm等并不會退

發表于 10-15 11:18 ?4804次閱讀

精選推薦
更多

文章

資料

帖子

采用144核，能效提升66%！英特爾至強6處理器震撼上市，加速數據中心升級

章鷹觀察
7小時前

547 閱讀

如何移植FFmpeg

ElfBoard
2天前

523 閱讀

基于Arm Cortex-CM85內核的RA8D1作為控制器通過MIPI DSI實現LVGL顯示

瑞薩MCU小百科
2天前

747 閱讀

便攜式直流接地故障查找儀如何使用——每日了解電力知識

武漢摩恩
2天前

768 閱讀

重磅！英特爾發布intel3制程至強6能效核處理器，賦能數據中心能效升級

章鷹觀察
2天前

788 閱讀

從零開始寫的RISC-V內核玉衡處理器

姚小熊27
22.42 MB

免費

11下載

SocketPlane多主機容器網絡

王銀喜
1.56 MB

免費

0下載

Hanabi UICollectionViewLayout的子類

鄧長生
78.67 MB

免費

2下載

PLC編程語言入門，常用指令集匯總分享

王剛
0.27 MB

免費

90下載

單節鯉離子電池恒流恒壓線性充電控制器FS4058數據手冊

泛海微ic
1.49 MB

免費

0下載

I.MX6ULL-飛凌 ElfBoard ELF1板卡 - 如何在Ubuntu中編譯OpenCV庫(X86架構）

jf_25331175
3天前

652 閱讀

鴻蒙原生應用元服務開發-設備管理USB服務開發場景與接口

李洋水蛟龍
3天前

288 閱讀

嵌入式學習-飛凌ElfBoard ELF 1板卡 - 如何在Ubuntu中編譯OpenCV庫

jf_25331175
3天前

837 閱讀

【留言有禮】佳節至，分享“粽”要記憶，傳遞溫馨祝福，贏取精美禮品！

ElecFans小喇叭
4天前

886 閱讀

無刷電機用的單電阻采樣的FOC，拿天線貼著電機線或者貼近采樣芯片，電機就會停轉

剛剛回國弄
4天前

1379 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看