<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI大模型需求持續激增,中國AI芯片如何?

章鷹觀察 ? 來源:電子發燒友 ? 作者:章鷹 ? 2024-02-24 09:07 ? 次閱讀

2月21日,英偉達(Nvidia)公布截止到2024年1月28日的第四季度營收,收入達到221億美元,比較上一季度增長22%,較去年同期增長265%。英偉達2024財年收入增長126%,達到609億美元。

wKgZomXb5ICASzjqAADUIV0l9xQ214.jpg
在公布強勁財報后,Nvidia周四股價飆升16%,市值增加約2770億美元,令其總市值接近2萬億美元。擊敗Facebook母公司Meta Platform在今年2月早前達到的1,960億美元,成為華爾街史上單日市值增加最多的企業。
wKgZomXb5IeACoF-AAFfas9ULQw284.jpg
Nvidia創始人兼首席執行官黃仁勛表示:“加速計算和生成式AI已經達到一個轉折點。全球企業、行業和各個國家的需求都在激增。由于生成式AI以及整個行業從中央處理器轉向英偉達制造的加速器,對英偉達GPU的需求將保持高位?!?br />
摩根士丹利分析師Joseph Moore表示,Nvidia的表現超過預期,直到幾個季度前,我們從未見過超過20億美元的季度收入指引,但在AI激增期間,這已經成為常規。AI需求的強勁持續令人矚目。

2022年10月和2023年10月,美國商務部工業和安全局(BIS)兩次更新對中國的先進半導體和計算設備的出口管制,英偉達中國特供版GPU產品A800、H800芯片均已經于去年11月17日起在中國禁售。除此之外,AMD發布的性能最強的MI300X、MI300A、MI250X也不能賣到中國。在ChatGPT、AI大模型帶動下各國算力需求激增,中國芯片廠商如何挖掘這個市場的商機?本文進行主要的分析。

阿里云平頭哥

2023年的云棲大會上,阿里巴巴集團董事會主席蔡崇信闡釋了阿里云的新愿景:“打造AI時代最開放的云”。 他表示,隨著AI大模型技術的迅速發展,智能化時代正在開啟,AI將成為各行各業的新型生產力,并對算力提出更高要求。

成立于2018年的阿里平頭哥,正處于云計算的拐點之上。這是一家阿里巴巴全資的半導體芯片公司,業務主體擁有端云一體全棧產品系列,涵蓋數據中心芯片、IoT 芯片、處理器 IP 授權等,實現芯片端到端設計鏈路全覆蓋。

阿里平頭哥 2019 年 9 月推出了其首款高性能人工智能推理芯片──含光800,基于 12nm 制程與自研架構,整合 170 億晶體管,性能峰值算力達 820 TOPS。 在業界標準的 ResNet-50測試中,推理性能達到 78563 IPS,能效比達 500 IPS/W。

2023 年 8 月,阿里平頭哥發布了首個自研 RISC-V AI 平臺,支持運行 170 余個主流 AI 模型,推動 RISC-V 進入高性能 AI 應用時代。同時,平頭哥宣布玄鐵處理器 C920 全新升級,C920 執行 GEMM(矩陣的矩陣乘法) 計算較 Vector 方案可提速 15 倍。
wKgZomXb5JKAaWOAAADi7Es3yt4134.jpg
11月21日,平頭哥玄鐵RiSC-V上新了三款處理器:首次實現AI矩陣擴展的C907、滿足Vector1.0標準的C920,以及實時處理器R910,將加速推動RiSC-V在自動駕駛、人工智能、企業級SSD、網絡通信等場景和領域的大規模商用落地。C920較上一代提升了最高3.9倍的AI性能,可以跑Transformer模型,適合機器學習、自動駕駛領域。

華為昇騰910系列

Nvidia在最新提交給美國證券交易所的一份檔案,認定華為是AI芯片領域的主要競爭對手。Nvidia指出,與華為在AI芯片領域進行競爭,包括GPU、CPU網絡芯片。

在2018 全聯接大會上,華為提出 AI 戰略和全棧全場景 AI 解決方案,并發布了 2 顆全新的 AI 芯片:昇騰 910(Ascend 910)和昇騰 310(Ascend 310)。


兩款 AI 芯片均基于華為自研達芬奇架構,其中 Ascend 910(用于訓練)采用 7nm 制程,半精度達256TFOPs,功耗為 350W,運算密度號稱超越了 NVIDIA Tesla V100 和Google TPU v3。

Nvidia在2020 年和 2022 年推出了 A100 和 H100 芯片,占據了全球 AI 芯片市場的最大份額,華為昇騰910B據稱采用的是7nm制程。業界認為,華為昇騰 910B 能力已經基本做到可對標 Nvidia A100。

華為計算官網顯示,基于昇騰 910(Ascend 910)和昇騰 310(Ascend 310),華為還推出了Atlas AI 計算解決方案。華為目前 Atlas 300T 產品有三個型號,分別對應升騰 910A、910B、910 Pro B,最大 300W 功耗,前兩者 AI 算力均為 256 TFLOPS,而 910 Pro B 可達 280 TFLOPS(FP16)。

此前路透社的報道,國內搜索巨頭百度向華為下了訂單,購買昇騰910B用于AI服務器。

最新中國移動智算中心AI服務器采購大單,華為昇騰再次成為贏家。此次四家中標候選人中,河南昆侖為超聚變全資子公司,與華鯤振宇、烽火通信(控股子公司長江計算)、神州數碼均為華為昇騰認證的合伙伙伴。

百度昆侖芯3代

百度集團執行副總裁、百度ACG(智能云事業群)總裁沈抖表示,未來所有的企業都會強依賴大模型,而且所有的產品都會基于大模型來開發。

昆侖芯1代AI芯片于2020年量產,在百度搜索引擎、小度等業務中部署數萬片,是國內唯一一款經歷過互聯網大規模核心算法考驗的云端AI芯片。昆侖芯2代AI芯片于2021年8月量產,是國內首款采用GDDR6顯存的通用AI芯片,相比昆侖芯1代AI芯片性能提升2-3倍,且在通用性、易用性方面也有顯著增強。

而昆侖芯2代則采用了TSMC 7nm工藝,性能和功耗都有顯著提升。昆侖芯3代則大概率采用了7nm+ EUV工藝,進一步提升了性能和功耗比。此前,百度李彥宏的宣布第三代昆侖芯片將于2024年初上市。

寒武紀推出思元370、590系列及加速卡

2022年,寒武紀首顆訓推一體的Chiplet智能芯片思元370及系列加速卡初次亮相WAIC,思元370是寒武紀第三代云端產品,采用7nm制程工藝,最大算力高達256TOPS(INT8),是寒武紀第二代云端推理產品思元270算力的2倍。同時,思元370芯片支持LPDDR5內存,內存帶寬是思元270的3倍,可在板卡有限的功耗范圍內給人工智能芯片分配更多的能源,輸出更高的算力。

而寒武紀在2016年成立,專注于人工智能芯片產品的研發與技術創新,提供云邊端一體、軟硬件協同、訓練推理融合、具備統一生態的系列化智能芯片產品和平臺化基礎系統軟件,產品廣泛應用于服務器廠商和產業公司。

據悉,寒武紀最新一代思元590在性能上對標英偉達A100、A800,有可能在2024年上半年量產,成為國產替代的備選之一。

近年來寒武紀陸續推出思元、玄思等芯片/加速卡產品系列。 在目前AI算力建設大爆炸時期,特別是高端進口算力芯片受限下,國產替代的需求或讓寒武紀公司的芯片在算力時代搶得一定的市場份額。

沐曦:推出人工智能推理GPU曦思N100和通用計算芯片曦云C500

沐曦集成電路公司于2020年在上海成立,致力于為異構計算提供安全可靠的GPU芯片及解決方案,打造全棧GPU芯片產品。

2022年,沐熙集成電路推出了曦思N100,現處于規?;慨a和大規模出貨狀態。曦思N100是沐曦面向人工智能推理場景推出的高效能GPU產品,內置 MXN100 異構 GPGPU 處理器以及 HBM2E 顯存,單卡算力達 160TOPS(INT8)和 80TFLOPS(FP16),能夠提供最高 128 路編碼和 96 路解碼的視頻處理能力,兼容 HEVC、H.264、AV1、AVS2 等多種視頻格式,最高支持 8K 分辨率。

此外,沐曦首款面向人工智能訓練及通用計算的旗艦產品曦云C500在2023年6月流片,這款芯片基于自研的高性能GPU IP,特別適合千億參數AI大模型的訓練和推理,能夠提供構建高密度算力和云計算部署的優秀國產GPU解決方案,在2023年底實現規模量產。

小結:

分析師估計中國人工智能芯片市場價值70億美元。目前在大模型推理方面,國內 AI 芯片910B僅能達到Nvidia公司A100的60%-70%左右,集群的模型訓練難以為繼。而就在2月21日,Nvidia CEO黃仁勛向媒體表示,英偉達目前正在向客戶提供兩款面向中國市場的新型人工智能(AI)芯片樣品,以在美國采取對華芯片出口管制措施的背景下維持該公司在中國市場的地位。

此外,除了華為昇騰外,寒武紀、沐曦、天數智芯都公布過AI訓練及推理芯片,但是AI芯片生態尚未有效建立,和Nvidia CUDA生態對比,還有不少短板。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    27177

    瀏覽量

    264948
收藏 人收藏

    評論

    相關推薦

    AI芯片哪里買?

    AI芯片
    芯廣場
    發布于 :2024年05月31日 16:58:19

    STM CUBE AI錯誤導入onnx模型報錯的原因?

    使用cube-AI分析模型時報錯,該模型是pytorch的cnn轉化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.
    發表于 05-27 07:15

    英偉達首席執行官黃仁勛:AI模型推動英偉達AI芯片需求

    近來,以ChatGPT為代表的AI聊天機器人已經導致英偉達AI芯片供應緊張。然而,隨著能夠創造視頻并進行近似人類交流的新型AI模型問世,英偉
    的頭像 發表于 05-24 10:04 ?214次閱讀

    risc-v多核芯片AI方面的應用

    RISC-V多核芯片AI方面的應用主要體現在其低功耗、低成本、靈活可擴展以及能夠更好地適應AI算法的不同需求等特點上。 首先,RISC-V適合用于高效設計實現,其內核面積更小,功耗更
    發表于 04-28 09:20

    防止AI模型被黑客病毒入侵控制(原創)聆思大模型AI開發套件評測4

    ,應用場景和安全需求會有所不同。我會幫助客戶構建安全的 AI模型。上面的只是一些基本的安全措施,在實際中我可以利用eFPGA芯片對上述的功能進行加速,下面我編寫一個加速代碼: //
    發表于 03-19 11:18

    AI模型遠程控制啟動車輛(原創)

    AI模型
    還沒吃飯
    發布于 :2024年03月18日 15:18:29

    使用cube-AI分析模型時報錯的原因有哪些?

    使用cube-AI分析模型時報錯,該模型是pytorch的cnn轉化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.
    發表于 03-14 07:09

    臺積電:AI芯片先進封裝需求強勁,供不應求將持續至2025年

    近日,臺積電在法人說明會上表示,由于人工智能(AI芯片先進封裝需求持續強勁,目前產能無法滿足客戶的需求,供不應求的狀況可能延續到2025年
    的頭像 發表于 01-22 15:59 ?471次閱讀

    AI模型可以取代大學教育嗎?

    AI模型
    電子發燒友網官方
    發布于 :2024年01月02日 16:27:52

    AI模型怎么解決芯片過剩?

    AI模型
    電子發燒友網官方
    發布于 :2024年01月02日 15:42:05

    AI模型會不會取代電子工程師?

    AI模型
    電子發燒友網官方
    發布于 :2024年01月02日 15:11:43

    AI模型可以設計電路嗎?

    AI模型
    電子發燒友網官方
    發布于 :2024年01月02日 15:09:29

    #芯片 #AI 世界最強AI芯片H200性能大揭秘!

    芯片AI
    深圳市浮思特科技有限公司
    發布于 :2023年11月15日 15:54:37

    【KV260視覺入門套件試用體驗】Vitis AI 構建開發環境,并使用inspector檢查模型

    FFT運算(Vivado) 四、硬件加速之—使用PL加速矩陣乘法運算(Vitis HLS) 五、Vitis AI 構建開發環境,并使用inspector檢查模型 六、Vitis AI 進行模型
    發表于 10-14 15:34

    盤古ai模型用的什么芯片?

    盤古ai模型用的什么芯片? 盤古AI模型是一種基于深度學習算法的人工智能技術,它是由中國互聯
    的頭像 發表于 08-31 09:01 ?2730次閱讀
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>