<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI終端時代:端側算力快速提升,AI芯片競爭進入新的階段

Monika觀察 ? 來源:電子發燒友網 ? 作者:莫婷婷 ? 2024-04-22 07:49 ? 次閱讀
電子發燒友網報道(文/莫婷婷)全球終端市場在經歷了高峰之后,在2022年、2023年出現明顯的終端市場下滑。進入2024年,全球終端市場又迎來了小幅反彈,AI技術的加持是市場反彈的動力之一。毫不夸張地說,是AI重新點燃了終端市場。

2023年被認為是AI終端的元年,那么進入2024年,AI終端市場會迎來哪些發展機會,上游的芯片環節,AI芯片有哪些最新解決方案。

AI終端成為交互入口,首款AI PC個人智能體已經面世

為什么AI算力會轉移到終端側?IDC中國及全球副總裁王吉平提到了四大方面的原因。

一是芯片廠商技術革命,未來是在混合算力的基礎上,端側算力未來會快速提升。二是模型正在不斷演變,例如混合專家模型(MoE)正受到業內人士的關注。三是人們越來越關注安全性,端側模型對于個人安全隱私,以及端之間互聯互通的安全性有很好地保護。四是大模型開始垂直化整合,垂直領域端+小模型的需求也在提升,王吉平認為小模型和小終端之間也可以非常完美地匹配。

目前,在終端產品中,PC、智能家居、車載設備、智能手機、智能手表、耳機,甚至是AR/VR等設備都能得到AI技術的加持。

可以預測到,隨著場景化發展,不同場景下的終端分工更加細致和專業,AI技術將加速終端未來十年新一輪的融合。

目前,手機廠商已經打造了各自的AI大模型,將其賦能至智能手機中,例如華為小藝語音助手用到了盤古大模型,小米小愛同學用的是小米AI大模型MiLM-6B等等。

在AI PC方面,已經從普通的AI PC走向了AI PC智能體,例如聯想于4月18日發布的業內首款AI PC個人智能體——聯想小天,具備文生圖的功能,還能實現圖像訓練和深度編輯。
圖源:聯想

在AI機器人方面,傳音旗下創新科技品牌TECNO在MWC24上,展示了公司首款AI增強型仿生四足機器人Dynamic 1,能夠用于智能助手、教育培訓等場景。

AI終端在發展過程中,大模型(LLM)向智能體(Agent)轉變,最終形成一個完整的閉環。那么,未來AI終端會朝著哪些方向發展呢?業內人士普遍認為,未來AI終端將成為個人AI助理,IDC認為將具備以下五大特征:

一是成為第一交互入口。此外,當國內的推理芯片搭載在各個終端后,會形成國內生態的智能體應用于各個行業中。二是終端將標配本地混合AI算力,例如CPU/NPU/GPU等;隨之,形成個人終端和個人邊緣協同計算結構。三是終端內嵌個人大模型,形成個性化本地知識庫。四是必須會有個人數據和隱私安全保護。五是有一個連接開放的AI應用生態,同時它要開發API接口。



AI芯片進入新的競爭階段,英偉達、英特爾、高通攻克推理性能
在技術底層,AI終端的發展離不開AI芯片。隨著AI大模型在終端進行規?;瘮U張,部署端側算力顯得尤為重要。英特爾CEO帕特·基辛格曾表示在人工智能領域,推理技術變得越來越重要,甚至比訓練還更加重要。

IDC中國及全球副總裁王吉平也預測了大語言模型端側芯片的發展趨勢,他認為XPU模式會推動端側模型推理能力明顯提升。
圖源:電子發燒友網攝

目前,在AI芯片領域,英偉達、英特爾、AMD等是國際主流玩家。在近兩年,國內的推理芯片廠商也逐漸進入業內視野中,例如阿里平頭哥、寒武紀、燧原科技、云天勵飛等,隨著技術的迭代,上述國產芯片廠商的AI芯片性能也在不斷提升。

AI芯片領域的競爭進入了新的階段。目前,英特爾、英偉達、高通都推出了各自面向AI推理的芯片。

就在美國時間4月9日,英特爾發布了新一代AI芯片Gaudi 3,可對標英偉達H100。Gaudi 3采用5nm工藝制造,具有64個第五代張量處理核心、8個矩陣計算引擎,24個200 Gbps以太網 RDMA NIC,以太網的通用標準能連接數萬個加速器,最高 16 條 PCIe 5.0 總線。與Gaudi 2相比,Gaudi 3的FP8吞吐量達到1835 TFLOPS,BF16性能提升四倍,網絡帶寬提升兩倍,內存帶寬提升1.5倍。

英偉達H100芯片是在2023年發布的產品,采用4nm工藝,搭載了最新Hopper架構,集成Transformer引擎、第四代TensorCore、第四代張量內核等技術。支持PCle Gen5和利用HBM3,憶體頻寬達到3TB/s,FP8 算力與A100相比提升了3倍,達4000TFLOPS。

在今年3月的英偉達GTC人工智能大會,英偉達還發布了Blackwell B200 GPU,有著2080億個晶體管,H100的FP4性能為4 petaflops,而B200 能提供高達20 petaflops FP4的算力。兩個B200與單個英偉達Grace CPU相連,打造出GB200 Grace Blackwell超級芯片。

在AI芯片新的競爭階段,廠商都更加重視芯片的推理能力,從英特爾和英偉達的新品正好說明了這一點。英特爾Gaudi系列面向AI應用場景,其推理能力也在不斷提升,Gaudi 3的模型訓練速度提升40%,推理速度則提升50%。

英偉達介紹,H100采用了新的Transformer Engine專門用于加速Transformer 模型的訓練和推理,在進行語言模型的訓練和推理時,訓練速度是A100的9倍,推理速度是A100的30倍。Blackwell GPU更是能提供30倍的推理性能,AI訓練和大模型實時推理的規模擴展到10萬億參數。

高通也在2023年10月發布驍龍 X Elite,這是一款面向 Windows 11 PC 的旗艦 PC 芯片,集成了Oryon?CPU、Adreno?GPU、Hexagon?NPU,支持在端側運行超過 130 億參數的生成式 AI 模型。

在當時的發布會上,高通透露搭載驍龍 X Elite 芯片的筆記本電腦在今年中期面世。近期已有消息顯示,聯想 YOGA Slim 7 14 2024 驍龍版,以及一款命名為ThinkPad T14s Gen 6 驍龍版的筆記本或將搭載高通驍龍X Elite 芯片。高通驍龍X Elite 芯片會給聯想AI PC帶來哪些AI性能,值得期待。

而英偉達的H100已經應用在其超級計算機Eos中,總共搭載了4608個H100 GPU,還有1,152個英特爾至強Platinum 8480C處理器。Eos被認為是英偉達速度最快的人工智能超級計算機,可用于人工智能和高性能計算工作負載。

每一代AI芯片的推出,都有它各自的應用定位。從終端市場來看,AI技術已經從手機、PC滲透進更多終端產品,未來會走向高性能PC、工作站等,不管是面向TO C,還是TO B的行業場景(服務業、制造業等),所需要的算力將隨著應用需求逐步提升,也會提高推理芯片的要求。未來推理芯片在AI終端會迎來怎么樣的發展,又會提升哪些應用體驗,值得期待。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    26716

    瀏覽量

    264367
  • AI芯片
    +關注

    關注

    17

    文章

    1687

    瀏覽量

    34469
  • 算力
    +關注

    關注

    1

    文章

    680

    瀏覽量

    14394
  • AI PC
    +關注

    關注

    0

    文章

    99

    瀏覽量

    47
收藏 人收藏

    評論

    相關推薦

    risc-v多核芯片AI方面的應用

    得RISC-V多核芯片能夠更好地適應AI算法的不同需求,包括深度學習、神經網絡等,從而提高芯片的性能和效率,降低成本,使AI邊緣計算晶片更具競爭力
    發表于 04-28 09:20

    開發者手機 AI - 目標識別 demo

    Lite的API接口實現主要功能; Mindspore Lite為Openharmony AI推理框架,為上層應用提供統一的AI推理接口,可以完成在手機等設備中的模型推理過程;
    發表于 04-11 16:14

    解鎖AI時代的利器——訊飛AI鼠標AM30助你在AI時代脫穎

    解鎖AI時代的利器——訊飛AI鼠標AM30助你在AI時代脫穎而出 隨著AI
    的頭像 發表于 03-25 13:37 ?183次閱讀
    解鎖<b class='flag-5'>AI</b><b class='flag-5'>時代</b>的利器——訊飛<b class='flag-5'>AI</b>鼠標AM30助你在<b class='flag-5'>AI</b><b class='flag-5'>時代</b>脫穎

    不會用AI的人被淘汰?訊飛AI鼠標AM30助你迎接AI時代

    不會用AI的人被淘汰?訊飛智能鼠標助你迎接AI時代 隨著AI時代的到來,人們對于智能助手的需求也日益增長。 想在這個
    的頭像 發表于 03-23 13:44 ?468次閱讀
    不會用<b class='flag-5'>AI</b>的人被淘汰?訊飛<b class='flag-5'>AI</b>鼠標AM30助你迎接<b class='flag-5'>AI</b><b class='flag-5'>時代</b>

    AI時代怎么樣不被淘汰?訊飛AI鼠標助力你在AI時代成長

    AI時代怎么樣不被淘汰?訊飛AI鼠標助力你在AI時代成長 隨著人工智能的發展,AI
    的頭像 發表于 03-23 11:41 ?415次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>時代</b>怎么樣不被淘汰?訊飛<b class='flag-5'>AI</b>鼠標助力你在<b class='flag-5'>AI</b><b class='flag-5'>時代</b>成長

    英偉達將用AI設計AI芯片

    AI芯片行業資訊
    深圳市浮思特科技有限公司
    發布于 :2024年02月19日 17:54:43

    智能影像躍升,由終端AI來助力

    利用出色的AI性能進一步提升智能手機的影像能力向來是驍龍的突出優勢。 第三代驍龍8移動平臺 ,將高性能AI注入整個平臺系統,為用戶帶來前所未有的AI影像體驗。 影像進階,
    的頭像 發表于 12-20 20:15 ?303次閱讀
    智能影像躍升,由<b class='flag-5'>終端</b>側<b class='flag-5'>AI</b>來助力

    2024年中國AI終端占比將達55%

    AI終端是指在終端設備中集成處理器的AI引擎。IDC認為,隨著終端算力的提升
    的頭像 發表于 12-08 17:27 ?748次閱讀

    異構專用AI芯片的黃金時代

    異構專用AI芯片的黃金時代
    的頭像 發表于 12-04 16:42 ?315次閱讀
    異構專用<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>的黃金<b class='flag-5'>時代</b>

    強勁的AI邊緣計算盒子# 邊緣計算

    AI邊緣計算
    成都華江信息
    發布于 :2023年11月24日 16:31:06

    #芯片 #AI 世界最強AI芯片H200性能大揭秘!

    芯片AI
    深圳市浮思特科技有限公司
    發布于 :2023年11月15日 15:54:37

    英碼科技精彩亮相火爆的IOTE 2023,多面賦能AIoT產業發展!

    產品,包括覆蓋多層次的智能工作站(邊緣計算盒子)、AI加速卡等;同時向大家展示自研的AI技術服務——“深元”0代碼移植工具鏈和創新性的行業解決方案,賦能更多AIoT產業生態企業
    發表于 09-25 10:03

    AI智能呼叫中心

    智能呼叫中心通過深度學習和大數據分析,能夠準確識別、分析和記錄用戶的個人信息、歷史記錄和偏好,從而為用戶提供更加個性化的服務。例如,在用戶撥打電話進入呼叫中心時,AI智能呼叫中心可自動彈出用戶的個人資料
    發表于 09-20 17:53

    阿里平頭哥發布首個 RISC-V AI 軟硬全棧平臺

    平臺通過軟硬件深度協同,較經典方案提升超 8 成性能,支持運行 170 余個主流 AI 模型,推動 RISC-V 進入高性能 AI 應用時代
    發表于 08-26 14:14

    AI芯片的誕生和發展背景 AI芯片發展的技術方向 AI芯片的發展趨勢

    高算力需求正催生AI芯片快速迭代,“無芯片,不AI”,以AI
    發表于 08-16 10:11 ?2595次閱讀
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>