<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

墨芯支持Byte MLPerf助力AI應用

墨芯人工智能 ? 來源:墨芯人工智能 ? 2023-09-07 11:37 ? 次閱讀

在大模型趨勢下,墨芯通過領先的稀疏計算優勢,助力企業加速AI應用,商業化進程接連取得重要突破。

近日,AI推理評測ByteMLPerf 公開了墨芯S30計算卡的評測結果。墨芯成為支持ByteMLPerf的供應商之一。

2405a79a-4d2f-11ee-a25d-92fbcf53809c.png

圖:墨芯是適配Byte MLPerf(推理)的供應商之一

243cc3a6-4d2f-11ee-a25d-92fbcf53809c.png

圖:Byte MLPerf基準套件介紹

Byte MlPerf 的評估會分為三個方面,如下:

1. Graph Compiler的易用性、擴展性以及覆蓋率;

2. 運行精度評估:包括數值誤差和模型跑數據集精度;

3. 運行性能評估:不同場景下的(一般指BS不同)的吞吐和延時表現。

墨芯產品與Byte MLPerf的成功適配,標志著墨芯的商業化進程邁出重要一步,再度印證了稀疏計算在推理性能、能效比等方面的多重優勢,展現出墨芯AI計算平臺在業務場景中的巨大應用價值。

性能突出

凸顯應用價值

24520fd6-4d2f-11ee-a25d-92fbcf53809c.png

圖:墨芯AI計算平臺在Byte MLPerf上的性能數據

基于墨芯獨創的雙稀疏算法與軟硬協同設計,墨芯AI計算平臺不僅支持Byte MLPerf 模型庫中的多個模型,而且以優秀的性能與高能效比,貼合實際業務場景的需求:

01

大幅降低TCO,助力企業降本增效

稀疏計算去除了AI計算中的無效元素,因而提升計算效率,墨芯S30計算卡的峰值功耗僅為 250W,意味著降低AI計算過程中的運營成本、基礎設施等成本,緩解算力昂貴等業界難題。

02

應用場景廣泛

墨芯AI計算平臺支持Byte MLPerf 模型庫中的計算機視覺、語音、自然語言處理等多類任務,適用于識別、檢測、推薦、AIGC等多種AI應用場景,助力企業拓寬AI業務布局。

軟硬協同平臺

快速賦能AI落地

墨芯基于性能領先的硬件產品與軟件平臺,為客戶提供企業級端到端的解決方案:墨芯SparseRT 軟件開發環境全面支持硬件產品,為快速開發提供了完整的可擴展平臺并激活稀疏計算的潛力。同時SparseRT 可以高效支持通用的AI編程框架,如TensorFlow、PyTorch、ONNX和MXNet等。用戶可以在熟悉的TensorFlow或PyTorch環境里進行開發之后再進行遷移與交付。

SparseRT獨特的SparseOPT為AI模型提供4至32倍的稀疏壓縮能力,并且易于集成到現有的模型交付流程中,從而充分釋放大模型的實時服務潛力。SparseRT提供可視化性能分析工具,支持離線和實時的模型性能分析,幫助開發人員分析模型中存在的瓶頸,并提供模型部署優化建議,使開發人員能將墨芯的軟硬件解決方案幾乎零成本集成到現有的基礎設施和算法交付中。

248c7180-4d2f-11ee-a25d-92fbcf53809c.png

圖 / 墨芯軟硬協同AI計算平臺

墨芯將持續與客戶緊密協作,共同探索更多AI應用場景,以創新的AI計算平臺與服務,為各行業的智能化升級創造更多價值。






審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 加速器
    +關注

    關注

    2

    文章

    758

    瀏覽量

    36654
  • 人工智能
    +關注

    關注

    1779

    文章

    44244

    瀏覽量

    231122

原文標題:墨芯支持Byte MLPerf,稀疏計算助力AI應用

文章出處:【微信號:墨芯人工智能,微信公眾號:墨芯人工智能】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AI快訊:華為助力金融行業加速擁抱AI 馬斯克xAI 展示首個多模態模型

    AI快訊:華為助力金融行業加速擁抱AI 馬斯克xAI 展示首個多模態模型 小編給大家匯總一下近期的AI資訊。 華為助力金融行業加速擁抱
    發表于 04-15 12:32 ?133次閱讀

    AI時代怎么樣不被淘汰?訊飛AI鼠標助力你在AI時代成長

    AI時代怎么樣不被淘汰?訊飛AI鼠標助力你在AI時代成長 隨著人工智能的發展,AI時代已經悄然而至。在這個時代,不會使用
    的頭像 發表于 03-23 11:41 ?415次閱讀
    <b class='flag-5'>AI</b>時代怎么樣不被淘汰?訊飛<b class='flag-5'>AI</b>鼠標<b class='flag-5'>助力</b>你在<b class='flag-5'>AI</b>時代成長

    擴展包x-cube-ai能實現SVM支持向量機嗎?

    擴展包x-cube-ai能實現SVM支持向量機嘛
    發表于 03-22 07:26

    AI如何助力我們構建更智能的空間?利用AI構建智能空間的5種方式

    當下業界都聚焦于生成式 AI 如何推動未來變革,但我們也不妨回顧一下過去的一年,AI 如何助力我們構建更智能的空間。
    的頭像 發表于 01-24 18:19 ?786次閱讀

    智能影像躍升,由終端側AI助力

    利用出色的AI性能進一步提升智能手機的影像能力向來是驍龍的突出優勢。 第三代驍龍8移動平臺 ,將高性能AI注入整個平臺系統,為用戶帶來前所未有的AI影像體驗。 影像進階,AI
    的頭像 發表于 12-20 20:15 ?303次閱讀
    智能影像躍升,由終端側<b class='flag-5'>AI</b>來<b class='flag-5'>助力</b>

    byte屬于java基本類型嗎

    是的,byte屬于Java的基本數據類型之一。Java中共有8種基本數據類型,分別是byte、short、int、long、float、double、char和boolean。byte類型用于表示
    的頭像 發表于 12-05 10:40 ?382次閱讀

    【愛派 Pro 開發板試用體驗】篇一:開箱篇

    派 Pro (AXera-Pi Pro)M4N Dock 是一款集成了高算力、高能效 AI SOC 的開發板。它采用了愛 AX650N 作為主控芯片。AX650N 集成了 8 核 A55
    發表于 11-15 11:32

    基于紫光同創FPGA的多路視頻采集與AI輕量化加速的實時目標檢測系統

    基于紫光同創FPGA的多路視頻采集與AI輕量化加速的實時目標檢測系統#2023集創賽#紫光同創#小眼睛科技助力紫光同創高校生態建設@小眼睛科技 獲獎作品展示:華南理工大學+CR8_Pro隊
    發表于 11-02 17:51

    STM8S的配置字節Option Byte

    電子發燒友網站提供《STM8S的配置字節Option Byte.pdf》資料免費下載
    發表于 10-07 16:12 ?0次下載
    STM8S的配置字節Option <b class='flag-5'>Byte</b>

    NVIDIA AI Enterprise 4.0 推出,助力企業構建生產就緒的生成式 AI 為業務賦能

    時。NVIDIA 正在將專業知識投入到解決方案的開發過程中,助力企業實現這樣的飛躍。 推出 NVIDIA AI Enterprise 4.0 最新版? NVIDIA AI Enterprise?
    的頭像 發表于 09-19 20:20 ?415次閱讀
    NVIDIA <b class='flag-5'>AI</b> Enterprise 4.0 推出,<b class='flag-5'>助力</b>企業構建生產就緒的生成式 <b class='flag-5'>AI</b> 為業務賦能

    NVIDIA Grace Hopper超級芯片橫掃MLPerf推理基準測試

    Hopper超級芯片首次亮相 MLPerf 行業基準測試,其運行了所有數據中心推理測試,進一步擴大了NVIDIA H100 Tensor Core GPU的領先優勢。 ? 總體測試結果表明,NVIDIA AI
    發表于 09-13 09:45 ?175次閱讀
    NVIDIA Grace Hopper超級芯片橫掃<b class='flag-5'>MLPerf</b>推理基準測試

    最新MLPerf v3.1測試結果認證,Gaudi2在GPT-J模型上推理性能驚人

    英特爾產品在全新MLCommons AI推理性能測試中盡顯優勢 今日,MLCommons公布針對 60 億參數大語言模型及計算機視覺與自然語言處理模型GPT-J的 MLPerf推理v3.1 性能基準
    的頭像 發表于 09-12 17:54 ?257次閱讀
    最新<b class='flag-5'>MLPerf</b> v3.1測試結果認證,Gaudi2在GPT-J模型上推理性能驚人

    ai機器人打電話助力各行業

    機器人AI
    jf_86111705
    發布于 :2023年09月07日 18:20:45

    意法半導體助力嵌入式系統應用專業能力認證

    ST大學計劃-助力中國高校人才培養,分析了嵌入式人才需求的痛點,介紹了ST助力嵌入式人才生態、項目發起及支持、嵌入式人才認證計劃等。
    發表于 09-05 07:57

    新的 MLPerf 推理網絡部分展現 NVIDIA InfiniBand 網絡和 GPUDirect RDMA 的強大能力

    MLPerf Inference v3.0?中,NVIDIA 首次將網絡納入了 MLPerf 的評測項目,成為了 MLPerf 推理數據中心套件的一部分。網絡評測部分旨在模擬在真實的數據中心
    的頭像 發表于 07-19 19:10 ?675次閱讀
    新的 <b class='flag-5'>MLPerf</b> 推理網絡部分展現 NVIDIA InfiniBand 網絡和 GPUDirect RDMA 的強大能力
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>