<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

浪潮信息發布為大模型專門優化的分布式全閃存儲AS13000G7-N系列

浪潮存儲 ? 來源:浪潮存儲 ? 2024-05-08 09:38 ? 次閱讀

近日,浪潮信息發布為大模型專門優化的分布式全閃存儲AS13000G7-N系列。該系列依托浪潮信息自研分布式文件系統,搭載新一代數據加速引擎DataTurbo,通過盤控協同、GPU直訪存儲、全局一致性緩存等技術為AI大模型數據歸集、訓練、數據歸檔與管理等階段提供強大存儲支撐能力,助力用戶加速大模型系統的創新及應用落地。

化解大模型時代的存儲挑戰

構建堅實的數據存儲底座

大模型已經成為驅動數字經濟深度創新、引領企業業務變革、加速形成新質生產力的重要動能,隨著大模型參數量和數據量的極速膨脹,多源異構數據的傳、用、管、存,正在成為制約生成式AI落地的瓶頸之一,用戶亟需構建更加高效的存儲底座。在數據準備階段,在規模大、來源廣泛、格式多樣的原始數據中,篩選和清洗出利用于訓練的高質量數據常會耗費大量時間;在模型訓練階段,海量小文件數據加載、Checkpoint數據調用對IO處理效率提出嚴苛要求;模型訓練之后,多個數據資源池無法互通、海量冷數據歸檔帶來較高的數據管理復雜度。

作為率先在業界提出分布式融合存儲的廠商,浪潮信息聚焦行業客戶的大模型落地需求與核心痛點,基于NVMe SSD研發出高效適配和優化的分布式全閃存儲AS13000G7-N系列。硬件方面,AS13000G7-N是一款2U24盤位的全閃存儲機型,搭載英特爾至強第四、第五代可擴展處理器,支持400 Gb 網卡,同時每盤位可配置15.36TB 大容量NVMe SSD。軟件方面,通過集群控制服務將N個節點聯成一套具有高擴展性的文件系統;通過分布式元數據服務提升海量小文件讀寫性能;通過數控分離架構,實現東西向網絡優化,降低IO訪問時延,提升單節點帶寬。在軟硬件協同創新下,AS13000G7-N充分滿足大模型應用在存儲性能和存儲容量方面的嚴苛需求。

1a34deda-0c6e-11ef-a297-92fbcf53809c.jpg

具體來說,在數據準備階段,通過多協議融合互通技術,面對多份、多種協議的數據,存儲底層僅保留一份數據,實現數據共享免搬遷;在模型訓練階段,通過大小IO智能識別和緩存預讀技術快速保存和恢復checkpoint(檢查點)文件,實現TB級訓練數據Checkpoint讀取耗時從10分鐘縮短至10秒內,大幅提升訓練過程中數據加載速度;RDMA/RoCE網絡連接技術和數控分離架構的設計,實現東西向數據免轉發,極限發揮大模型訓練中硬件網絡帶寬性能;基于盤控協同架構,網絡數據直通NVMe SSD,進一步提升單盤帶寬;在數據歸檔與管理階段,AS13000G7-N提供了多元異構存儲的統一納管能力,保障數據資產高效存儲與管理,大幅提升存儲資源的利用率且最大化數據基礎設施投資回報比。

DataTurbo數據加速引擎

全力保障大模型高效訓練

在大模型的數據應用全流程中,要想使訓練效率達到極致,減少不必要的資源浪費,訓練階段的數據讀寫性能成為重中之重。而想要提升算力利用率、降低模型訓練成本,必須要在數據存儲性能上進行創新。

AS13000G7-N系列具備強大的端到端性能優化能力,這也是模型訓練階段最為核心的考量因素。浪潮信息基于計算和存儲協同的理念,依托自研分布式文件系統構建了新一代數據加速引擎DataTurbo,在緩存優化、空間均衡、縮短GPU與存儲讀取路徑等方面進行了全面升級?!?/p>

■ 智能緩存優化,保障大模型訓練速度與質量

AS13000G7-N能夠通過對大小IO的智能識別,進行分類治理,小文件采取聚合的操作,大文件采取切片的操作,所有數據以大小均衡的模式保存到全局緩存中,實現小文件性能提升5倍,大文件性能提升10倍。在模型訓練中斷后,從Checkpoint恢復數據過程中,AS13000G7-N通過緩存預讀技術,提前識別數據的冷熱程度,加速了重復樣本數據的讀取,訓練加載速度提升10倍。無論是讀操作還是寫操作,AS13000G7-N采取了字節級(Byte)分布式鎖機制,粒度是主流并行文件系統鎖機制粒度的幾十分之一,確保多個節點訪問共享資源時能夠安全、有序地進行操作,從而保持訓練數據的強一致性和訓練質量。

■ 智能空間均衡,高水位下性能無衰減

AS13000G7-N搭載了浪潮信息自主研發的分布式并行客戶端技術,相比通用私有客戶端,卸載了獨立的元數據,實現了元數據和數據節點的高效統一部署,有效提升存儲的并發能力,充分利用訓練節點網卡的帶寬,讓GPU算力得到完全釋放。同時在存儲端,相較于業界主流的文件系統需要在磁盤之上構筑一層文件協議,AS13000G7-N能夠直接對裸盤的空間進行均衡排布,并在管理層面設計了智能空間預分技術,能夠結合用戶前端算力節點數量、訓練模型的數量,對存儲空間分配進一步進行智能策略預埋。這套組合拳能夠使AS13000G7-N在空間利用率達到95%高水位時,依然可以平穩輸出強大的性能。在模型訓練的空間損耗上,AS13000G7-N相較傳統方案,將損耗率降低了85%左右,充分保護了客戶在大模型存儲上的投資。

■ GPU直通存儲,服務萬億參數大模型

當大模型參數在百億級別,GPU對存儲資源的調用效率往往差別不大。但隨著大模型從單模態走向多模態,數據量指數型增長,訓練效率隨之要求更高。從數據層面來看,AS13000G7-N具備和GPU直通的能力,數據流不經過客戶端緩存,直接到達存儲底層文件系統,縮短GPU與存儲的讀取路徑,這項技術能夠使存儲讀寫帶寬翻倍,大模型訓練加載時間縮短50%。隨著萬卡萬億參數模型時代的到來,GPU直通存儲高效提升數據讀寫訪問的能力將是大模型訓練的標配。

通過上述技術創新,分布式全閃存儲AS13000G7-N憑借領先的性能和管理優勢,能夠幫助用戶加速大模型的數據歸集、提升模型訓練效率、簡化海量異構數據的管理,從而推動業務智能化變革。浪潮信息將借助AS13000G7-N等存儲產品,與合作伙伴加快在場景化方案定制、市場拓展等方面的創新,助力用戶構筑人工智能時代最佳數據存儲底座。



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    18339

    瀏覽量

    222532
  • gpu
    gpu
    +關注

    關注

    27

    文章

    4431

    瀏覽量

    126797
  • SSD
    SSD
    +關注

    關注

    20

    文章

    2700

    瀏覽量

    115588
  • 大模型
    +關注

    關注

    2

    文章

    1583

    瀏覽量

    1178

原文標題:為大模型專門優化!浪潮信息發布分布式全閃存儲AS13000G7-N系列

文章出處:【微信號:inspurstorage,微信公眾號:浪潮存儲】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    一圖讀懂浪潮信息新一代分布式閃存儲AS13000G7-N系列

    一圖讀懂浪潮信息新一代分布式閃存儲AS13000G7-N系列
    的頭像 發表于 05-08 09:35 ?107次閱讀
    一圖讀懂<b class='flag-5'>浪潮信息</b>新一代<b class='flag-5'>分布式</b>全<b class='flag-5'>閃存儲</b><b class='flag-5'>AS13000G7-N</b><b class='flag-5'>系列</b>

    浪潮信息發布企業大模型開發平臺&quot;元腦企智&quot;EPAI,加速AI創新落地

    北京2024年4月18日?/美通社/ -- 4月17日,在2024浪潮信息生態伙伴大會(IPF2024)上,浪潮信息發布企業大模型開發平臺"元腦企智"EPAI(Enterprise P
    的頭像 發表于 04-18 21:21 ?153次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發布</b>企業大<b class='flag-5'>模型</b>開發平臺&quot;元腦企智&quot;EPAI,加速AI創新落地

    浪潮信息發布企業大模型開發平臺“元腦企智”EPAI

    4月17日,在2024浪潮信息生態伙伴大會(IPF2024)上,浪潮信息重磅發布企業大模型開發平臺“元腦企智”EPAI(Enterprise Platform of AI),為企業AI
    的頭像 發表于 04-18 10:12 ?123次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發布</b>企業大<b class='flag-5'>模型</b>開發平臺“元腦企智”EPAI

    浪潮信息與英特爾合作推出一種大模型效率工具“YuanChat”

    3月26日,浪潮信息與英特爾正式宣布,浪潮信息“源2.0系列基礎大模型”已和最新的英特爾? 酷睿? Ultra處理器平臺完成適配,本地推理速度提升100%。
    的頭像 發表于 03-27 13:50 ?214次閱讀
    <b class='flag-5'>浪潮信息</b>與英特爾合作推出一種大<b class='flag-5'>模型</b>效率工具“YuanChat”

    曙光存儲推出ParaStor分布式閃存儲

    曙光存儲推出ParaStor分布式閃存儲,攜業內首創技術XDS,以訓練加速、穩定性強、性價比高的獨特價值,全維度涵蓋網絡、計算和平臺,為千行百業的AI大模型開發者提供
    發表于 03-01 11:30 ?235次閱讀

    浪潮信息澎湃認證:浪潮信息集中式存儲攜手儀電云i-stack云操作系統軟件完成兼容性認證

    近日, 儀電云i-stack云操作系統軟件與浪潮信息集中式存儲AS/HF系列產品完成并通過浪潮信息澎湃技術相互兼容性測試認證, 測試結果顯示,儀電云i-stack云操作系統軟件與
    的頭像 發表于 12-08 16:40 ?339次閱讀
    <b class='flag-5'>浪潮信息</b>澎湃認證:<b class='flag-5'>浪潮信息</b>集中式<b class='flag-5'>存儲</b>攜手儀電云i-stack云操作系統軟件完成兼容性認證

    數聚AI ? 智慧未來 | 浪潮信息存儲助力企業基于大模型實現數字化創新

    ,更好地幫助企業實現數字化創新? 11月29日,由DOIT傳媒舉辦的“數智創新 · AI未來”—2023中國數據與存儲峰會在北京成功舉辦,浪潮信息存儲產品線副總經理劉希猛和分布式
    的頭像 發表于 11-30 16:25 ?229次閱讀
    數聚AI ? 智慧未來 | <b class='flag-5'>浪潮信息</b><b class='flag-5'>存儲</b>助力企業基于大<b class='flag-5'>模型</b>實現數字化創新

    浪潮信息發布源2.0基礎大模型,千億參數全面開源

    11月27日,浪潮信息發布"源2.0"基礎大模型,并宣布全面開源。源2.0基礎大模型包括1026億、518億、21億等三種參數規模的模型,在
    的頭像 發表于 11-28 09:10 ?478次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發布</b>源2.0基礎大<b class='flag-5'>模型</b>,千億參數全面開源

    浪潮信息澎湃認證:浪潮信息集中式存儲攜手達夢數據庫管理系統V8完成兼容性認證

    近日, 達夢數據庫管理系統V8與浪潮信息集中式存儲AS/HF系列產品完成并通過浪潮信息澎湃技術相互兼容性測試認證 ,測試結果顯示,達夢數據庫管理系統V8與
    的頭像 發表于 09-27 17:10 ?385次閱讀
    <b class='flag-5'>浪潮信息</b>澎湃認證:<b class='flag-5'>浪潮信息</b>集中式<b class='flag-5'>存儲</b>攜手達夢數據庫管理系統V8完成兼容性認證

    浪潮信息發布模型智算軟件棧OGAI,為大模型創新打造高效生產力

    浪潮信息正式發布模型智算軟件棧 OGAI。OGAI (Open GenAI Infra)"元腦生智",是為大模型業務提供AI算力系統環境部署、算力調度保障及
    的頭像 發表于 08-28 08:08 ?387次閱讀

    浪潮信息穩居中國全閃存儲市場前二

    15億元,市場占比25%,混閃存儲銷售額38億元,市場占比54%,相比全球全閃存儲市場份額41.3%的局面,中國全閃存儲市場還有很大發展空間。其中浪潮信息
    的頭像 發表于 08-08 12:55 ?754次閱讀

    浪潮信息穩居中國全閃存儲市場前二

    億元,市場占比54%,相比全球全閃存儲市場份額41.3%的局面,中國全閃存儲市場還有很大發展空間。其中浪潮信息閃存儲一季度銷售額和出貨量,位居中國前二,出貨量同比增長310%,領漲中
    的頭像 發表于 08-07 11:10 ?358次閱讀

    浪潮信息澎湃認證:浪潮分布式存儲攜手博雅云OneSRM SMP存儲管理平臺完成兼容性認證

    近日, 博雅云OneSRM SMP存儲管理平臺與浪潮分布式存儲AS13000系列產品完成并通過
    的頭像 發表于 07-12 09:15 ?389次閱讀
    <b class='flag-5'>浪潮信息</b>澎湃認證:<b class='flag-5'>浪潮</b><b class='flag-5'>分布式</b><b class='flag-5'>存儲</b>攜手博雅云OneSRM SMP<b class='flag-5'>存儲</b>管理平臺完成兼容性認證

    澎湃認證:浪潮攜手人大金倉KingbaseES V8完成兼容性認證

    日前, 人大金倉KingbaseES V8與浪潮分布式存儲AS13000平臺完成并通過浪潮信息澎湃技術相互兼容性測試認證 ,測試結果顯示,人
    的頭像 發表于 07-10 17:00 ?452次閱讀
    澎湃認證:<b class='flag-5'>浪潮</b>攜手人大金倉KingbaseES V8完成兼容性認證

    融合互通,浪潮分布式融合存儲AS13000加速海量數據處理

    智慧時代,數據量激增且非結構化數據的占比逐漸增大,數據類型愈發復雜,處理數據的方式更加多樣化,傳統單一存儲難以滿足市場需求?;诖?,浪潮推出了非結構化數據融合互通新平臺分布式融合存儲A
    的頭像 發表于 06-07 10:57 ?409次閱讀
    融合互通,<b class='flag-5'>浪潮</b><b class='flag-5'>分布式</b>融合<b class='flag-5'>存儲</b>AS<b class='flag-5'>13000</b>加速海量數據處理
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>