<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

浪潮信息劉軍:智算力系統創新 加速生成式AI產業發展

全球TMT ? 來源:全球TMT ? 作者:全球TMT ? 2023-12-06 14:08 ? 次閱讀

北京2023年12月6日/美通社/ --11月29日,在北京舉行的2023人工智能計算大會(AICC)上,浪潮信息高級副總裁劉軍在主題演講《智算力系統創新 加速生成式AI產業發展》中分享了浪潮信息對于智算力系統創新和AI產業發展的思考。

wKgZomVwD_WAbed4AADVM889aU0323.jpg


以下為演講實錄整理

當前,生成式人工智能和大模型推動算力需求高速增長,如何通過智算力系統來更好地支撐AI創新與應用,已經成為智算產業的關鍵。應對生成式AI的發展和挑戰,應該從算力系統、AI軟件基礎設施(AI Infra)、算法模型和產業生態4個方面來進行綜合考量,從而加速智能產業的落地。

智算系統創新,解決生成式AI的算力挑戰

在算力系統層面,生成式人工智能面臨的挑戰主要來自計算、數據和互聯三個方面:

在計算層面,算力多元化趨勢愈發明顯,導致AI算力系統開發適配周期長、定制開發投入大、業務遷移時間久。此外,大模型訓練對算力規模要求高,在單芯片算力有限的情況下,必須通過構建更大規模的集群來獲得性能的擴展。

在數據層面,大模型從文本、圖片等單模態向多模態、跨模態演進,訓練的數據集達到TB級甚至PB級,且不同作業階段對于數據存儲的要求呈現多元化趨勢。

在互聯層面,傳統RoCE網絡因ECMP哈希不均導致40%以上的網絡帶寬被浪費,且尾時延高導致網絡通信時間占比訓練時間高達40%,極大降低了計算效率。同時,網絡是集群共享資源,當集群規模達到一定量級后,網絡性能波動會影響到所有計算資源的利用率,網絡故障會影響數十個甚至更多加速卡的連通性。

面對三重挑戰,浪潮信息總結了多年產品研發和用戶服務經驗,提出三部分解決之道。

在計算方面,首先要針對多元算力,以統一的系統架構和統一的接口規范來兼容各類AI加速卡,保障芯片算力的高效釋放。浪潮信息早在2018年就著力開放多元的AI算力平臺設計,最新發布的G7多元算力平臺是業界唯一可以同時兼容SXM、OAI加速卡并實現8卡全互聯、16卡全互聯和混合立方互聯系統拓撲的AI算力平臺。為了保障更大規模的節點擴展性能,浪潮信息研制的開放加速計算架構支持PCIe、RocE和多種私有互聯協議,節點內和跨節點卡間互聯最大達到896 GB/s,跨節點通過免網卡RDMA實現高效擴展,集群性能加速比超過90%。

在數據存儲方面,針對大模型的數據存儲需求,浪潮信息在業界率先實現了一套集群系統同時支持文件、對象、大數據等多種非結構化協議的無損互訪,同時支持閃存、磁盤、磁帶、光盤四類存儲介質,并支持數據全生命周期熱、溫、冷、冰四級存儲管理,以一套存儲架構支持一個數據中心,真正實現了數據融合、管理融合。

在網絡互聯方面,浪潮信息專為生成式AI計算場景發布旗艦51.2T高性能交換機,為企業級智算網絡提供高吞吐、高可擴展、高可靠的智算網絡產品及方案,解決了傳統RoCE方案普遍存在的有效帶寬低、尾時延高、故障收斂慢等問題,將大模型訓練性能提升38%以上,性能接近InfiniBand,助力AI用戶高效釋放大模型生產力。

AI Infra全棧優化:釋放多元算力、提升大模型算力效率

大模型算法開發的鏈條冗長,這意味著需要諸多的工程化工具支撐。因此,在算力系統外,AI軟件基礎設施(AI Infra)也亟需創新。

AIGC大模型開發是一項極其復雜的系統工程,即便解決了底層算力供給的問題,仍面臨建不了和用不好的問題。"建不好"是指構建算力平臺不僅需要服務器、存儲、網絡等硬件集成,還需要考慮不同硬件和軟件之間的兼容性和版本選擇,確保驅動和工具的適配性和穩定性;"用不好"則體現在算力平臺效率低、穩定性不足、故障頻發等現實困擾。

為加速模型生產和落地應用,浪潮信息在AI Infra層面開發了大模型智算軟件棧OGAI (Open GenAI Infra)。在算力部署方面,OGAI開源了業界首個AI算力集群系統環境部署方案PODsys;在大規模訓練的長時保障方面,從算力調度平臺層實現了自動化斷點續訓;在多元算力接入方面以標準化、模塊化接入方式穩定接入超過40+芯片;在數據治理方面構建了流程化、可自定義的數據清洗pipeline,有效縮短數據清洗時間、提升文本審核過濾準確率;在計算效率優化方面,通過對分布式并行算法的極致優化,將千億參數模型的訓練計算效率提升到54%;在多模型管理方面已經支持了超過10個業界主流的開源大模型和元腦生態大模型,用實踐證明AI Infra全?;A軟件和工作流的創新是多元算力高效釋放、提升大模型算力效率的關鍵。

wKgaomVwD_WAefIEAACLCtTuxXI341.jpg


基礎大模型,生成式AI落地發展的核心支撐

當前,大模型技術正在推動生成式人工智能產業迅猛發展,而基礎大模型的關鍵能力則是大模型在行業和應用落地時能力表現的核心支撐。但是,基礎大模型在持續進化的過程中,依然面臨著數據、算法、算力等關鍵因素的挑戰與制約。

目前,受政策支持、算力水平提升、數據資源龐大以及科研實力增強等利好因素的推動,中國在基礎大模型方面取得一定成績,但仍需加大在基礎性技術方面的原創性突破,夯實底層模型和算法能力。

浪潮信息從實踐入手,加大模型結構創新、高質量數據準備、高效算力利用投入,并將這些技術運用在了"源2.0"大模型上,在編程、推理、邏輯等方面展示了先進的能力。

在算法方面,"源2.0"提出并采用了一種新型的注意力算法結構,有效提升了模型自然語言的表達能力與生成精度;在數據方面,"源2.0"在訓練數據來源、數據增強和合成方法等方面進行了全面創新,最終增強模型數理邏輯能力;在算力方面,"源2.0"采用非均勻流水并行+優化器參數并行+數據并行+ Loss計算分塊的策略,顯著降低大模型對于芯片間互聯帶寬的要求,讓模型訓練在"條件有限"的算力規模下實現高效率工作。

源2.0作為千億級基礎大模型,在業界公開的評測上進行了代碼生成、數學問題求解、事實問答方面的能力測試,展示了較為先進的能力表現。為了滿足不同行業、不同場景的能力要求,浪潮信息全面開源"源2.0"全系列大模型,以最便捷的方式支持用戶建設自己的智能化產品與能力,結合行業特點進行框架、模型、數據的垂直整合,提升基礎大模型的準確性和可用性。

生態聚進,聯合創新,加速AI應用落地

有了強大的基礎大模型,還需要進一步深入應用場景。將大模型的能力賦能到產業環節之中,需要多廠商的深度配合。面對生態復雜離散、產業AI落地困難的挑戰,浪潮信息提出元腦生態,聚合優質伙伴協同創新,通過"技術支持、方案聯合、平臺共享"實現不同廠商之間的優勢互補。

目前,元腦生態以浪潮信息的AI算力平臺、AI資源平臺和AI算法平臺為支撐,已經對接40多家芯片廠商,400+算法廠商,4000+系統集成商,通過多元的算力供給、全棧的AI Infra軟件棧、豐富的大模型經驗,實現"百模"與"千行"的對接,助力千行百業加速生成式AI 產業創新,高效釋放生產力。

wKgZomVwD_aAfwb3AAC6aEemKOQ326.jpg


智算力是創新力,AIGC與數字經濟、實體經濟的深度融合,將會創造出更多顛覆性的社會價值、經濟價值,而浪潮信息將秉持開放、共享、共建的發展理念,抓住AIGC市場機遇,共同推進人工智能落地。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    26668

    瀏覽量

    264330
  • 人工智能
    +關注

    關注

    1777

    文章

    44197

    瀏覽量

    231079
  • 數字經濟
    +關注

    關注

    2

    文章

    994

    瀏覽量

    18043
  • 算力
    +關注

    關注

    1

    文章

    675

    瀏覽量

    14390
  • AIGC
    +關注

    關注

    1

    文章

    269

    瀏覽量

    977
收藏 人收藏

    評論

    相關推薦

    浪潮信息發布企業大模型開發平臺&quot;元腦企智&quot;EPAI,加速AI創新落地

    北京2024年4月18日?/美通社/ -- 4月17日,在2024浪潮信息生態伙伴大會(IPF2024)上,浪潮信息發布企業大模型開發平臺"元腦企智"EPAI(Enterprise Platform
    的頭像 發表于 04-18 21:21 ?160次閱讀
    <b class='flag-5'>浪潮信息</b>發布企業大模型開發平臺&quot;元腦企智&quot;EPAI,<b class='flag-5'>加速</b><b class='flag-5'>AI</b><b class='flag-5'>創新</b>落地

    浪潮信息IPF24: 發展人工智能+,創新需要激發活力、拓展路徑、加速落地

    路徑、加速創新落地,推動人工智能成為百行千業的生產力。 ? 發展人工智能+ 要圍繞活力、路徑、落地開展創新 移動應用發達、數據資源豐富、應用場景多元、人工智能
    的頭像 發表于 04-18 21:19 ?130次閱讀
    <b class='flag-5'>浪潮信息</b>IPF24: <b class='flag-5'>發展</b>人工智能+,<b class='flag-5'>創新</b>需要激發活力、拓展路徑、<b class='flag-5'>加速</b>落地

    浪潮信息發布企業大模型開發平臺“元腦企智”EPAI

    4月17日,在2024浪潮信息生態伙伴大會(IPF2024)上,浪潮信息重磅發布企業大模型開發平臺“元腦企智”EPAI(Enterprise Platform of AI),為企業AI
    的頭像 發表于 04-18 10:12 ?145次閱讀
    <b class='flag-5'>浪潮信息</b>發布企業大模型開發平臺“元腦企智”EPAI

    浪潮信息生態伙伴大會IPF2024:發展人工智能+,加速創新落地

    4月17日,浪潮信息在北京舉辦的生態伙伴大會IPF2024上提出,發展人工智能+,要堅持“以應用為導向,以系統為核心”,著重激發創新活力、拓展創新
    的頭像 發表于 04-18 09:12 ?286次閱讀

    2024 信心滿滿!19家元腦生態伙伴與浪潮信息簽署億元分銷協議

    協議。 擁抱大模型AIGC風口,分銷業務變中求進 當前,生成式人工智能和大模型推動算力需求高速增長,如何通過智算力系統創新來更好地支撐AI創新
    的頭像 發表于 12-08 18:18 ?407次閱讀

    浪潮信息澎湃認證:浪潮信息集中式存儲攜手儀電云i-stack云操作系統軟件完成兼容性認證

    AS/HF系列產品完全兼容,滿足功能需求,系統運行可靠穩定,性能表現優異。 浪潮信息澎湃技術認證 是浪潮信息基于自身多元、創新的通用計算平臺,與供應鏈及軟件服務等生態合作伙伴共同構建的
    的頭像 發表于 12-08 16:40 ?346次閱讀
    <b class='flag-5'>浪潮信息</b>澎湃認證:<b class='flag-5'>浪潮信息</b>集中式存儲攜手儀電云i-stack云操作<b class='flag-5'>系統</b>軟件完成兼容性認證

    數聚AI ? 智慧未來 | 浪潮信息存儲助力企業基于大模型實現數字化創新

    ,更好地幫助企業實現數字化創新? 11月29日,由DOIT傳媒舉辦的“數智創新 · AI未來”—2023中國數據與存儲峰會在北京成功舉辦,浪潮信息存儲產品線副總經理劉希猛和分布式存儲總
    的頭像 發表于 11-30 16:25 ?230次閱讀
    數聚<b class='flag-5'>AI</b> ? 智慧未來 | <b class='flag-5'>浪潮信息</b>存儲助力企業基于大模型實現數字化<b class='flag-5'>創新</b>

    浪潮信息澎湃認證:浪潮信息集中式存儲攜手達夢數據庫管理系統V8完成兼容性認證

    ,滿足功能需求,系統運行可靠穩定,性能表現優異。 浪潮信息澎湃技術認證 是浪潮信息基于自身多元、創新的通用計算平臺,與供應鏈及軟件服務等生態合作伙伴共同構建的產品兼容性認證體系,包含“
    的頭像 發表于 09-27 17:10 ?388次閱讀
    <b class='flag-5'>浪潮信息</b>澎湃認證:<b class='flag-5'>浪潮信息</b>集中式存儲攜手達夢數據庫管理<b class='flag-5'>系統</b>V8完成兼容性認證

    英碼科技精彩亮相火爆的IOTE 2023,多面賦能AIoT產業發展!

    產品,包括覆蓋多層次力的智能工作站(邊緣計算盒子)、AI加速卡等;同時向大家展示自研的AI技術服務——“深元”0代碼移植工具鏈和創新性的行
    發表于 09-25 10:03

    浪潮信息積極構建面向生成AI的綠色開放加速智算平臺

    ,在開放計算中國峰會OCP China Day 2023上,浪潮信息AI&HPC產品線高級產品經理Stephen Zhang就《開放加速規范AI服務器設計指南》進行了專題報告演講,分享
    的頭像 發表于 09-20 10:33 ?721次閱讀
    <b class='flag-5'>浪潮信息</b>積極構建面向<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>的綠色開放<b class='flag-5'>加速</b>智算平臺

    浪潮信息發布大模型智算軟件棧OGAI,為大模型創新打造高效生產力

    的全棧全流程的智算軟件棧。OGAI由浪潮信息基于大模型自身實踐與服務客戶的專業經驗而開發,旨在為大模型研發與應用創新全力打造高效生產力,加速生成A
    的頭像 發表于 08-28 08:08 ?394次閱讀

    浪潮信息聯合英特爾發布新一代AI服務器NF5698G7

    浪潮信息聯合英特爾發布面向生成AI領域創新開發的新一代AI服務器NF5698G7。該AI服務器
    的頭像 發表于 07-13 09:43 ?436次閱讀

    智慧有數 浪潮信息發布生成AI存儲解決方案

    與管理瓶頸,浪潮信息在"數智未來"AIGC數據應用創新論壇上,正式發布面向生成AI的存儲解決方案,該方案以極致融合、極致性能、極致節能,和熱溫冷冰四級數據全生命周期管理,助力開啟
    的頭像 發表于 07-11 09:46 ?269次閱讀

    智慧有數,浪潮信息發布生成AI存儲解決方案

    與管理瓶頸,7月6日,浪潮信息在“數智未來”AIGC數據應用創新論壇上,正式發布面向生成AI的存儲解決方案,該方案以極致融合、極致性能、極致節能,和熱溫冷冰四級數據全生命周期管理,助
    的頭像 發表于 07-07 20:45 ?276次閱讀

    浪潮信息智能業務生產創新平臺提升大模型算力平臺使用效率

    ”。此次獲獎,不僅體現了AIStation在大模型算力與業務支撐方面的領先性,也體現了產業對大模型算力平臺效率的高度關注。 提升大模型算力平臺使用效率 ? 當前,以大模型為代表的生成AI技術正在
    的頭像 發表于 07-03 11:15 ?668次閱讀
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>