<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

浪潮信息發布源2.0基礎大模型,千億參數全面開源

全球TMT ? 來源:全球TMT ? 作者:全球TMT ? 2023-11-28 09:10 ? 次閱讀

11月27日,浪潮信息發布"源2.0"基礎大模型,并宣布全面開源。源2.0基礎大模型包括1026億、518億、21億等三種參數規模的模型,在編程、推理、邏輯等方面展示出了先進的能力。

當前,大模型技術正在推動生成式人工智能產業迅猛發展,而基礎大模型的關鍵能力則是大模型在行業和應用落地能力表現的核心支撐,但基礎大模型的發展也面臨著在算法、數據和算力等方面的諸多挑戰。源2.0基礎大模型則針對性地提出了新的改進方法并獲得了能力的提升。

算法方面,源2.0提出并采用了一種新型的注意力算法結構:局部注意力過濾增強機制(LFA:Localized Filtering-based Attention)。LFA通過先學習相鄰詞之間的關聯性,然后再計算全局關聯性的方法,能夠更好地學習到自然語言的局部和全局的語言特征,對于自然語言的關聯語義理解更準確、更人性,提升了模型的自然語言表達能力,進而提升了模型精度。

wKgZomVkrZuAFWGyAACX2OTQDsk961.jpg


數據方面,源2.0通過使用中英文書籍、百科、論文等高質量中英文資料,降低了互聯網語料內容占比,結合高效的數據清洗流程,為大模型訓練提供了高質量的專業數據集和邏輯推理數據集。為了獲取中文數學數據,我們清洗了從2018年至今約12PB的互聯網數據,但僅獲取到了約10GB的數學數據,投入巨大,收益較小。為了更高效地獲得相對匱乏的高質量中文數學及代碼數據集,源2.0采用了基于大模型的數據生產及過濾方法,在保證數據的多樣性的同時也在每一個類別上提升數據質量,獲取了一批高質量的數學與代碼預訓練數據。

wKgaomVkrZuAeYSmAADRtny3Qdk117.jpg


算力方面,源2.0采用了非均勻流水并行的方法,綜合運用流水線并行+優化器參數并行+數據并行的策略,讓模型在流水并行各階段的顯存占用量分布更均衡,避免出現顯存瓶頸導致的訓練效率降低的問題,該方法顯著降低了大模型對芯片間P2P帶寬的需求,為硬件差異較大訓練環境提供了一種高性能的訓練方法。

wKgaomVlP6mALQxWAAM0Ok9OLqE815.jpg


源2.0作為千億級基礎大模型,在業界公開的評測上進行了代碼生成、數學問題求解、事實問答方面的能力測試,測試結果顯示,源2.0在多項模型評測中,展示出了較為先進的能力表現。

wKgZomVkrZ6Af_R2AABvvDO94lM918.jpg


源2.0采用全面開源策略,全系列模型參數和代碼均可免費下載使用。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 半導體
    +關注

    關注

    328

    文章

    24805

    瀏覽量

    203762
  • 浪潮
    +關注

    關注

    1

    文章

    409

    瀏覽量

    23600
  • 大模型
    +關注

    關注

    2

    文章

    1665

    瀏覽量

    1281
收藏 人收藏

    評論

    相關推薦

    浪潮信息發布AS13000G7-N系列分布式全閃存儲

    浪潮信息近日推出了專為大型AI模型優化的AS13000G7-N系列分布式全閃存儲。該系列基于浪潮信息自研的分布式文件系統,結合新一代數據加速引擎DataTurbo,為用戶提供卓越的存儲解決方案。
    的頭像 發表于 05-14 10:03 ?166次閱讀

    【中心動態】 走進浪潮信息

    5月8日,RISC-V國際人才培養認證中心主任蔣學剛一行,到訪浪潮電子信息產業股份有限公司(以下簡稱“浪潮信息”),受到深圳區域副總經理段青云、產品經理陶耀民的熱情接待。浪潮信息是全球
    的頭像 發表于 05-13 17:42 ?45次閱讀
    【中心動態】 走進<b class='flag-5'>浪潮信息</b>

    為大模型專門優化 浪潮信息發布分布式全閃存儲AS13000G7-N系列

    北京2024年5月10日?/美通社/ -- 近日,浪潮信息發布為大模型專門優化的分布式全閃存儲AS13000G7-N系列。該系列依托浪潮信息自研分布式文件系統,搭載新一代數據加速引擎
    的頭像 發表于 05-10 16:37 ?199次閱讀
    為大<b class='flag-5'>模型</b>專門優化 <b class='flag-5'>浪潮信息</b><b class='flag-5'>發布</b>分布式全閃存儲AS13000G7-N系列

    通義千問開源千億參數模型

    通義千問近日開源了其首個千億參數模型Qwen1.5-110B,這是其全系列中首個達到千億級別的開源模型
    的頭像 發表于 05-08 11:01 ?303次閱讀

    浪潮信息發布為大模型專門優化的分布式全閃存儲AS13000G7-N系列

    近日,浪潮信息發布為大模型專門優化的分布式全閃存儲AS13000G7-N系列。該系列依托浪潮信息自研分布式文件系統,搭載新一代數據加速引擎DataTurbo,
    的頭像 發表于 05-08 09:38 ?210次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發布</b>為大<b class='flag-5'>模型</b>專門優化的分布式全閃存儲AS13000G7-N系列

    浪潮信息“元腦”品牌全面升級,全力進擊人工智能!

    在北京舉行的浪潮信息生態伙伴大會(IPF2024)上,浪潮信息總經理胡雷鈞表示,未來,一切計算皆AI,“元腦”全面升級為包括所有計算產品的智算品牌,同時“元腦”也是生態品牌。
    的頭像 發表于 04-19 10:42 ?316次閱讀
    <b class='flag-5'>浪潮信息</b>“元腦”品牌<b class='flag-5'>全面</b>升級,全力進擊人工智能!

    浪潮信息發布企業大模型開發平臺&quot;元腦企智&quot;EPAI,加速AI創新落地

    北京2024年4月18日?/美通社/ -- 4月17日,在2024浪潮信息生態伙伴大會(IPF2024)上,浪潮信息發布企業大模型開發平臺"元腦企智"EPAI(Enterprise P
    的頭像 發表于 04-18 21:21 ?164次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發布</b>企業大<b class='flag-5'>模型</b>開發平臺&quot;元腦企智&quot;EPAI,加速AI創新落地

    浪潮信息發布企業大模型開發平臺“元腦企智”EPAI

    4月17日,在2024浪潮信息生態伙伴大會(IPF2024)上,浪潮信息重磅發布企業大模型開發平臺“元腦企智”EPAI(Enterprise Platform of AI),為企業AI
    的頭像 發表于 04-18 10:12 ?150次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發布</b>企業大<b class='flag-5'>模型</b>開發平臺“元腦企智”EPAI

    浪潮信息與英特爾合作推出一種大模型效率工具“YuanChat”

    3月26日,浪潮信息與英特爾正式宣布,浪潮信息“源2.0系列基礎大模型”已和最新的英特爾? 酷睿? Ultra處理器平臺完成適配,本地推理速度提升100%。
    的頭像 發表于 03-27 13:50 ?232次閱讀
    <b class='flag-5'>浪潮信息</b>與英特爾合作推出一種大<b class='flag-5'>模型</b>效率工具“YuanChat”

    XEDP與KeyarchOS完成浪潮信息澎湃技術認證

    北京2024年2月27日?/美通社/ -- 近日,北京星辰天合科技股份有限公司(簡稱"XSKY星辰天合")企業級分布式統一數據平臺XEDP與浪潮信息云巒操作系統KeyarchOS V5完成浪潮信息
    的頭像 發表于 02-27 17:56 ?284次閱讀
    XEDP與KeyarchOS完成<b class='flag-5'>浪潮信息</b>澎湃技術認證

    浪潮信息澎湃認證:浪潮信息集中式存儲攜手儀電云i-stack云操作系統軟件完成兼容性認證

    近日, 儀電云i-stack云操作系統軟件與浪潮信息集中式存儲AS/HF系列產品完成并通過浪潮信息澎湃技術相互兼容性測試認證, 測試結果顯示,儀電云i-stack云操作系統軟件與浪潮信息集中式存儲
    的頭像 發表于 12-08 16:40 ?347次閱讀
    <b class='flag-5'>浪潮信息</b>澎湃認證:<b class='flag-5'>浪潮信息</b>集中式存儲攜手儀電云i-stack云操作系統軟件完成兼容性認證

    浪潮信息澎湃認證:浪潮信息集中式存儲攜手達夢數據庫管理系統V8完成兼容性認證

    近日, 達夢數據庫管理系統V8與浪潮信息集中式存儲AS/HF系列產品完成并通過浪潮信息澎湃技術相互兼容性測試認證 ,測試結果顯示,達夢數據庫管理系統V8與浪潮信息集中式存儲AS/HF系列產品完全兼容
    的頭像 發表于 09-27 17:10 ?389次閱讀
    <b class='flag-5'>浪潮信息</b>澎湃認證:<b class='flag-5'>浪潮信息</b>集中式存儲攜手達夢數據庫管理系統V8完成兼容性認證

    浪潮信息發布模型智算軟件棧OGAI,為大模型創新打造高效生產力

    浪潮信息正式發布模型智算軟件棧 OGAI。OGAI (Open GenAI Infra)"元腦生智",是為大模型業務提供AI算力系統環境部署、算力調度保障及
    的頭像 發表于 08-28 08:08 ?398次閱讀

    商湯日日新大模型全面升級,SenseCore可支持20個千億參數量大模型同時訓練

    將多方位全面升級,并宣布在該體系下一系列的大模型產品更新和落地成果。 ? “日日新SenseNova ”全面升級及應用落地 ? 商湯科技發布的“商量”
    的頭像 發表于 07-13 00:13 ?2501次閱讀
    商湯日日新大<b class='flag-5'>模型</b><b class='flag-5'>全面</b>升級,SenseCore可支持20個<b class='flag-5'>千億</b><b class='flag-5'>參數</b>量大<b class='flag-5'>模型</b>同時訓練

    網迅科技與浪潮信息KOS完成兼容性認證

    北京2023年6月6日?/美通社/ -- 日前,北京網迅科技有限公司多款產品與浪潮信息KOS完成并通過了澎湃技術認證,此次測試的產品包括網迅科技WX1860系列千兆網絡控制器、SP1000A
    的頭像 發表于 06-07 07:16 ?297次閱讀
    網迅科技與<b class='flag-5'>浪潮信息</b>KOS完成兼容性認證
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>