<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

商湯日日新大模型全面升級,SenseCore可支持20個千億參數量大模型同時訓練

Carol Li ? 來源:電子發燒友網 ? 作者:李彎彎 ? 2023-07-13 00:13 ? 次閱讀

電子發燒友網報道(文/李彎彎)今年4月10日,商湯科技正式首次公布“日日新SenseNova”大模型體系。在日前的2023世界人工智能大會上,商湯科技宣布“商湯日日新SenseNova”大模型體系將多方位全面升級,并宣布在該體系下一系列的大模型產品更新和落地成果。

“日日新SenseNova”全面升級及應用落地

商湯科技發布的“商量”2.0版本,是一個千億級參數的自然語言處理模型,它突破了大語言模型輸入長度的限制,推出不同參數量級的模型版本,可完美適配移動端、云端等不同終端及場景的應用需求,降低部署成本。

商湯還推出小模型商量S版(SenseChat S)等不同參數量級的模型版本,小模型不但性能上有一定突破,在前端的運行上也能夠跑到高通驍龍8 Gen2的終端芯片上,適配移動端等不同終端及場景的應用需求。

另外,商湯全新的秒畫3.0,模型參數從今年4月首發的10億提升至70億量級;如影SenseAvatar 2.0數字人生成平臺,相較1.0版本的語音和口型流暢度提升30%以上,實現4K高清視頻效果,并帶來AIGC生成形象及數字人歌唱功能。

基于神經輻射場技術(NeRF)的大場景3D內容生成平臺商湯瓊宇SenseSpace2.0,在空間重建效率上提升20%,渲染性能提升50%,每100平方公里場景的建圖僅需38小時即可完成(1200 TFLOPS/秒算力支持),同等工作量由人工建圖需要10000人天。

商湯格物SenseThings 2.0對小物體的紋理及材質還原達到毫米級精細度,并突破對高反光和鏡面物體的采集難題。

在應用上,比如格物在線下場景的落地,商湯科技靈境空間事業部總監李宇飛介紹,目前,“格物”支持多種物品品類的復刻,并突破了行業難題——高反光、鏡面物體的復刻,比如珠寶首飾、小家電、金屬物件等。

傳統的重建技術通常難以解決高反光,鏡面物體的采集和復刻。然而,“格物”不僅可以避免傷害和改變物品的情況,還能精確還原物品的外觀和特征。除此之外,“格物”包含一鍵成圖和一鍵成片等再創作服務。通過一鍵成圖功能,用戶可以生成商品與場景融合的海報,或者試穿試戴的真人海報,相比其他AI技術只能部分還原商品細節,一鍵成圖可以100%還原商品的各個視角和效果。

再比如影SenseAvatar 2.0數字人生成平臺,商湯數字人在金融領域,銀行、保險、券商等擔任智能客服、智慧營銷等工作,接入大語言模型能力,還能提供投研分析、研報撰寫等新功能,實現降本增效。掛載金融知識庫后,還能100%基于客戶的產品說明進行內容問答輸出,并實現信息及時更新。此外,商湯如影2.0生成的數字人,正在進入多個頭部企業的直播間、短視頻頻道。

“大模型+大裝置”的AGI戰略布局

2022年,以GPT為代表的預訓練大模型帶來新一波AI應用的爆發,大模型的研發依賴于大規模智能計算基礎設施。商湯科技堅持“大模型+大裝置”的AGI戰略布局。商湯科技打造了人工智能基礎設施AI大裝置SenseCore,打通算力、算法和平臺,并在此基礎上建立商湯“日日新SenseNova”大模型及研發體系。

根據該公司2022年度報告,商湯SenseCore AI大裝置持續擴建,完成2.7萬塊GPU的部署并實現了5.0 exaFLOPS算力輸出能力,以AIaaS的模式面向行業伙伴提供服務,全面賦能商湯自身以及行業伙伴的大模型生產。SenseCore目前可有效支持最多20個千億參數量大模型(以千卡并行)同時訓練,最高可支持萬億參數超大模型的訓練。

目前,SenseCore已支持了超過10個大模型訓練項目,包括語言大模型、文生圖模型、視覺大模型、多模態模型等自研模型和客戶自定義模型。同時商湯面向8家大型客戶支持了7000多張GPU的計算資源,以服務其自定義的大模型訓練任務。

SenseCore提供的AIaaS具體包括了計算基礎設施服務(IaaS)、深度學習平臺服務(PaaS)、模型部署及推理服務(MaaS)三大部分的能力。

1、強大的計算基礎設施(IaaS):SenseCore提供高性能計算資源(例如GPU集群和高速網絡),以支持大型模型訓練所需的強大算力。分布式訓練構架支持千卡級別的大規模分布式訓練,千卡并行效率達91.5%,最高支持4,000塊GPU卡的單任務訓練,有效降低訓練時間,提升計算效率。2022年,位于上海臨港的商湯AIDC開放運營,是由公司自建的大規模、低碳節能的先進計算基礎設施,是目前亞洲最大的人工智能算力中心之一。上海臨港AIDC的開業大大增強了SenseCore的高性能算力供應能力。

2、易用的深度學習平臺、豐富的開發工具、預訓練模型庫和開源體系(PaaS):商湯提供易用的開發工具和深度學習平臺,協助內外部高效構建和優化模型。也提供涵蓋多個領域和場景的預訓練模型庫。用戶可基于這些模型進行二次開發,大幅縮短研發周期,降低研發成本和風險。同時,公司開源了OpenMMLab、OpenGVLab、OpenDILab、OpenXRLab及OpenPPL五大平臺,包含了共計2,500多種預訓練模型及400多種算法,這些開源體系吸引全球AI開發者的參與,在Github上獲得77,000+的星標。

3、靈活的模型部署及推理服務(MaaS):SenseCore支持用戶將訓練好的AI模型一鍵跨平臺部署到云端、邊緣設備或混合環境中。公司針對30款芯片、100多種平臺進行了常規模型的適配和優化,支持大規模的實時推理。提供模型壓縮、模型融合等優化工具和技術,進一步提高模型在部署和推理階段的性能。

小結

過去幾個月時間,國內外已經涌現出大量大模型產品,如今,探索大模型應用落地已經成為當前業界關注的焦點。目前包括商湯科技在內的不少企業已經在多個領域實現應用。此外,無論是大模型的訓練還是推理都離不開算力的支持,而在這方面,商湯科技也早有布局。在算力匱乏的當下,大模型+大裝置的戰略路線對于其后續的發展,也極其有利。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 商湯
    +關注

    關注

    0

    文章

    48

    瀏覽量

    3884
收藏 人收藏

    評論

    相關推薦

    商湯宣布將免費向粵語區用戶推出粵語大模型Web版及App版

    繼4月發布「日日新SenseNova 5.0」以來,商湯模型繼續日日精進,新技頻出!
    的頭像 發表于 05-31 10:51 ?222次閱讀
    <b class='flag-5'>商湯</b>宣布將免費向粵語區用戶推出粵語大<b class='flag-5'>模型</b>Web版及App版

    商湯發布日日新模型5.0粵語版

    近日,人工智能領軍企業商湯科技正式對外發布了其最新研發成果——日日新模型5.0粵語版。該模型針對粵語用戶進行了深度優化,旨在提供更精準、更高效的自然語言處理服務。
    的頭像 發表于 05-30 09:21 ?256次閱讀

    中文大模型測評基準SuperCLUE:商湯日日新5.0,刷新國內最好成績

    日前,中文大模型測評基準SuperCLUE發布最新榜單,對商湯科技全新升級日日新SenseNova 5.0」大模型進行了全方位綜合性測評,
    的頭像 發表于 05-21 14:45 ?299次閱讀
    中文大<b class='flag-5'>模型</b>測評基準SuperCLUE:<b class='flag-5'>商湯</b><b class='flag-5'>日日新</b>5.0,刷新國內最好成績

    商湯科技即將推出日日新模型5.0粵語版本

    在盛大的“新質企業家聯合會”成立典禮上,商湯科技副總裁、智慧城市與商業事業群總裁張果琲宣布了一項重要消息。商湯科技即將推出日日新模型5.0的粵語版本,這一新版本將基于大裝置和強大的技
    的頭像 發表于 05-13 10:58 ?346次閱讀

    商湯將發布日日新模型5.0粵語版本

    商湯科技即將迎來一項重要更新,他們將發布日日新模型5.0的粵語版本。這一版本是基于商湯科技現有的大裝置和日日新
    的頭像 發表于 05-08 09:33 ?230次閱讀

    【大語言模型:原理與工程實踐】大語言模型的預訓練

    大語言模型的核心特點在于其龐大的參數量,這賦予了模型強大的學習容量,使其無需依賴微調即可適應各種下游任務,而更傾向于培養通用的處理能力。然而,隨著學習容量的增加,對預訓練數據的需求也相
    發表于 05-07 17:10

    商湯科技發布“日日新SenseNova 5.0”大模型

    商湯科技近日隆重推出全新升級的“日日新SenseNova 5.0”大模型,其卓越性能贏得了業界的廣泛贊譽。憑借這一行業領先的技術實力,商湯
    的頭像 發表于 05-07 14:13 ?279次閱讀

    商湯科技發布日新5.0大模型,對標GPT-4 Turbo,預計2024年落地端側

    據了解,4月23日,商湯科技在上海舉行了技術交流日活動,公布了“云、端、邊”全棧大模型產品矩陣,并對“日日新SenseNova 5.0”大模型進行了
    的頭像 發表于 04-25 09:30 ?209次閱讀

    商湯科技新升級模型,對標GPT-4 Turbo?

    昨日,商湯科技在滬舉辦技術交流日活動,公布了其“云、端、邊”全棧大模型產品矩陣,并對“日日新SenseNova 5.0”大模型體系進行了全面
    的頭像 發表于 04-24 17:17 ?408次閱讀

    商湯科技發布5.0多模態大模型,綜合能力全面對標GPT-4 Turbo

    場景應用需求;升級日日新SenseNova 5.0”大模型體系,綜合能力全面對標GPT-4 Turbo。 此外對于文生視頻徐立也表示商湯
    的頭像 發表于 04-24 16:49 ?640次閱讀

    商湯與華為昇騰共筑人工智能產業新生態

    近日,華為對SenseCore商湯大裝置AI云及商湯日日新·商量SenseChat大語言模型進行了全面
    的頭像 發表于 03-25 09:36 ?620次閱讀

    商湯SenseChat大模型成功通過與華為Atlas服務器的相互兼容性測試

    近日,經華為綜合評測,SenseCore商湯大裝置AI云、商湯日日新·商量SenseChat大語言模型成功通過與華為Atlas系列服務器的相
    的頭像 發表于 03-22 13:38 ?320次閱讀
    <b class='flag-5'>商湯</b>SenseChat大<b class='flag-5'>模型</b>成功通過與華為Atlas服務器的相互兼容性測試

    商湯日日新SensNova 4.0發布

    商湯科技“日日新SenseNova 4.0”正式發布,標志著大模型體系的一次重大飛躍。該模型在知識覆蓋、推理能力、長文本理解、數字推理以及代碼生成等多個維度上實現了
    的頭像 發表于 02-05 10:29 ?593次閱讀

    商湯科技發布新版日日新·商量大語言模型

    商湯科技近日發布了新版的日日新·商量大語言模型-通用版本(SenseChat V4)。這一版本的模型在知識理解、閱讀理解、綜合推理、數理、代
    的頭像 發表于 02-04 10:30 ?588次閱讀

    商湯日日新”重磅升級點燃WAIC 2023,產業應用百花齊放

    揭曉了 多維度全面升級的“商湯日日新SenseNova”大模型體系 。 作為千億
    的頭像 發表于 07-07 22:00 ?486次閱讀
    “<b class='flag-5'>商湯</b><b class='flag-5'>日日新</b>”重磅<b class='flag-5'>升級</b>點燃WAIC 2023,產業應用百花齊放
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>