<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

新火種AI|股價暴漲30%!商湯發布日日新5.0,暴打GPT-4

新火種 ? 來源:新火種 ? 作者:新火種 ? 2024-04-25 23:22 ? 次閱讀

作者:一號

編輯:美美

沉寂多時的AI巨頭商湯,這次站在了市場焦點上。

股價沉寂多日的AI巨頭商湯,在4月24日迎來了大爆發,當日股價飆升31.15%。這樣的大漲行情,也讓商湯成為了市場焦點,在當天上午11時15分起,公司股票暫停了買賣。

wKgaomYqdSSAcHy6AAB1X6RzQko490.jpg

而到了4月25日,商湯已漲超15%,如此火熱的背后,是商湯在4月23日推出了其6000億參數的大模型“日日新5.0”,在知識、數學、推理和代碼能力方面大幅提升,綜合性能甚至能夠全面對標GPT-4 Turbo。

誰能想到,如此火熱的商湯,在之前還面臨著虧損危機。

暴打GPT-4,推理速度快到看不清

目前市場上將商湯近期股價暴漲歸功于其日前發布的“日日新5.0”大模型。第一代“日日新”大模型體系發布于2023年4月,并在同年8月獲批上線。據其官網資料顯示,日日新大模型體系包括了商量大語言模型、秒畫文生圖大模型、語音大模型和向量模型等。

wKgZomYqdSWAR7mNAATUfQL2C20086.jpg

時隔一年,“日日新5.0”正式誕生,它基于超過10TB tokens訓練,覆蓋了大量合成數據;同時也采用了當前業內主流的混合專家架構(MoE架構),上下文窗口可達到200K左右,在綜合能力上,可以全面對標GPT-4 Turbo,“主流客觀評測上達到或超越GPT-4 Turbo”。

wKgZomYqdSWAXqWJADJ9FIgi3zc985.jpg

在發布會現場上,商湯還上演了一次《街頭霸王》游戲PK,兩個角色分別由商湯新發布的日日新端側大模型SenseChat Life(商量輕量版)和GPT-4操縱,其中綠人由GPT-4操縱,紅人則由商量輕量版操作,當GPT-4還在思考如何決策時,商量輕量版的拳頭就已經打了上去,名副其實的“暴打GPT-4”,生動地體現了商量輕量版推理速度之快。

wKgaomYqdSaAeRs6AACNmb_vc04180.jpg

而且它還是一個端側大模型,采用了端云聯動的MoE框架,“以小博大”,已經在多項測試中擊敗了Llama2-7B,甚至是13B,在同等尺度上性能已經達到了SOTA水平。在中等性能手機上,商量輕量版可以達到18.3字/秒的推理速度,而人眼一般的閱讀速度為20字/秒。而在高端旗艦手機上,它的推理速度更是可以達到78.3字/秒。

大版本升級,全面對標GPT-4 Turbo

除了端側大模型的展示,商湯在此次發布會上還在“大基座”方面,把自家的日日新大模型來了個大版本升級——日日新SenseNova 5.0,全面對標GPT-4 Turbo!

wKgZomYqdSaAFY1xAADPaMPkPM0574.jpg

從評測榜單的數據上來看,商量5.0在常規客觀評測已經達到或超越了GPT-4 Turbo。其主要依靠兩點做到了這一點,一是數據,二是算力。首先,商湯采用了超過10T的tokens,讓日日新5.0具備了高質量數據的完備性,此外,商湯還合成構造了高達數千億tokens的思維鏈數據,以激活大模型推理的能力。

在算力方面,商湯將算法設計和算力設施進行了聯合的優化:算力設施的拓撲極限用來定義下一階段的算法,而算法上的新進展又要重新指導算力設施的建設。

wKgZomYqdSeAGeXnAAB_DB8cIOk751.jpg

整體上來說,日日新5.0的亮點可以總結為:①采用MoE架構;②基于超過10TB tokens訓練,擁有大量合成數據;③推理上下文窗口達到200K;④知識、推理、數學和代碼等能力全面對標GPT-4 Turbo。

wKgaomYqdSeAReKXAACWoeyZO4o300.jpg

在多模態能力方面,日日新5.0也有整體的提升,在識圖、生圖以及代碼能力等方面均可比肩行業領先模型,可以說是夠全面了,這也是商湯所一直強調的“大模型+大裝置”的打法。

股價暴漲之后,商湯能否走出虧損陰云?

作為“AI四小龍”之首的商湯,不久前,剛發布了2023年年度業績公告,公司實現營收34億元,同比下滑10.6%;年度虧損64.95億元,較2022年同期的60.93億元增加了6.6%,自2018年以來,商湯已經虧損了近500億。

但與此同時,年報顯示,生成式AI成為了商湯業績的亮點,生成式AI收入突破11.84億元,實現199.9%的飛速增長,占公司總收入的比例由2022年的10.4%提升到了34.8%。因此,商湯在2024年戰略目標中提到,推動核心業務盈利,集中資源于生成式AI業務以改善現金流和減少虧損。

wKgZomYqdSeAcdDJAABSeDo97O0064.jpg

可見,商湯正在踐行這一目標,在日日新5.0的發布會上,商湯也交出了一份客戶的使用反饋。華為、WPS、小米、閱文、海通證券,從辦公到文娛,從金融到終端,均分享了他們使用商湯日日新大模型體系后,給自身業務帶來的獎杯呢增效,也因此,商湯股價在發布會之后迎來了大漲。

wKgaomYqdSiAetpSAADffbHQjCU727.jpg

可見,有技術、有算力、有方法論還有使用場景的商湯,或許真的成功轉型稱為生成式AI新的龍頭,在AIGC時代,獲得不錯的發展。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    26443

    瀏覽量

    264041
  • AIGC
    +關注

    關注

    1

    文章

    260

    瀏覽量

    906
收藏 人收藏

    評論

    相關推薦

    商湯科技聯合海通證券發布業內首個面向金融行業的多模態全棧式大模型

    4月23日,商湯科技正式推出“日日新SenseNova 5.0”大模型體系,并與海通證券聯合發布業內首個面向金融行業的多模態全棧式大模型。
    的頭像 發表于 04-26 09:48 ?64次閱讀
    <b class='flag-5'>商湯</b>科技聯合海通證券<b class='flag-5'>發布</b>業內首個面向金融行業的多模態全棧式大模型

    商湯科技推出6000億參數大模型,全力對標GPT-4 Turbo?

    稍晚些時候,商湯科技發布公告稱,4月23日在上海臨港AIDC舉辦技術交流日活動,推出了6000億參數大模型(日日新5.0),其知識、數學、推理和代碼能力均有顯著提升,綜合性能可媲美
    的頭像 發表于 04-25 10:11 ?75次閱讀

    商湯科技發布日新5.0大模型,對標GPT-4 Turbo,預計2024年落地端側

    據了解,4月23日,商湯科技在上海舉行了技術交流日活動,公布了“云、端、邊”全棧大模型產品矩陣,并對“日日新SenseNova 5.0”大模型進行了全面升級。
    的頭像 發表于 04-25 09:30 ?59次閱讀

    商湯科技新升級大模型,對標GPT-4 Turbo?

    昨日,商湯科技在滬舉辦技術交流日活動,公布了其“云、端、邊”全棧大模型產品矩陣,并對“日日新SenseNova 5.0”大模型體系進行了全面升級?;诖?,商湯科技還推出了包括
    的頭像 發表于 04-24 17:17 ?288次閱讀

    商湯科技發布5.0多模態大模型,綜合能力全面對標GPT-4 Turbo

    場景應用需求;升級“日日新SenseNova 5.0”大模型體系,綜合能力全面對標GPT-4 Turbo。 此外對于文生視頻徐立也表示商湯科技很快就會
    的頭像 發表于 04-24 16:49 ?439次閱讀

    微軟Copilot全面更新為OpenAI的GPT-4 Turbo模型

    起初,Copilot作為Bing Chat AI助手推出,初期采用GPT-3.5模型,隨后升級至GPT-4取得顯著進步,如今再次更新至性能卓越的GPT-4 Turbo模型,這無疑將使得
    的頭像 發表于 03-13 13:42 ?247次閱讀

    火種AI|秒殺GPT-4,狙殺GPT-5,橫空出世的Claude 3振奮人心!

    GPT-4被拉下神壇, Claude 3很可能對GPT-4實現全方位的碾壓 。 Anthropic發布3個模型,全方位實現
    的頭像 發表于 03-06 22:22 ?322次閱讀
    新<b class='flag-5'>火種</b><b class='flag-5'>AI</b>|秒殺<b class='flag-5'>GPT-4</b>,狙殺<b class='flag-5'>GPT</b>-5,橫空出世的Claude 3振奮人心!

    商湯日日新SensNova 4.0發布

    商湯科技“日日新SenseNova 4.0”正式發布,標志著大模型體系的一次重大飛躍。該模型在知識覆蓋、推理能力、長文本理解、數字推理以及代碼生成等多個維度上實現了全面升級。
    的頭像 發表于 02-05 10:29 ?507次閱讀

    商湯科技發布新版日日新·商量大語言模型

    商湯科技近日發布了新版的日日新·商量大語言模型-通用版本(SenseChat V4)。這一版本的模型在知識理解、閱讀理解、綜合推理、數理、代碼和長文本理解等領域的通用能力得到了顯著提升。
    的頭像 發表于 02-04 10:30 ?511次閱讀

    ChatGPT plus有什么功能?OpenAI 發布 GPT-4 Turbo 目前我們所知道的功能

    OpenAI 發布 GPT-4 Turbo 目前我們所知道的功能分析解答 在最近的OpenAI DevDay上,該組織發布了一項備受期待的公告:推出GPT-4 Turbo,這是對其突破
    的頭像 發表于 12-13 09:19 ?601次閱讀
    ChatGPT plus有什么功能?OpenAI <b class='flag-5'>發布</b> <b class='flag-5'>GPT-4</b> Turbo 目前我們所知道的功能

    火種AI|谷歌深夜發布復仇神器Gemini,原生多模態碾壓GPT-4?

    谷歌背水一戰,發布Gemini,狙擊GPT-4
    的頭像 發表于 12-08 09:09 ?767次閱讀
    新<b class='flag-5'>火種</b><b class='flag-5'>AI</b>|谷歌深夜<b class='flag-5'>發布</b>復仇神器Gemini,原生多模態碾壓<b class='flag-5'>GPT-4</b>?

    GPT-4沒有推理能力嗎?

    今年三月,OpenAI 重磅發布GPT-4 大模型,帶來了比 ChatGPT 背后 GPT-3.5 更強的推理、計算、邏輯能力,也引發了全民使用的熱潮。在各行各領域研究人員、開發者、設計師的使用過程中,「
    的頭像 發表于 08-11 14:20 ?671次閱讀
    <b class='flag-5'>GPT-4</b>沒有推理能力嗎?

    商湯日日新大模型全面升級,SenseCore可支持20個千億參數量大模型同時訓練

    將多方位全面升級,并宣布在該體系下一系列的大模型產品更新和落地成果。 ? “日日新SenseNova ”全面升級及應用落地 ? 商湯科技發布的“商量”2.0版本,是一個千億級參數的自然語言處理模型,它突破了大語言模型輸入長度的限
    的頭像 發表于 07-13 00:13 ?2457次閱讀
    <b class='flag-5'>商湯</b><b class='flag-5'>日日新</b>大模型全面升級,SenseCore可支持20個千億參數量大模型同時訓練

    商湯日日新”重磅升級點燃WAIC 2023,產業應用百花齊放

    7月7日,第六屆世 界人工智能大會(WAIC 2023)火熱進行之際,商湯科技“大愛無疆·日日新”人工智能論壇成功舉 辦。 商湯科技董事長兼CEO徐立發表主題為《日日新
    的頭像 發表于 07-07 22:00 ?441次閱讀
    “<b class='flag-5'>商湯</b><b class='flag-5'>日日新</b>”重磅升級點燃WAIC 2023,產業應用百花齊放

    微軟GPT-4搜索引擎重大升級 新Bing開放AI能力

    微軟GPT-4搜索引擎重大升級 新Bing開放AI能力 微軟和OpenAI合作將人工智能技術應用于必應搜索帶來了更多不一樣的搜索體驗。 此前Open AI發布了新一代大型人工智能語言訓
    的頭像 發表于 05-05 17:15 ?2235次閱讀
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>