<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

明線與暗線:讀懂云廠商鏖戰大模型

腦極體 ? 來源: 腦極體 ? 作者: 腦極體 ? 2023-09-16 09:48 ? 次閱讀

天氣轉涼,夏天即將過去。如果有人問,云計算廠商在這個火熱的夏天做了什么。答案是,他們做了三件事:大模型、大模型,以及大模型。

7月,在華為開發者大會2023(Cloud)期間,華為云公布了盤古大模型3.0,隨后進行了生態等方面的升級。而在此前更早時候,阿里云公布了通義千問大模型,并在8月3日宣布其正式開源。

來到9月,云計算廠商的大模型發布更加密集。9月5日,百度智能云在2023百度云智大會發布了千帆大模型平臺2.0,進一步集成百度的文心系列大模型,只隔兩天,騰訊就在2023騰訊全球數字生態大會發布了混元大模型,其主要出口則是騰訊云。

至此,中國幾大云計算廠商可以說是在大模型領域重兵集結。相較于AI算法公司與研究機構,云計算廠商做的大模型更貼近產業與應用的一線,而且大模型與云廠商原本的業務體系、營收模塊有著相對復雜的關系。因此,云廠商的大模型之爭,絕不是簡單的模型之間技術對比。

那么,云計算大廠做大模型究竟是為什么?云+大模型之戰的決勝點在哪?

本文中,我們希望通過多個層次的對比與梳理,和大家一起解答這個問題。

首先要明確兩個前提:一是伴隨著各行業IT投入的降低,云計算廠商普遍面臨著增速放緩,營收不利的情況。根據IDC報告預測,未來五年中國云計算行業的平均增長速度將下調10%左右,云計算廠商的正在普遍降低業務預期。因此,大模型突然爆火,對于云計算行業來說是難得的窗口,這個機會或許利益沒有想象中大,但目前也不得不做。

另一個情況是,從用戶界面來看云+大模型的需求是十分復雜的。有的用戶需要直接調取模型,有的用戶需要AI算力來自己訓練模型,還有用戶需要大量的模型定制化與解決方案集成。因此云廠商做大模型并不是很多人想象的短兵相接白刃戰。大模型相關業務,需要面向多個市場,多種商業模式。這場賽事更像是一場陣地戰,各個戰略節點都不能出現缺口。

在這場大模型鏖戰的各個層面,都有一條明線和一條暗線在牽引著局勢的發展。

IaaS層:明線堆卡,暗線啟動國產AI算力

大模型帶給云計算廠商最直接的變化,其實并不來自于模型本身,而是大模型火了之后,涌現出來的大模型熱潮需要龐大的AI算力。大模型數據規模巨大,且訓練模型需要專屬的AI算力,這就給云計算服務商短期帶來了用云量的升級。在云計算IaaS層市場整體相對低迷的情況下,大模型的出現也算是注入了一針強心劑。

這個層面上云計算廠商的競爭節點,用一個詞概括就是“堆卡”。誰能提供充沛少排隊,且盡量價格低廉的AI算力,誰就算贏了。而AI算力的來源主要是英偉達GPU,于是就出現了云計算廠商買空市面上GPU的現象,以及“云廠商都是給英偉達打工”的說法。

但不管怎么說,云計算廠商在IaaS層的堆卡競賽都不會結束,大量用戶依舊會以計算成本和計算效率來作為選擇公有云AI算力的考量依據。這個層面上,云計算廠商就需要提升在計算集群性、計算兼容性方面的能力,盡量發揮出每一張GPU的價值。

比如說,百度智能云就承諾在萬卡集群訓練大模型時,有效訓練時間達到95%以上,從而降低用戶的訓練時間成本,實現更好的計算加速比。阿里云則提出了能夠支持高達十萬卡GPU的單集群規模,可讓多個萬億參數大模型同時在線訓練。

而在堆卡這條明線之外,云+大模型在基礎設施層的競賽其實還有一條暗線,就是AI算力的國產化。

不久之前,英偉達高端GPU面向中國市場供應鏈不穩定的消息沸沸揚揚,后來又傳出了“中國特供版GPU”價格貴、性能低的問題。這些現象愈發讓各界看到了AI算力走向自主可控的必然性。

在這輪大模型熱潮中,AI算力的國產化與云上獲取從趨勢變成了現實。其主要方式有兩種,一種是云計算廠商兼容更多的***,提供多樣化的AI算力。比如騰訊云、百度智能云等廠商都在強化自身的國產軟硬件兼容性,并且構建AI計算的相關生態。

在這一點上,華為云擁有天然的優勢。受到制裁后的幾年里,華為逐漸將自主AI計算生態做大做強,已經成為國產AI計算中比較成熟的一支。伴隨著盤古大模型的升級,華為云同時宣布將提供自主化的AI云服務,為大模型訓練提供算力底座,這意味著華為的自主化AI算力正式由線下走上云端。

強調大模型、AI框架的自主可控已經是大勢所趨。接下來,有理由相信公有云+國產AI算力的模式,將在宏觀趨勢的推動下持續向上。最終成為左右IaaS市場的關鍵變量。

模型層:明線MaaS落地,暗線降低定制化成本

從產業層面上看,大模型帶給云計算的最大變化是什么?就目前情況來看,MaaS的新商業模式是云廠商最為看重的一點。所謂MaaS,是指云廠商直接向用戶輸送AI大模型,從而實現模型即服務。

至少在目前的開局階段,各家云廠商對MaaS這個全新模式寄予厚望,甚至有廠商直接用MaaS替換了此前的SaaS,似乎經歷了久久為功之后,SaaS模式終于要被云產業放棄了。這也難怪。畢竟在中國市場SaaS的客單價較低,但需要進行的定制化工作卻很多,并且異常消耗后期服務。以大廠的綜合成本來看,SaaS始終難以擺脫食之無味棄之可惜的雞肋定位。

既然如此,還不如轉頭擁抱更加火熱的大模型。于是可以看到各個云廠商在2023年集體發力MaaS的新商業模式,并且為此做出了系列工作。

進軍MaaS的第一階段,云廠商主要布局在三個方面:

1.基礎模型要多且精,能夠滿足用戶在NLP、CV、多模態等幾個大方向的多樣性需求。同時,基礎模型還是云廠商的大模型門面?;A模型的體驗,決定著用戶與開發者對云廠商大模型能力的第一印象。比如文心一言的火爆,就給文心系列大模型與百度智能云的MaaS服務帶來了明顯的品牌加持效應。

2.重點領域要重點覆蓋,在可能被高頻次調用的行業類別與應用類別上,廠商要盡量做出成熟的大模型,以及基于大模型開發的應用,盡量實現低門檻集成與開箱即用。比如騰訊云的行業大模型精選商店,既提供混元大模型,還上架了金融、文旅、零售等20多個領域的行業大模型。行業大模型,已經成為MaaS模式的中堅力量。

3.要提供充沛的工具能力。除了基礎模型、高頻定制模型之外,還有海量的大模型需求。這要求用戶和開發者具備一定的開發能力,而云廠商需要提供模型精調、應用開發方面的工具鏈。比如百度智能云的千帆平臺,就在模型之外還提供預制數據集、應用范式,以及其他幫助企業應用大模型的工具。

但看似如火如荼的MaaS模式,實則也隱藏了一個暗線問題:SaaS不賺錢,于是轉頭擁抱MaaS,但誰說MaaS就賺錢了呢?

云廠商做AI也已經很多年了。但結果往往是效果很好,利潤很差。這其中的關節依舊在SaaS失速的那個關鍵原因上:定制化成本。

無論是企業應用AI還是現在應用大模型,本質上都難逃AI作為軟件的不確定性。不同企業之間的不同需求天差地別,加上AI在算力、數據與人才上都有極高的成本,任何定制行為都會產生一連串的連鎖反應。專家下工廠聽上去很美,但說一千道一萬,工廠最終是無法負擔專家薪資的。但如果不提供定制化,又會出現絕大多數AI需求無法被滿足的尷尬。

于是,怎么從頂層設計階段就降低MaaS模式可能產生的定制化成本,已經成了大模型一戰最為核心的競爭暗線。

在這個方面,各家廠商的探索幅度與實現方式各不相同。比如百度智能云更傾向用預置模型、預置應用的方式來降低定制化。除了模型平臺之外,百度智能云還發布了“AI 原生應用 Family”,通過模型+大模型應用的模式讓企業滿足自身需求。

在這方面,目前探索幅度最大的是華為云。華為云的盤古大模型3.0,從框架設計上搭建了一個“5+N+X”的三層架構。這個架構把大模型分為L0、L1、L2三層體系。其中L0層包括NLP、CV、多模態、預測、科學計算五個基礎大模型;L1則是N個行業大模型,比如政務、礦山、金融等;L2是面向各行業的細化場景模型,比如先導藥物篩選、傳送帶異物檢測等。

這個框架的設計理念,是用戶和伙伴、開發者可以根據自身需要,調用不同等級的模型進行組合拼裝,既可以直接調用集成模型,也可以基于模型進行精調,還可以獲得由不同開發者訓練的具體場景模型。這一思路的設計形式,就有了工業革命中模塊化、零部件化的特征,而具體效果如何,還有待在產業中檢驗。

整體而言,云廠商在MaaS上最討厭的就是定制化高、復用度低、后續服務工作量大的需求。這會把原廠有限的資源過度分散,最終回報難以達標。這也就是云計算行業經常討論的“小作坊式AI開發”。

在目前階段,云廠是可以在MaaS上只投入,不產出的。但長遠來看,從小作坊到流水線的改變能否實現,是決定MaaS生死的背水一戰。

生態層:明線聚合眾力,暗線開源之爭

我們需要接著說大模型那個問題,定制化成本太高。正因為定制成本高,單一服務商的綜合資源有限,因此云廠商必須把大量工作分包出去。要由合作伙伴來完成咨詢、服務、分銷等工作。否則原廠會被漫長的流程與巨大的服務成本反復折磨。這也就導致,在走向MaaS模式的時候,云計算公司比以往更加需要伙伴生態的搭建。

另一方面,云廠商在目前不僅需要伙伴,開需要盡量聚攏應用開發者。AI大模型是個新東西,其能誕生的新應用模式具有很大的想象力。就像iPhone時刻有賴于大量的APP開發者,大模型這個“新iPhone時刻”也有賴于大量具有突破能力的AI開發者。為此,互聯網大廠一方面在自己做應用,另一方面也需要聚攏更多應用開發者。因為任何應用火了,都會為提供基礎模型與算力的云廠商帶來一系列連鎖效應。

這些因素綜合起來,讓云+大模型之戰,在最開始就變成了一場生態爭奪戰。各個廠商可以說是擺開陣勢,盡一切可能來吸引伙伴和開發者加入自身的生態體系。其中,基礎措施是提供開發者與伙伴所需的技術與能力,進階模式則是推動基于大模型的技能培訓、應用開發大賽、免費資源、聯合創業計劃,在商業層面賦能伙伴和開發者。也有云廠商主張與伙伴進行全域協同,聯合創新,在細分市場與細分場景中以伙伴為主進行大模型落地。

而在如何吸引開發者、伙伴的生態之爭中,隱藏暗線是一個非常具有互聯網思維特征的命題:能不能干脆把模型開源免費,用極端降低成本的方式來吸納伙伴加入?

這也是最近被熱烈討論的“大模型開源閉源之爭”其來源之一。

支持開源者認為,免費就是最好的生態聚合策略,且靠免費引流的策略在互聯網時代屢試不爽。加上AI大模型作為基礎軟件,走向開源恐怕是早晚之事。

而反對者認為,大模型還處在剛剛發展的階段。廠商需要持續投入大量研發成本進行升級,盲目的免費會導致大模型發展陷入停滯,攪亂科技進步秩序。并且大模型開源不僅能降低伙伴和開發者的成本,也會導致市場最終定價降低,攤薄伙伴的利潤,最終導致企業不愿意投入研發創新。

不管怎么說,大模型開源與閉源的對壘,已經從產業探討變成了云計算市場的現實。8月3日,阿里云宣布通義千問開源,成為首個宣布大模型開源的中國互聯網云廠商,并且阿里云打造的AI模型社區魔搭ModelScope還以開源、免費、可商用作為主要買點,提供國內外的各種開源大模型。

此后,究竟是越來越多的云廠商在鲇魚效應下走向開源,還是依舊會保持高技術與低成本之間的對壘?讓我們拭目以待。

以我個人觀點來看,大模型的發展潛力還很大,可探索空間眾多。處于發展中的技術其實并不適合快步走向開源,因此相當部分的大模型保持閉源商業模式,是一個更大概率事件。

解決方案層:明線首批大客戶,暗線政企上云新窗口

無論說的多么熱鬧,其實企業直接通過API接口調用大模型,這種MaaS服務模式的利潤并不高。甚至可以說,在目前“百模大戰”的背景下,簡單調用大模型變成了一件頗為廉價的事情。

而持續投入的云計算行業,顯然不能滿足于這種商業模式,因此必然要爭取一些客單價高,利潤大的項目。而政企大客戶選用基于大模型的數字化解決方案,就成為了云計算廠商眼中的新機會窗口。

在眾多類型的政企大客戶中,又有錢,又有數字化能力,且愿意盡快探索大模型可能性的只有兩類:智慧城市與金融。其他更偏向實體的制造、能源、交通等行業,則相對來說更加謹慎,還處在對大模型的觀望了解之中。

因此,爭奪政務與金融大客戶訂單,就成為了云計算廠商進入大模型賽道后的一個標準動作。比如我們可以看到在2023百度云智大會上,百度智能云發布了基于大模型的數字政府解決方案九州。華為云則在強化和推廣金融、智慧城市等領域結合盤古大模型的解決方案。

在可見的未來,云計算廠商除了在模型能力與模型平臺的競爭之外,還將在以城市、金融為代表的重點領域進行爭奪。而回答好這些領域為什么需要大模型,大模型能帶來哪些與以往不同的價值,是云廠商必須回答的第一道考題。

在為大客戶構建解決方案層面,也隱藏著一條暗線。這條線索直接關乎于云計算廠商的焦慮感:大型政企客戶,不那么愿意上云了。

在幾年前,大型政企上云是一種大勢所趨,可謂是能上盡上,多上快上,但在目前階段,政企客戶更加強調數據與數字化系統的安全可控,盲目上云被認為并不可取。尤其是否能把大量關鍵數據放互聯網云平臺上,開始逐漸變成一種疑問。目前階段,國資云、國家云的提法不斷強化,即使上云,大型政企也會優先考慮以我為主,多云采購的策略,而這在無形中就分散了云廠商的利潤空間。

在這樣的背景下,云廠商對大模型的一個隱性期待,是能夠讓其成為推動大型政企繼續上云的技術契機。畢竟在云上獲取大模型,有天然的成本與可操作性優勢。

因此,能不能更好展現出大型政企、重點實體行業部署大模型解決方案的重要性,同時打消政企在數據安全、自主可控、持續服務、品牌信任等領域的疑問,就成為了云廠商鏖戰大模型的另一道必答題。

事實上,云計算與大模型的結合,還有很多賽點可以討論。比如大模型與PaaS的結合;云廠商在辦公、網盤等toB應用結合大模型的情況等。整體而言,算力、MaaS、生態、大型政企解決方案,構成了云計算廠商能否在大模型之戰中獲得競爭力的四個層面。

無論對于哪家公有云廠商來說,這場競賽的目標都是一致的:讓模型有用,讓成本下降,讓AI成為盈利的起點

大模型最終會變成又一個雞肋,還是新時代的大門?路漫漫其修遠兮,云計算還需要上下求索。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 云計算
    +關注

    關注

    38

    文章

    7351

    瀏覽量

    135719
  • SaaS
    +關注

    關注

    1

    文章

    350

    瀏覽量

    36532
  • IaaS
    +關注

    關注

    0

    文章

    64

    瀏覽量

    18470
  • 大模型
    +關注

    關注

    2

    文章

    1532

    瀏覽量

    1117
  • 盤古大模型
    +關注

    關注

    1

    文章

    99

    瀏覽量

    107
收藏 人收藏

    評論

    相關推薦

    一圖讀懂廣立微2023年度報告

    一圖讀懂廣立微2023年度報告
    的頭像 發表于 04-22 10:00 ?122次閱讀
    一圖<b class='flag-5'>讀懂</b>廣立微2023年度報告

    一圖讀懂億緯鋰能2023年度報告

    一圖讀懂億緯鋰能2023年度報告
    的頭像 發表于 04-19 10:33 ?105次閱讀
    一圖<b class='flag-5'>讀懂</b>億緯鋰能2023年度報告

    一圖讀懂虹軟科技2023年度報告

    一圖讀懂虹軟科技2023年度報告
    的頭像 發表于 04-19 10:25 ?104次閱讀
    一圖<b class='flag-5'>讀懂</b>虹軟科技2023年度報告

    一圖讀懂紫光國微2023年報

    志高行遠 萬里可期 | 一圖讀懂紫光國微2023年報
    的頭像 發表于 04-18 10:40 ?158次閱讀
    一圖<b class='flag-5'>讀懂</b>紫光國微2023年報

    一圖讀懂芯導科技2023年年度報告

    一圖讀懂芯導科技2023年年度報告
    的頭像 發表于 04-16 14:18 ?133次閱讀
    一圖<b class='flag-5'>讀懂</b>芯導科技2023年年度報告

    一圖讀懂概倫電子2023年年報

    踔厲奮發,向新而行 | 一圖讀懂概倫電子2023年年報
    的頭像 發表于 04-14 16:10 ?304次閱讀
    一圖<b class='flag-5'>讀懂</b>概倫電子2023年年報

    插座線與照明線非同一線路電路配置

    首先,插座線路和照明線路的電流負荷不同。插座線路通常用于給家用電器供電,其電流負荷較大,一般分為10A和16A兩種類型。
    的頭像 發表于 04-12 09:28 ?126次閱讀
    插座線與照<b class='flag-5'>明線</b>非同一線路電路配置

    一文讀懂車規級AEC-Q認證

    一文讀懂車規級AEC-Q認證
    的頭像 發表于 12-04 16:45 ?378次閱讀

    一文讀懂微力扭轉試驗機的優勢

    一文讀懂微力扭轉試驗機的優勢
    的頭像 發表于 11-30 09:08 ?229次閱讀
    一文<b class='flag-5'>讀懂</b>微力扭轉試驗機的優勢

    “一秒”讀懂串擾對信號傳輸時延的影響

    “一秒”讀懂串擾對信號傳輸時延的影響
    的頭像 發表于 11-28 17:07 ?234次閱讀
    “一秒”<b class='flag-5'>讀懂</b>串擾對信號傳輸時延的影響

    一文讀懂,什么是BLE?

    一文讀懂,什么是BLE?
    的頭像 發表于 11-27 17:11 ?1014次閱讀
    一文<b class='flag-5'>讀懂</b>,什么是BLE?

    EMC怎么做?讀懂EMC:詳談EMC(二)

    讀懂EMC:詳談EMC!
    的頭像 發表于 08-01 10:47 ?1241次閱讀
    EMC怎么做?<b class='flag-5'>讀懂</b>EMC:詳談EMC(二)

    EMC難不難做?帶你讀懂EMC 詳談EMC

    讀懂EMC:詳談EMC
    的頭像 發表于 07-31 11:23 ?1705次閱讀
    EMC難不難做?帶你<b class='flag-5'>讀懂</b>EMC 詳談EMC

    明線路的技術要求是什么,安裝照明設備注意事項

    有關照明線路的知識,在對照明線路進行布線時,必須按一定的技術要求來操作,主要有11大項,安裝照明設備時的注意事項,共有8大項,有需要的朋友參考下。
    的頭像 發表于 07-15 15:00 ?2569次閱讀

    一文讀懂大語言模型

    本文旨在讓沒有計算機科學背景的人對ChatGPT和類似的人工智能系統(GPT-3、GPT-4、Bing Chat、Bard等)的工作原理有一些了解。ChatGPT是一種基于*大語言模型(Large Language Model)* 的對話式AI聊天機器人。
    發表于 06-16 09:59 ?1102次閱讀
    一文<b class='flag-5'>讀懂</b>大語言<b class='flag-5'>模型</b>
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>