<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大模型“四小龍”,能否跨越深淵?

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2024-01-29 13:49 ? 次閱讀

一張名為《大模型的深淵》的圖,在去年廣為流行。吃瓜群眾驚詫地發現,原來絕大多數大模型,都擠在深不見底的層級,“宣稱自己快要落地的”“再等等決定啥時候落地的”“什么落地不落地的”“怎么還有這么多沒聽說過的大模型啊”……

時至今日,國產大模型數量已經達到200多個,“深淵”更深。

其中,很多低水平重復造輪子的大模型,無法滿足個人和產業的使用需求,發布之后無人問津,已經不可能在業內翻起什么波瀾了。而那些真正具備技術價值和商業價值的大模型,也如同“潛龍在淵”,逐漸顯露出“一飛沖天”的苗頭。

上一波2015年左右開始的AI創業浪潮,以CV計算機視覺技術為主導的初創企業中,號稱“CV四小天鵝”的商湯科技、曠視科技、云從科技、依圖科技,也被譽為中國的“AI四小龍”,成為那一個AI繁榮周期中的標志性創新企業。

那么,由大模型開啟的新一輪繁榮周期中,自然也會有“潛龍在淵”。誰會成為類似“AI四小龍”這樣的潛力股呢?答案基本藏在這三個梯隊里。

大模型“四小龍”的一鱗半爪

業內流傳一句話:小創新靠大廠,大創新靠小廠。從昔日的DeepMind到去年的OpenAI,這些年輕、新銳的技術團隊,回歸創新本源,一次又一次給業界帶來顛覆性的變化,成為從業者和投資人眼中的“潛力股”。

所謂大模型的“潛龍”,有兩個基本條件:

一是“潛”,相比谷歌、微軟、英偉達、百度、騰訊、阿里等科技巨頭,成立時間更短、隊伍更加年輕化,組織效率和靈活度更高。

二是“龍”,有著不輸給大廠,甚至超越大廠的技術創新性,基礎模型是自研的,并且是L0級的通用大模型,可以為行業大模型、垂類大模型提供底座,具備向多個產業轉化的潛力,有望帶來高增長和高投資回報率。

雖然機器視覺公司也都推出了大模型,技術實力不俗,但并不算是AI新面孔。而使用開源LLaMA 架構的零一萬物,以及被大廠收購不再獨立競爭的光年之外,雖然夠“新”,但發展遇到較大的轉折點。所以這些企業及其大模型,我們就不放在此次討論。

總體來說,有三類大模型企業,目前都得到了國內外知名投資機構或行業客戶的支持,擁有較高的技術認可度與商業轉化潛力,可以被看作是“大模型四小龍”的預備役。

1.明星派

明星創始團隊,具備在工業界或學術界的知名度和影響力,打造的大模型一出世,便憑借“明星效應”,備受業界關注。

wKgaomWzNHGAc7AOAACmHIjPEcE984.jpg

包括,由前搜狗公司CEO王小川創立的百川智能(2023年3月,擁有多種參數的Baichuan系列大模型);由前商湯研究院副院長閆俊杰創立的Minimax(2021年12月,擁有ABAB 大模型);由中國最早從事中英機器翻譯領域的研究者之一、2023年ACL Fellow周明博士創辦的Langboat瀾舟科技(2021年6月,擁有通用大模型孟子)。

2.技術流

相比“明星效應”,技術流更強調技術實力,其中典型代表是智譜AI。作為一家清華系初創公司,智譜AI在2019年成立時就把OpenAI當作對標,將實現AGI通用智能作為目標,是中國最早啟動預訓練模型研發的科技公司之一。智譜AI最新發布的基座大模型GLM-4,在一系列評測中的表現也被認為逼近了OpenAI的GPT-4。

wKgZomWzNHKAPzklAAdYG7STPp8766.jpg

3.務實派

被寄予厚望的明星派、技術流,都是“高高在上”的,從業務/商業土壤上生長出來的務實派大模型,也可能憑借落地應用而闖出一條路。比如2023年問世的“天工”大模型,由昆侖萬維自主研發,大模型AIGC與昆侖萬維的搜索、游戲、社交、娛樂等業務的結合,快速進入應用周期,也讓昆侖萬維成為闖入大模型領域的一匹黑馬。

需要說明一下,三個類別是看“最長板”,并不意味著其他賽道的能力不高。

擁有明星創始團隊的大模型,性能也可能并不遜色于技術流;擁有強大基座模型的技術流,也可能牽起強悍的運營隊伍,帶動產品落地;而務實派是“根據釘子造錘子”,但錘子要是不夠硬,啥也砸不下去,所以技術能力也得過硬。

凝視大模型的“商業化”深淵

對標“AI四小龍”,可能并不讓大模型企業很高興,反而是憂慮更多。

以計算機視覺為核心的“AI四小龍”前期融資能力很強,但普遍遭遇了商業化的艱難探索,面臨盈利難、市值下降等困擾。而大模型的落地“深淵”,背后是更加漫長的商業化之路。

但是,逃避、諱莫如深,是無法打消投資人、市場和用戶的顧慮的。無論大模型企業是否愿意凝視深淵,深淵一直都在凝視著大模型。

直面大模型的“商業化”深淵,相比上一輪AI,有三新一舊:

三新:新環境、新規模、新要求。

簡單來說,大模型企業面臨著更加嚴苛的融資環境,隨著全球流動性衰減,科技企業的高估值都很難保持,龐大如谷歌都在裁員“降本增效”,融資難度更大了,比如智譜AI的融資水平就明顯不及當年的商湯科技。

同時,大模型又是一個重投入的行業,基座模型的技術競賽,還遠遠沒到終結的時候,持續向上探索意味著長期燒錢,需要的資金規模更大。而吸取了上一輪AI投融資經驗的投資人,面對大模型也格外冷靜,對初創企業的自身造血盈利能力提出了更高的要求。

一舊:AI標品化依舊很難。

南橘北枳,在中國做AI,照搬OpenAI是絕對不行的,要看到鐵一般的事實:中國toC市場對AI等軟件產品的付費意愿不高,監管嚴格,很難做,真要做也要配備龐大的團隊去確保安全合規,投入并不小。

toB市場也有很大的差異,國內企業大多不信任SaaS模式,更傾向于私有化部署,行業市場分散,中小客戶眾多,需求紛繁復雜,高薪的算法工程師到一線做一個幾十萬的項目很常見。

至于toG市場,智能化項目競爭激烈,而且事多錢少利潤薄,上一輪機器視覺公司基本在做自動駕駛、智慧城市、安防等業務,都掙的是辛苦錢。一般來說,CV計算機視覺類項目費用,是比NLP自然語言處理類高的,所以大語言模型想要靠項目制獲得高客單價,也是很困難的。

究其原因,ToB/ToG市場的AI項目,大多以解決方案式落地,政企機構更希望打包式引入AI、云、IoT等軟硬件,針對自身打造定制化方案,AI產品無法以標準化、模塊化的形式快速交付,前期要投入很高的成本。

從這個角度看,整體投入更大、單個項目收益更小,大模型的商業化挑戰,比上一波機器視覺公司更嚴峻。

那么,“大模型四小龍”,會重蹈覆轍嗎?

龍躍于淵,大模型盈利出路在哪里?

悟已往之不諫,知來者之可追。面對AI商業化難題,也不必悲觀,事實上,我們看到大模型“四小龍”預備役們,大多能開始吸取經驗開新局。我們也發現了一些共同點:

共同點一:降本,但不“增笑”。

對內“節流”,提高人效。相比上一輪AI創業熱潮中“高薪挖算法/科學家”,這些大模型“潛龍”從一開始就會注重“人效比”。

此前科技行業的高流動性、高估值,也催生了“獨角獸”們隨意擴張,反而造成了大量的低效現象,比如硅谷“神員工”精通各種編程語言,原來是把工作外包給多個中國工程師,幾年都沒被發現。這種環境也導致創新大幅度收縮,初創企業招人成本奇高。

而這波大模型創業熱潮中,企業對于人員擴張都是比較謹慎的。周明曾對媒體說過,開始創業時團隊只有他自己,后來擴展到5個人,慢慢開始訓練模型,以一個“輕量化”的團隊做出的孟子模型,未來應該長期穩定在百人的規模。百川智能、智譜AI也是類似的思路。

對外降本,提升大模型企業的盈利潛力。幫助企業和用戶“節流”,降低應用大模型的成本。很多客戶的痛點是,用大模型的成本壓力很大,希望大小模型結合,來提高投入產出比。比如百川、智譜AI都推出了多種參數的大模型,來綜合不同需求。

共同點二:聚焦toB,重視現金流。

這些大模型企業從一開始就聚焦在toB市場,智譜AI的CEO張鵬、瀾舟科技創始人周明都曾明確表示過,優先發展toB企業服務業務。

從數字化到智能化,傳統AI廠商需要從零開始做用戶教育,去講述AI技術降本增效的價值。與之相比,大模型的認知度和接納度,都是非常高的。各行各業對生產力的渴求、對應用AI的共識,都非常充沛。這給大模型企業帶來了非常好的增長基礎。

百煉智能發布的《大模型招標需求分析簡報(2023年1月-11月)》顯示,7月起,隨著國內130個大模型相繼問世,大模型招標需求量開始呈現明顯上升趨勢。11月迎來增長高峰,需求量較前月翻至近3倍。其中選擇投入10萬-50萬預算進行小規模嘗試的企業最多,同時也有不少以國央企為代表的企業開始釋放百萬級項目預算。

如前所說,toB的錢也未必好賺。企業客戶雖然付費意愿比C端用戶高,但toC應用可以標品化、大規模地吸引用戶付費,而toB智能化項目卻需要定制化,投入更大。此前機器視覺公司也曾想將AI模型跨場景、泛化應用,但發現現實世界的商業模式依然是強定制,成本居高不下。

這個問題,在大模型創業者中有比較廣泛的共識,也都在積極探索解法。百川智能CEO王小川曾對媒體透露,要突破toB定制化問題,通過可配置、可調整的搜索增強知識庫,以產品化的方式,通過不同的產品組合,來解決客戶的定制化需求。

共同點三:廣交朋友,積極開源。

“定制化”之所以成為企業的天然需求,一個主要原因是AI落地業務場景,是從零開始的,AI要和業務一起磨合才能發揮作用,很多場景是無法用一個通用產品來解決的。智能化是一門長期的慢生意,是離不開生態合作伙伴,去深入行業,做大量定制化工作的。

這些年,我們團隊實地走訪了不少AI+工廠、AI+養豬、AI+巡檢、AI+煤礦、AI+碼頭等智能化項目,最常見的一個場景就是:AI企業的科學家、算法工程師、產品運營人員、項目經理等各色人等,有的在田間地頭碼頭倉庫,一待就是幾個月,去了解基層人員的工作需求,去從頭設計作業流程。

而智能化往往也伴隨著“去人化”,有的時候一線工作人員也會不理解、不配合,大大延緩項目進度。有一年冬天,某煤礦智能化團隊在陜北某場站調研時,工作人員不想搭理他們,就故意不開暖氣爐,想讓他們大冷天的自己知難而退。還有一次,在一家養豬場,管理方希望用智能攝像頭來實時感知豬的體溫,防范豬瘟等傳染病,但算法性能一直提不上去,最后技術人員在現場反復調研,發現是因為豬皮太厚了,導致體溫識別準確率下降……

不難看到,這些十萬、幾十萬的中小微企業的小項目,可能客單價比不了大B/政府類客戶,但數量多、規模大,以基礎大模型作為底座,進行定制化開發,可以極大地提高基座模型廠商的使用率,吸引更多伙伴/ISV服務商去打造商業版。

吸引行業伙伴,百川智能、智譜AI、昆侖萬維、瀾舟科技都相繼開源了數個模型。

但我們都知道,開源容易,做生態難。一個大模型開源之后,生態繁榮不起來,沒有開發者來持續貢獻、打造商業版,無法形成正循環。

要吸引開發者,一是基座模型的能力還是要過硬,理解分析邏輯不能有硬傷。奧特曼就曾經說過,GPT-4的很多問題會在GPT-5得到解決,希望開發者基于AGI通用人工智能去設計業務。換句話說,更強大的新模型,可能會將舊模型的商業價值一筆勾銷,讓開發者徹底白干。所以,開發者一定會選擇將時間精力放在那些最先進的基座模型上,避免被卷得太快。

此外,需要良好完備的工具棧。大模型要用好,軟件也要做一定的適配和改造,則考驗的是大模型廠商的工程化能力,軟件是否對開發者友好。而“四小龍”中比較多初創公司,工程團隊在規模、人才、經驗、積累等方面可能與BAT這類成熟企業有差距。比如任務調度、代碼可讀性、技術文檔、標準數據集等,減輕開發者和伙伴們的負擔,共同把大模型用好。

無論是曾經輝煌的“AI四小龍”,還是正在崛起的“大模型四小龍”,這些企業用銳利的技術和昂揚的理想,一次又一次地推高創新的“天花板”,是中國科技不可或缺的一支力量。

智能中國正打開更寬廣的天地,這些大模型“潛力股”,一定會有龍躍于淵,遨游九天。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    27193

    瀏覽量

    264958
  • 大模型
    +關注

    關注

    2

    文章

    1824

    瀏覽量

    1419
收藏 人收藏

    評論

    相關推薦

    小鵬匯天飛行汽車飛越深圳CBD,未來新出行雛形已現

    越深圳CBD。 通過這次飛行,民眾更近距離地見識到了基于飛行汽車的未來出行方式,空中交通離我們越來越近了。 ? 小鵬匯天力主打造低空飛行器綜合體 作為小鵬汽車下屬企業,目前小鵬匯天已經成長為亞洲規模最大的飛行汽車公司。該公司融合智
    的頭像 發表于 05-28 00:18 ?2192次閱讀

    EMC與EMI一站式解決方案:理論到實踐的跨越

    深圳比創達電子EMC|EMC與EMI一站式解決方案:理論到實踐的跨越
    的頭像 發表于 05-24 09:44 ?181次閱讀
    EMC與EMI一站式解決方案:理論到實踐的<b class='flag-5'>跨越</b>

    【大語言模型:原理與工程實踐】大語言模型的應用

    ,它通過抽象思考和邏輯推理,協助我們應對復雜的決策。 相應地,我們設計了兩類任務來檢驗大語言模型的能力。一類是感性的、無需理性能力的任務,類似于人類的系統1,如情感分析和抽取式問答等。大語言模型在這
    發表于 05-07 17:21

    【大語言模型:原理與工程實踐】大語言模型的評測

    模型解釋如“種瓜得瓜,種豆得豆”這樣的中文古語。對于模型的回答,我們主要依據準確性和全面性兩個指標進行評估。準確性主要考察模型輸出與標準答案的符合程度,而全面性則評估模型在給出正確答案
    發表于 05-07 17:12

    【大語言模型:原理與工程實踐】大語言模型的基礎技術

    全面剖析大語言模型的核心技術與基礎知識。首先,概述自然語言的基本表示,這是理解大語言模型技術的前提。接著,詳細介紹自然語言處理預訓練的經典結構Transformer,以及其工作原理,為構建大語言
    發表于 05-05 12:17

    【大語言模型:原理與工程實踐】揭開大語言模型的面紗

    了隨著模型規模擴大,其性能和能力提升速度的變化規律。這一定律在深度學習中表現為模型規模與性能改進之間的關系,通常表明擴大模型規??梢蕴嵘阅?。大語言模型的縮放定律具有
    發表于 05-04 23:55

    不起眼的“小龍套”:優秀的尾部線夾,要具備哪些條件?

    CNLINKO凌科電氣連接器知識分享如果說外殼,絕緣體、接觸件是連接器的“主角”,那尾部線夾就是一個“小龍套”。因為它只是用來夾緊連接器外接線纜的緊固件。那么一個優秀的尾部線夾究竟具備哪些條件
    的頭像 發表于 12-16 08:13 ?431次閱讀
    不起眼的“<b class='flag-5'>小龍</b>套”:優秀的尾部線夾,要具備哪些條件?

    如何將adi的spice模型(.cir文件)添加到pspice里?

    我在用cadence的pspice仿真電路時,需要一個AD620器件,后來雖然我在cadence自帶的庫中找到了。但還是留了很多疑問: 1.ad620是adi公司出的,網站上有spice模型
    發表于 11-28 06:58

    能否利用器件的IBIS模型對器件的邏輯功能進行仿真?

    能否利用器件的IBIS模型對器件的邏輯功能進行仿真?如果不能,那么如何進行電路的板級和系統級仿真? 可以利用器件的IBIS模型對器件的邏輯功能進行仿真。IBIS(Input/Output
    的頭像 發表于 11-24 14:50 ?367次閱讀

    PODsys:大模型AI算力平臺部署的開源“神器”

    的大模型研發工具和框架。在算力平臺的部署過程中,大模型研發機構常常需要面對一系列的問題:大模型算力平臺是什么樣的?如何快速構建大模型算力平臺?如何確保算力平臺穩定可靠?如何提升部署效率
    的頭像 發表于 11-08 09:17 ?541次閱讀
    PODsys:大<b class='flag-5'>模型</b>AI算力平臺部署的開源“神器”

    后摩智能與奇異摩爾正式簽署戰略合作協議

    推進大算力芯片發展。 ? ? ? 后摩智能產品和市場副總裁信曉旭與奇異摩爾產品及解決方案副總裁??|簽署戰略合作協議 ChatGPT掀起的這場AIGC熱潮,引發了全球范圍內的大模型競賽,迅速涌現的大模型被形象地稱作“大模型
    的頭像 發表于 09-27 10:19 ?662次閱讀

    盤古大模型能否撐起世界AI另一極?

    2023 華為開發者大會(HDC 2023)開幕。下午兩個多小時的主題演講里,華為云首次詳細披露了盤古大模型的進展,不僅發布面向行業的盤古大模型 3.0,還詳細介紹了華為發展大模型的基礎技術能力。
    的頭像 發表于 09-05 15:15 ?890次閱讀

    華為盤古大模型和GPT的區別

    華為盤古大模型和GPT的區別? 隨著人工智能技術的不斷進步,機器學習領域的研究也越來越深入。在這其中,以自然語言處理技術為主要研究方向的人工智能算法受到了廣泛關注。在這個領域中,華為盤古大模型
    的頭像 發表于 08-30 17:38 ?3777次閱讀

    AI大模型和小模型是什么?AI大模型和小模型的區別

      隨著人工智能的不斷發展和應用,機器學習模型的大小越來越成為一個重要的問題。在機器學習中,我們通常將模型分為兩類:大模型和小模型。本文將介紹AI大
    發表于 08-08 16:55 ?6845次閱讀

    AI開發賦能千行百業 華為云盤古大模型3.0發布

    工信部副部長徐曉蘭表示,新一代人工智能以深度學習算法為代表,引領著發展熱潮。通用人工智能以大模型為代表,不斷取得技術突破,實現了從感知向認知、從量變到質變的跨越。
    的頭像 發表于 07-10 15:44 ?881次閱讀
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>