<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

圍剿Kimi，只是大模型“新賽季”play的一環

大模型巨頭“圍剿”Kimi的戰役，已經進行了一段時間了。想必讀者們已經從Kimi帶來的震撼中冷靜下來，開始理性審視2024的大模型“新賽季”。

毫無疑問，“卷”長文本，是基礎通用大模型在新賽季的首個賽點。3月18日，月之暗面宣布Kimi智能助手支持200萬字超長無損上下文，并開啟內測。200萬字是什么概念呢？《紅樓夢》等古典名著、企業財報等專業文獻，Kimi都能“手拿把掐”，展現出了極強的理解分析能力。

打擂臺容易守擂難。Kimi這位新秀的亮相固然驚艷，但其他更早問世的TOP級基礎大模型，也都不是吃素的，很快百度文心一言、阿里通義千問，都宣布跟進長文本能力，直接卷到1000萬字。

Kimi突如其來的熱度、巨頭的積極反撲、長文本賽事的狂飆，無不說明基礎大模型已經進入了新賽段。

Kimi不是來終結比賽的，而是來加入這個家的。而去年倉促備戰、緊跟ChatGPT的第一梯隊廠商，如今也對大模型的商業化前景、落地方向等，有了更成熟的思考。

Kimi掀起的“長文本之戰”，只是大模型“新賽季”paly中的一環，接下來還會有哪些看點，我們來預測一下。

Kimi，終結不了比賽

月之暗面（Moonshot AI）是大模型賽道上，第一波獲得較大規模融資的明星創業公司。而相比同時期動作不斷的AI大廠如BAT、明星企業如百川，月之暗面直到去年10月才交出了第一份成績單Kimi，頗有種“謀定而后動”的味道。

從參數上看，Kimi的長文本能力超越了當時的谷歌gemini 1.5、Claude3，處于全球領先水平。

從市場動作看，Kimi的宣傳，也不像其他基礎通用大模型廠商那樣謹慎，而是大規模投流，廣告鋪天蓋地，在B站、抖音、小紅書等平臺都有信息流投放。據媒體報道，Kimi每天獲客成本都在20萬，正在“燒錢換規?！?。

從實際效果看，有大量個人用戶和企業開發者在使用Kimi后表示，其在中文上的理解、分析、問答能力，確實優于當時主流的國產大模型，上下文銜接更好，總結能力更強。

幾重因素疊加，升級后的Kimi引爆了資本市場的新一波熱情，甚至出現了“Kimi概念股”。

那么，Kimi能“亂拳打死老師傅”，一舉終結基礎大模型的比賽嗎？子彈飛了這么久，結果已經很明顯了，不能。

一方面，隨著用戶規模的增多、應用場景和用例的增加，Kimi的能力局限越來越多地暴露出來，比如有用戶提到，Kimi的編程能力跟ChatGPT、GLM4、文心一言有很大的差距，ToC場景下長文本處理的需求并不高頻，新鮮感過了之后，感覺沒有其他太大用處。

同時，Kimi視為核心差異化優勢的長文本能力，并不構成真正的護城河。從其他巨頭很快就跟進并上線了相關能力，就可以看出，長文本處理技術的壁壘并沒有很高，能做基礎通用大模型的頭部廠商，都有相關技術和人才積累。

而過去一年AI大廠在多模態大模型、智算基礎設施、ToC應用、Tob客情關系等多個維度構筑起的壁壘，則是月之暗面很難快速追趕的。比如，目前月之暗面還沒有發布多模態大模型，云服務運維跟不上，難以保證B端用戶的體驗。

目前Kimi面向大眾免費試用，但其付費API的定價，有的版本幾乎達到了GPT-3.5等領先大模型的數倍，后續付費轉化也要打一個問號。

總的來說，Kimi是月之暗面在大模型技術上的一次成功“秀肌肉”，但別說直接終結比賽，要躋身“可規模落地大模型”這一賽道的TOP席位，恐怕為時尚早。

新賽季，“遭遇戰”告一段落

有讀者可能會問，既然大廠有做長文本處理的能力，為什么去年不卷，非要Kimi火了之后才卷？

所以說，Kimi爆火是一個很好的契機，標志著中國大模型已經從倉促備戰的“遭遇戰”，進入到了步步為營的“陣地戰”。

簡單來說，2023年ChatGPT橫空出世，中國的AI大廠是在猝不及防的情況下，極短的時間內統籌資源、組織人馬，快速跟上OpenAI的技術進展，一度出現了“大模型日拋”的局面。這時候最重要的是爭取主動，避免中國AI在大模型浪潮中缺席。文心一言、訊飛星火、騰訊混元、華為盤古、百川智能、智譜AI等一大批基礎大模型廠商和初創機構，確實讓中國在“遭遇戰”中拿下一城。

狂奔一年，無論海內外都對大模型有了更清晰，也更務實的認知。中國的基礎大模型廠商，已經開始“高筑墻、廣積糧”，逐步進入到充分準備、保障嚴密、戰略穩定的“陣地戰”了。

為什么之前不卷長文本，Kimi出現又快速集體圍剿？恰恰是新賽季“陣地戰”開始的信號。

信號一，不打沒意義的仗。

國內基礎大模型的競爭基本告一段落了。

隨著Sora、Claude3等開源或閉源大模型都越來越強大，基礎通用大模型的投入門檻也更加高昂，不能長期拿出天文數字來卷的都心生退意，轉而去挖掘垂直場景和細分行業的機會，這也讓頭部廠商的認知度和市場認可度更加穩固。

基礎大模型廠商也開始精打細算，關注如何從硬件中壓榨出更多算力、降低單位推理成本、構建可持續的國產算力、挖掘商業化項目潛力等。而長文本處理要消耗大量的硬件資源，平白無故瞎卷，燒錢費力還未必討好，確實沒必要。

但Kimi的爆火，更多是讓ToB場景，尤其是金融、政務客戶，看到了大模型的應用價值，讀財報、讀合同、做客服，更長的文本確實能在這類知識密集型場景，發揮出更好的效果，減少幻覺問題。這代表了基礎模型的底層能力，所以Kimi的長文本之戰，必須打。

信號二，競爭更加立體復雜

2023年末，大模型熱度已經開始降溫。應用側落地困難，所謂的殺手級AI應用似乎還是沒有出現，而投入成本持續加碼，基礎模型一升級就會覆蓋創業者的工作，導致投資市場態度也偏向謹慎。于是，很多人開始質疑這一波大模型只是自嗨，唯一賺錢的只有賣鏟子的英偉達，焦慮情緒開始彌漫。

這時候，Kimi作為一款現象級產品，確實打破了僵局。

作為一個有實際意義的應用層產品，Kimi讓大眾再一次感受并認可了大模型的價值。根據產業規律，應用爆發往往會在產業基礎平臺條件具備之后的一兩年內出現，Kimi正處于這一時間軸的關節上，標志著AI應用爆發即將開始。

Kimi對大模型價值的再度確認，也會讓接下來的通用大模型競爭，從卷參數、卷benchmark等基礎項PK，進入到更加復雜、多元的能力角斗。

信號三，跑馬圈地白熱化。

這一競爭階段，“遭遇戰”時的靈活、機動、大干快上，就不太管用了，而需要細致部署、步步為營，跑馬圈地。

對Kimi的圍剿說明各家基礎大模型廠商的底層能力，會很快趨同。除非像OpenAI那樣，技術的飛輪效應極強，跟競爭對手的差距越拉越大，否則，技術天然會擴散，很難長期成為商業秘密與護城河。

壞消息是，國內的基礎大模型，想要建立差異化優勢越來越難，沒有人能獲得壟斷地位；好消息是，政企客戶更希望構建“模型花園”，根據需要調用多個大模型，減少對單一供應商的依賴，所以市場仍在增長，仍然開放，大家都還有機會。

（企業希望引入的模型數量）

a16z調研了七十多位財富500強企業和頂級企業領袖，發現這些公司2024年在AI上的支出預算比2023年增加了2-5倍。國內市場的智能化速度也不會遜色，更增強了對基礎大模型的需求，所以接下來，會進入到白熱化的跑馬圈地階段。

大模型新賽季，正式拉開帷幕。

長文本，只是“陣地戰”的一環

長文本，是“秀肌肉”的必爭之地，但解決政企客戶的切實需求，長文本卻未必那么實用。從Kimi的長短板，我們可以看到目前市場更需要怎樣的大模型。

首先說說短板。前面提到了，Kimi的長文本在很多場景下屬于低頻需求，再長的token只會帶來更大的計算量、更高的資源成本，對用戶來說性價比不高。對此，吳恩達也認為，快速生成token，可能比使用更強的模型更重要。長文本處理導致的硬件資源需求、GPU短缺和云服務能力，也是Kimi面臨的現實挑戰。

而Kimi的長板在于，在文本摘要和知識管理等任務中，發揮出了極高的生產力效能，對企業的吸引力很大。應用更友好，企業不需要從頭開始訓練自己的LLM。

所以，長文本之戰引發的連鎖反應，會讓一些能力，成為battle重點：

1.與云的深度融合。Maas服務會成為模型購買決策的首要原因之一，繼續深化、細化。

2.對Agent開發的支撐。基礎大模型很難提供所有端到端的解決方案，長文本處理是應用層公司的舞臺，通過基礎大模型+Agent式工作流，去解決客戶的專有問題。而Agent式推理拼的是token生成速度，而非文本有多長。試想一下，如果一個金融客服助手半天憋不出一段話，即使生成的效果再好，用戶也不會有耐心等待。所以，長文本能力并非應用型企業選擇基座模型的唯一標準，甚至不是最重要的標準。

3.生態規模。Kimi的爆火說明，大廠不可能壟斷所有應用方向。利用新的技術能力（如長文本處理）來解決新的問題，創業公司和個人開發者更具備貼近客戶、深入場景的優勢，為各類行業用戶的特定需求進行微調、定制。大模型的商業城池，必須由眾多生態伙伴一起來守，誰能在2024奠定生態的規模優勢，是接下來博弈的關鍵點。

總的來說，大模型落地，是一個復雜的系統工程。2024進入“陣地戰”的大模型市場，準備更加充分，作戰更有條理，商業化戰略也日益清晰?；A模型廠商，將在一次又一次的迎敵與防御中，構筑起系統性的攻防能力。

一個平臺級的大模型公司，一定會是萬億級別，也一定會誕生在中國。讓我們拭目以待。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
26443

瀏覽量
264051
大模型

大模型

+關注

關注
2

文章
1516

瀏覽量
1103
Kimi

Kimi

+關注

關注
0

文章
7

瀏覽量
9

評論

相關推薦

單日獲客成本超20萬，國產大模型開卷200萬字以上的長文本處理

更精準的推理和高并發流量以外，似乎已經沒有太多值得廠商大肆宣傳的特性了，直到最近超長文本處理的爆火。 ? 國產大模型的新卷法，長文本處理 ? 當下將大模型長文本處理炒熱的，無疑是來自月之暗面的Kimi。作為去年發布的大

的頭像

發表于 03-27 00:53 ?2756次閱讀

單日獲客成本超20萬，國產大<b class='flag-5'>模型</b>開卷200萬字以上的長文本處理

宇視張鵬國：大模型只是技術升級不是革命

4月16日,2024宇視合作伙伴大會在千年烏鎮舉辦。大會上,宇視科技總裁張鵬國先生表示:大模型技術必定會給這個時代,給我們所處的這個行業帶來很多新的可能性,是整個AIoT行業當下最大的技術變量

的頭像

發表于 04-17 15:06 ?140次閱讀

Kimi爆火背后的技術奧秘大模型長文本能力的技術難點

當用戶認為在國內的大模型中，長文本=kimi的時候，除非競爭對手能以絕對的實力碾壓幾個量級，但凡與kimi打平或者是微弱超越，都很難威脅到kimi在用戶心目中的地位。

發表于 04-17 10:11 ?137次閱讀

<b class='flag-5'>Kimi</b>爆火背后的技術奧秘大<b class='flag-5'>模型</b>長文本能力的技術難點

Kimi AI模型崛起各大廠商競相效仿

Kimi的出色表現自然吸引了各大廠商的密切關注，并紛紛效仿其做法。作為月之暗面推出的對話式AI產品，Kimi在技術上不斷創新和突破。

的頭像

發表于 04-08 15:08 ?887次閱讀

多個ST60在同一環境中工作時，它們之間是否會相互干擾？

多個ST60在同一環境中工作時，它們之間是否會相互干擾？會不會有配對錯誤的風險？

發表于 03-29 07:10

新火種AI|大廠圍剿，“長文本”成不了Kimi的護城河

Kimi帶火的市場，被大廠盯上了

的頭像

發表于 03-28 22:37 ?107次閱讀

新火種AI|大廠<b class='flag-5'>圍剿</b>，“長文本”成不了<b class='flag-5'>Kimi</b>的護城河

MCSDK 5.Y.3中怎么增加位置環的控制？

MCSDK 5.Y.3 中怎么增加位置環的控制？ “MC_SDK中增加位置環”只是針對MCSDK5.4.x的。

發表于 03-26 08:29

谷歌Play商店推出并行下載功能，支持多應用下載

此非 Google Play 的首次嘗試。早于 2020 年，Google Play 已啟動多項安卓應用的并行下載測試，然而后因技術緣故而被暫停。如今，再度回歸該功能試驗。隨著時間推移，有望逐步推廣至廣大用戶群體。

的頭像

發表于 03-08 14:20 ?242次閱讀

如何在鴻蒙系統上安裝Google Play

隨著鴻蒙（HarmonyOS）系統的逐漸普及和用戶基數的增加，一些用戶希望能在鴻蒙系統上使用Google Play商店以獲取更多應用。然而，由于鴻蒙系統與Google服務不兼容，官方并未提供官方支持

的頭像

發表于 01-31 17:13 ?3797次閱讀

假如伺服電機一鍵優化沒有達到理想的效果，電流環、速度環和位置環該如何調節呢？

請問哪位大神方便詳細講講，假如伺服電機一鍵優化沒有達到理想的效果，電流環、速度環和位置環該如何調節呢？全靠試嗎？

發表于 01-09 06:10

位置環與速度環，電流環的差別是什么？

前幾天又人跟我講在這三個環控制中位置環精度最低，電流環精度最高，我想知道這說法對嗎，跪求高手指點這三個環的區別與用途

發表于 12-20 07:29

關于AD8529開環增益模型相關問題

您好。我在使用AD8529設計一個同向放大電路，其后將驅動電容性負載，因此希望獲得AD8529的開環增益模型來預計系統瞬態響應性能并添加適當的補償。測試方法參照《基于運算放大器和模擬集成電路

發表于 11-23 06:02

keras順序模型與函數式模型

分叉，編譯速度快不能定義復雜模型函數式模型靈活，層與層之間可以任意連接可以定義復雜模型（如多輸出模型、有向無環圖，或具有共享層的

發表于 08-18 06:01

123. 合漿攪拌過程的系統模型在環虛擬調試 #硬聲創作季

模型

充八萬

發布于 :2023年07月06日 03:13:12

為什么無法為“State_Machine”執行處理器在環 (PIL) 仿真？

SIL 或 PIL 仿真、為目標創建連接配置和處理器在環 (PIL) 仿真。存在 S32k 配置塊并選擇了 PIL 選項。有一個解決方法，從模型中刪除 s32k 配置塊并將其放回原處。重新啟動

發表于 05-22 07:44

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看

<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>