<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大模型,開源干不掉閉源

腦極體 ? 來源:腦極體 ? 作者:腦極體 ? 2023-07-24 19:33 ? 次閱讀

開源大模型對閉源大模型的沖擊,變得非常猛烈。

今年3月,Meta發布了Llama(羊駝),很快成為AI社區內最強大的開源大模型,也是許多模型的基座模型。有人戲稱,當前的大模型集群,就是一堆各種花色的“羊駝”。

而就在前些天,Meta又推出了免費可商用版本的“羊駝2號”——Llama2,據說性能比肩GPT-3.5。

這在整個大模型圈都是非常炸裂的。

我們知道,各個互聯網、科技公司都在競相訓練、推出自己的大模型,投入了大量的計算資源和成本,如果不能有效的完成商業化,那么這些大模型就很難回收成本,后續的迭代、更新、升級都成問題,不僅研發企業會虧個底掉,更苦惱的大概就是“前功盡棄”的用戶了。

而現在有了自由開放強大的開源大模型,誰還愿意給閉源大模型送錢呢?

還真的有。

開源是大勢所趨,但閉源大模型依然有其存在意義和商業價值。按照目前的AI產業落地經驗來看,用好大模型,還是得靠閉源。

今天我們就來聊聊這個問題,到底是誰,需要閉源大模型?

到產業去,到產業去

大模型的商業化終點是產業,想必已經是不用過多解釋的共識了。

前不久,我參加某一個國產大模型的內部溝通會,對方高層就明確表示,自己全部用的是閉源代碼,并且堅持走閉源路線,就是考慮到訓練大模型與行業伙伴合作,其中很多隱私數據是不方便開源的。

見一斑可窺全豹,至少在短期內,大模型走向產業,落地還是要靠閉源。

模型方面,閉源大模型的質量更高。

就拿目前最能打的Llama 2為例,Meta 將 Llama 2 70B 的結果,與閉源模型進行了比較,結果在 MMLU 和 GSM8K 上接近 GPT-3.5,但在編碼基準上,還存在顯著差距,不少數據在多樣性和質量方面有所欠缺。

當然,開源大模型的優化迭代速度很快。但開源的本質和“有性繁殖”很像,就是通過大量繁殖和變異,如同開篇那張“羊駝集群”一樣,面對不確定的未來,借助進化的“優勝劣汰”,讓最優質的后代持續涌現。所以,開源軟件的分支多,對用戶來說,這個選擇的成本是很高的,加上開發人員眾多,版本控制是一個問題。

安全性方面,閉源大模型的可靠性更高。

開源大模型要遵守開源協議,商業使用需要獲得授權,海外開源大模型也要受到屬地管轄,github就曾封禁俄羅斯開發者賬號。使用海外開源大模型開發產品,供應鏈的風險,是客觀存在的。

那么,使用國產開源大模型呢?安全性得到保障,但從商業角度看,很多客戶,如大型政企,也非??粗卮竽P驮跇I務上的可靠性,采購時往往需要大公司的品牌背書。一方面研發投入更大,口碑更高;另一方面,萬一大模型生成不當,導致商業損失或商譽問題,使用閉源大模型可以問責服務商,使用開源大模型總不能找全球開發者算賬吧?

比如大模型創業公司Huging Face,為客戶提供AI咨詢,是開源社區的臺柱子,表示有大量客戶希望把自己的私有數據/專業數據用來訓模型,并不想把這些數據給到 OpenAl。

產業化方面,閉源大模型的長期服務能力更強、更可用。

大模型落地,并不是接入API、塞進數據、調參優化就結束了。作為一種新興技術,大模型與業務場景的融合,還有非常多挑戰。比如大模型需要通過蒸餾壓縮,減小模型規模,才能在端側部署,很多企業根本沒有這類專業人才。

再比如,大模型與業務結合,需要產品、運營、測試工程師等多種角色共同參與,這些服務能力是以coder為主的開源團隊,所很難提供的。此外,大模型的長期應用,算力、存儲、網絡等配套都要跟上,開源社區無法幫助用戶“一站式”解決這些細節問題。

還有數據隱私顧慮,大模型是不能直接為產業所用的,還要通過專有場景數據進行優化,而這些數據訓練完的模型會被開源開放出去,讓企業顧慮重重。

我們曾采訪過一個智慧醫療研發團隊,對方表示,大量醫療數據分布在各大醫院、研究機構,又涉及患者隱私,大家對于把數據拿出來共同訓練一個行業模型,都存在顧慮。一方面是安全得不到保障,另一方面是自己的數據質量高,但從中得不到恰當的回報,和其他數據質量低的機構一樣,很難協調。在開源大模型的共建中,如何得到數據、把握配方、確定各方貢獻,還存在很多難題。

開源大模型需要平衡技術創新自由和版權收益之間的沖突,而使用閉源大模型就沒有這方面的麻煩,數據和模型的所有權、使用權都很清晰,牢牢掌握在企業自己手里。

可以說,目前開源大模型還無法達到實際的業務需求。而開源大模型使用者和ISV集成商,是需要獲得商業回報的,如果開源大模型不可商用、效果不好、很難賺錢,那么即使免費,企業也會慎重考慮要不要投入人來開發。

所以,未來一段時間,閉源依然是大模型落地產業的熱門選擇。

到群眾去,到群眾去

可能有人不理解了,開源免費商用,大家都能用上白菜價的大模型了,對開發者和企業用戶多友好,你怎么還說閉源好?是不是為一門心思賺錢的大廠站臺?

非也。

但凡了解開源,都會支持開源。但凡支持開源,都會關注開源的商業化。

中國科學院梅宏院士曾說過,開源以理想主義為源起,以商業化為蓬勃助力,是開放創新的典范。沒有商業化,不可能有開源。

所以,開源也好,閉源也好,誰能更早“可商用”,誰就更有未來。這一點上,閉源大模型可能更占優勢,畢竟有底氣閉源的廠商,還是有兩把刷子和研發家底兒的。

那么,開源大模型的優勢在哪里呢?如果說閉源大模型要到產業去,那么開源大模型就要到群眾中去,主打一個人多力量大。

wKgaomS-YZ2AaAXTAAIzvnlGYRo290.jpg

(LeCun認為Llama-v2會改變LLM的市場格局)

開源大模型不同于傳統開源軟件,把源代碼放上去,然后全球開發者來貢獻代碼就完了。大模型的協同共建,更多體現在社區繁榮,大家一起把模型做優化、數據做豐富、工具做完善、應用做全面……

這時候,開源模式能夠帶來幾個好處:

1.技術創新。開源社區可以匯聚廣大科技企業、研究機構和開發者,對模型進行優化、改進、加速迭代,讓模型技術和配套數據集、應用工具等,變得豐富、高質,從而保持領先。

2.人才爭奪。大模型作為新興技術,人才緊缺,通過開源社區吸引全球優秀人才做貢獻,加速大模型升級,能夠拉開差距。有競爭才有壓力,所以LLama 2發布之后,很快傳出OpenAI也開始考慮半年內開源GPT-3.5的消息,開發者們有福了。

3.生態合攏。目前各行各業的IT解決方案和數字化轉型,大量使用開源技術和應用,建設大模型開源生態,讓IT人才和企業使用相關技術,對于后期的商業化非常有幫助。比如OpenAI 的合作伙伴/投資方微軟,這次也選擇成為Llama 2 的首要合作伙伴,支持個人開發者和中小公司以最低成本調用Llama 2,這對azure無疑是一大利好。

不是所有開源大模型都能成功,生態是關鍵的護城河。

夾心餅干,向何處去?

就像手機操作系統iOS 與 Andriod,開源與閉源的競爭,并不是某一個領域打的“你死我活”,而是各自走出一條差異化的道路,迎來自己的天地。大模型也是如此。

閉源大模型開門迎客,開源大模型紅紅火火,大家都有光明的未來。

既然如此,為什么還有專家認為,Llama 2開源對開源來說是一個巨大的飛躍,但對閉源的大模型公司是一個巨大打擊?

究竟打擊了誰?

答案應該是,既不甘心只做應用層、又沒能力卷過大廠的基礎大模型廠商。

谷歌研究人員曾發文說,因為有開源社區,我們(Google和OpenAI)沒有護城河。但是,OpenAI還有GPT-4這樣的閉源大模型作為殺手锏,只有被開源逼急了的情況下,才考慮把GPT-3.5開源,這里面是有技術代差的。而且GPT-3.5開源只透露了口風,具體進展還是未知數。

所以,這類頭部科技廠商和云巨頭,如海外的谷歌、OpenAI,國內的BATH,卡、錢、人才、數據、市場認知度、客戶基礎都有優勢,走閉源路線來完成大模型商業化、產業化是有一定先發優勢和壁壘的。

這就苦了那些一心想訓基礎通用大模型的二三線廠商了。

此前,全球大小科技公司和各類科研機構,一擁而上訓基礎大模型,比如某些機器視覺AI獨角獸,不小心就成了基礎層和應用層之間的“夾心餅干”。

實力上打不過GPT,成本上打不過Llama,訓出來的基礎通用大模型,還沒等到正式開放商用,就已經過時了,注定是明日黃花。市場上拼不過巨頭,開放度不如開源社區,幾乎不可能收回高昂的開發成本。

趁早放棄死磕大模型,或許才是明智選擇。

比如國內某AI公司的大模型,此前私有化報價是一年30萬,隨后就宣布對學術研究完全開放,獲得授權可免費商用。做大模型開源社區,也有商業化的可能(如Linux/ Android/紅帽),同時也能避免跟頭部的通用大模型的“硬碰硬”。

wKgZomS-YZ2AcLCNAACBf0k5pdA672.jpg

知名投資人關于Llama2開源的討論截圖/來自網絡)

對于應用層開發者和ISV集成商企業來說,用好產業接受度高的閉源大模型,可以更快讓客戶接受,更適合私有化定制部署的業務需求,更快完成商業落地和收入增長。

對于AI創業公司來說,開源直接就能用,避免重復造輪子,可能是更理想、低成本試錯的商業化手段,“報團取暖”貢獻大模型開源項目,推動大模型開源社區的發展,也會獲得社區回饋和商業回饋。

中國大模型發展到高水平,既要有全球領先的閉源大模型打頭陣,也要有具備世界影響力的大模型開源社區。

道阻且長,行則將至。不妨用建設性心態,來看待開源閉源之爭,給國產閉源大模型一些信心,也給國內開源社區一些鼓勵和支持。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    27061

    瀏覽量

    264833
  • 大模型
    +關注

    關注

    2

    文章

    1804

    瀏覽量

    1393
收藏 人收藏

    評論

    相關推薦

    浪潮信息重磅發布“源2.0-M32”開源模型

    浪潮信息近日發布了一款全新的開源模型——“源2.0-M32”。這款大模型在“源2.0”系列大模型的基礎上,進行了深度的技術創新與升級。
    的頭像 發表于 06-05 14:50 ?373次閱讀

    通義千問開源千億級參數模型

    通義千問近日開源了其首個千億級參數模型Qwen1.5-110B,這是其全系列中首個達到千億級別的開源模型。Qwen1.5-110B模型繼承了
    的頭像 發表于 05-08 11:01 ?363次閱讀

    通義千問推出1100億參數開源模型

    通義千問近日震撼發布1100億參數的開源模型Qwen1.5-110B,這一舉措標志著通義千問在AI領域邁出了重大步伐。該模型成為通義千問全系列首個千億級參數開源
    的頭像 發表于 05-06 10:49 ?323次閱讀

    NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫,用于優化從 PC 到云端的 NVIDIA GPU 上運行的大語言
    的頭像 發表于 04-28 10:36 ?212次閱讀

    李彥宏:開源模型將逐漸滯后,文心大模型提升訓練與推理效率

    李彥宏解釋道,百度自研的基礎模型——文心 4.0,能夠根據需求塑造出適應各類場景的微型版模型,并支持精細調整以及后預訓練。相較于直接使用開源模型,這種經過降維處理的
    的頭像 發表于 04-16 14:37 ?155次閱讀

    模型開源開放評測體系司南正式發布

    近日,大模型開源開放評測體系司南(OpenCompass2.0)正式發布,旨在為大語言模型、多模態模型等各類模型提供一站式評測服務。Open
    的頭像 發表于 02-05 11:28 ?661次閱讀

    Meta發布CodeLlama70B開源模型

    Meta發布CodeLlama70B開源模型 Meta發布了開源模型CodeLlama70B,號稱是CodeLlama系列體量最大、性能最強的大
    的頭像 發表于 01-31 10:30 ?1042次閱讀

    機器人基于開源的多模態語言視覺大模型

    ByteDance Research 基于開源的多模態語言視覺大模型 OpenFlamingo 開發了開源、易用的 RoboFlamingo 機器人操作模型,只用單機就可以訓練。
    發表于 01-19 11:43 ?171次閱讀
    機器人基于<b class='flag-5'>開源</b>的多模態語言視覺大<b class='flag-5'>模型</b>

    阿里云通義千問720億參數模型宣布開源

    12月1日,阿里云通義千問720億參數模型Qwen-72B宣布開源。與此同時,他們還開源了18億參數模型Qwen-1.8B和音頻大模型Qwe
    的頭像 發表于 12-01 17:08 ?952次閱讀

    CCS3.3為什么卸不掉?

    我的電腦CCS3.3卸不掉,其實我已經從硬盤里把安裝文件夾刪掉了。 因為在控制面板里卸不掉,所以也無法重裝。 請問高手,怎么辦?通過修改注冊表能行嗎?怎么操作?謝謝!
    發表于 11-07 08:31

    開源圖形驅動在OpenHarmony上的使用和落地

    的小廠商無法獲得GPU廠商的支持,導致視覺流暢體驗較差,限制了非常多OpenHarmony產品的商用,在一定程度上也阻礙了OpenHarmony生態的推廣。 02?開源圖形驅動架構介紹 由于從驅動角度
    發表于 08-31 18:07

    AI大模型開源算法介紹

    AI大模型開源算法介紹 什么是開源?簡單來說就是不收取任何費用,免費提供給用戶的軟件或應用程序。開源是主要用于軟件的術語,除了免費用戶還可以對開源
    的頭像 發表于 08-08 17:25 ?1551次閱讀

    WAIC 2023 | 開放原子開源基金會成功舉辦世界人工智能大會大模型開源建設論壇

    2023世界人工智能大會在上海舉行,開放原子開源基金會主辦的大模型開源建設論壇受關注。開源模型工作委員會籌建,致力于推動大
    的頭像 發表于 08-02 10:46 ?1184次閱讀
    WAIC 2023 | 開放原子<b class='flag-5'>開源</b>基金會成功舉辦世界人工智能大會大<b class='flag-5'>模型</b><b class='flag-5'>開源</b>建設論壇

    模型當道 開源聚力|2023開放原子全球開源峰會開源模型分論壇圓滿收官

    6 月 13 日,2023 開放原子全球開源峰會開源模型分論壇圓滿舉行。本場論壇匯聚了中國大模型領域的專家,包括工業界和學術界的主流玩家,共同探討大
    的頭像 發表于 06-19 11:32 ?482次閱讀

    模型當道 開源聚力|2023開放原子全球開源峰會開源模型分論壇圓滿收官

    6月13日,2023開放原子全球開源峰會開源模型分論壇圓滿舉行。本場論壇匯聚了中國大模型領域的專家,包括工業界和學術界的主流玩家,共同探討大 模型
    的頭像 發表于 06-16 21:15 ?1146次閱讀
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>