<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

大模型，開源干不掉閉源

開源大模型對閉源大模型的沖擊，變得非常猛烈。

今年3月，Meta發布了Llama（羊駝），很快成為AI社區內最強大的開源大模型，也是許多模型的基座模型。有人戲稱，當前的大模型集群，就是一堆各種花色的“羊駝”。

而就在前些天，Meta又推出了免費可商用版本的“羊駝2號”——Llama2，據說性能比肩GPT-3.5。

這在整個大模型圈都是非常炸裂的。

我們知道，各個互聯網、科技公司都在競相訓練、推出自己的大模型，投入了大量的計算資源和成本，如果不能有效的完成商業化，那么這些大模型就很難回收成本，后續的迭代、更新、升級都成問題，不僅研發企業會虧個底掉，更苦惱的大概就是“前功盡棄”的用戶了。

而現在有了自由開放強大的開源大模型，誰還愿意給閉源大模型送錢呢？

還真的有。

開源是大勢所趨，但閉源大模型依然有其存在意義和商業價值。按照目前的AI產業落地經驗來看，用好大模型，還是得靠閉源。

今天我們就來聊聊這個問題，到底是誰，需要閉源大模型？

到產業去，到產業去

大模型的商業化終點是產業，想必已經是不用過多解釋的共識了。

前不久，我參加某一個國產大模型的內部溝通會，對方高層就明確表示，自己全部用的是閉源代碼，并且堅持走閉源路線，就是考慮到訓練大模型與行業伙伴合作，其中很多隱私數據是不方便開源的。

見一斑可窺全豹，至少在短期內，大模型走向產業，落地還是要靠閉源。

模型方面，閉源大模型的質量更高。

就拿目前最能打的Llama 2為例，Meta 將 Llama 2 70B 的結果，與閉源模型進行了比較，結果在 MMLU 和 GSM8K 上接近 GPT-3.5，但在編碼基準上，還存在顯著差距，不少數據在多樣性和質量方面有所欠缺。

當然，開源大模型的優化迭代速度很快。但開源的本質和“有性繁殖”很像，就是通過大量繁殖和變異，如同開篇那張“羊駝集群”一樣，面對不確定的未來，借助進化的“優勝劣汰”，讓最優質的后代持續涌現。所以，開源軟件的分支多，對用戶來說，這個選擇的成本是很高的，加上開發人員眾多，版本控制是一個問題。

安全性方面，閉源大模型的可靠性更高。

開源大模型要遵守開源協議，商業使用需要獲得授權，海外開源大模型也要受到屬地管轄，github就曾封禁俄羅斯開發者賬號。使用海外開源大模型開發產品，供應鏈的風險，是客觀存在的。

那么，使用國產開源大模型呢？安全性得到保障，但從商業角度看，很多客戶，如大型政企，也非?？粗卮竽Ｐ驮跇I務上的可靠性，采購時往往需要大公司的品牌背書。一方面研發投入更大，口碑更高；另一方面，萬一大模型生成不當，導致商業損失或商譽問題，使用閉源大模型可以問責服務商，使用開源大模型總不能找全球開發者算賬吧？

比如大模型創業公司Huging Face，為客戶提供AI咨詢，是開源社區的臺柱子，表示有大量客戶希望把自己的私有數據/專業數據用來訓模型，并不想把這些數據給到 OpenAl。

產業化方面，閉源大模型的長期服務能力更強、更可用。

大模型落地，并不是接入API、塞進數據、調參優化就結束了。作為一種新興技術，大模型與業務場景的融合，還有非常多挑戰。比如大模型需要通過蒸餾壓縮，減小模型規模，才能在端側部署，很多企業根本沒有這類專業人才。

再比如，大模型與業務結合，需要產品、運營、測試工程師等多種角色共同參與，這些服務能力是以coder為主的開源團隊，所很難提供的。此外，大模型的長期應用，算力、存儲、網絡等配套都要跟上，開源社區無法幫助用戶“一站式”解決這些細節問題。

還有數據隱私顧慮，大模型是不能直接為產業所用的，還要通過專有場景數據進行優化，而這些數據訓練完的模型會被開源開放出去，讓企業顧慮重重。

我們曾采訪過一個智慧醫療研發團隊，對方表示，大量醫療數據分布在各大醫院、研究機構，又涉及患者隱私，大家對于把數據拿出來共同訓練一個行業模型，都存在顧慮。一方面是安全得不到保障，另一方面是自己的數據質量高，但從中得不到恰當的回報，和其他數據質量低的機構一樣，很難協調。在開源大模型的共建中，如何得到數據、把握配方、確定各方貢獻，還存在很多難題。

開源大模型需要平衡技術創新自由和版權收益之間的沖突，而使用閉源大模型就沒有這方面的麻煩，數據和模型的所有權、使用權都很清晰，牢牢掌握在企業自己手里。

可以說，目前開源大模型還無法達到實際的業務需求。而開源大模型使用者和ISV集成商，是需要獲得商業回報的，如果開源大模型不可商用、效果不好、很難賺錢，那么即使免費，企業也會慎重考慮要不要投入人來開發。

所以，未來一段時間，閉源依然是大模型落地產業的熱門選擇。

到群眾去，到群眾去

可能有人不理解了，開源免費商用，大家都能用上白菜價的大模型了，對開發者和企業用戶多友好，你怎么還說閉源好？是不是為一門心思賺錢的大廠站臺？

非也。

但凡了解開源，都會支持開源。但凡支持開源，都會關注開源的商業化。

中國科學院梅宏院士曾說過，開源以理想主義為源起，以商業化為蓬勃助力，是開放創新的典范。沒有商業化，不可能有開源。

所以，開源也好，閉源也好，誰能更早“可商用”，誰就更有未來。這一點上，閉源大模型可能更占優勢，畢竟有底氣閉源的廠商，還是有兩把刷子和研發家底兒的。

那么，開源大模型的優勢在哪里呢？如果說閉源大模型要到產業去，那么開源大模型就要到群眾中去，主打一個人多力量大。

（LeCun認為Llama-v2會改變LLM的市場格局）

開源大模型不同于傳統開源軟件，把源代碼放上去，然后全球開發者來貢獻代碼就完了。大模型的協同共建，更多體現在社區繁榮，大家一起把模型做優化、數據做豐富、工具做完善、應用做全面……

這時候，開源模式能夠帶來幾個好處：

1.技術創新。開源社區可以匯聚廣大科技企業、研究機構和開發者，對模型進行優化、改進、加速迭代，讓模型技術和配套數據集、應用工具等，變得豐富、高質，從而保持領先。

2.人才爭奪。大模型作為新興技術，人才緊缺，通過開源社區吸引全球優秀人才做貢獻，加速大模型升級，能夠拉開差距。有競爭才有壓力，所以LLama 2發布之后，很快傳出OpenAI也開始考慮半年內開源GPT-3.5的消息，開發者們有福了。

3.生態合攏。目前各行各業的IT解決方案和數字化轉型，大量使用開源技術和應用，建設大模型開源生態，讓IT人才和企業使用相關技術，對于后期的商業化非常有幫助。比如OpenAI 的合作伙伴/投資方微軟，這次也選擇成為Llama 2 的首要合作伙伴，支持個人開發者和中小公司以最低成本調用Llama 2，這對azure無疑是一大利好。

不是所有開源大模型都能成功，生態是關鍵的護城河。

夾心餅干，向何處去？

就像手機操作系統的 iOS 與 Andriod，開源與閉源的競爭，并不是某一個領域打的“你死我活”，而是各自走出一條差異化的道路，迎來自己的天地。大模型也是如此。

閉源大模型開門迎客，開源大模型紅紅火火，大家都有光明的未來。

既然如此，為什么還有專家認為，Llama 2開源對開源來說是一個巨大的飛躍，但對閉源的大模型公司是一個巨大打擊？

究竟打擊了誰？

答案應該是，既不甘心只做應用層、又沒能力卷過大廠的基礎大模型廠商。

谷歌研究人員曾發文說，因為有開源社區，我們（Google和OpenAI）沒有護城河。但是，OpenAI還有GPT-4這樣的閉源大模型作為殺手锏，只有被開源逼急了的情況下，才考慮把GPT-3.5開源，這里面是有技術代差的。而且GPT-3.5開源只透露了口風，具體進展還是未知數。

所以，這類頭部科技廠商和云巨頭，如海外的谷歌、OpenAI，國內的BATH，卡、錢、人才、數據、市場認知度、客戶基礎都有優勢，走閉源路線來完成大模型商業化、產業化是有一定先發優勢和壁壘的。

這就苦了那些一心想訓基礎通用大模型的二三線廠商了。

此前，全球大小科技公司和各類科研機構，一擁而上訓基礎大模型，比如某些機器視覺AI獨角獸，不小心就成了基礎層和應用層之間的“夾心餅干”。

實力上打不過GPT，成本上打不過Llama，訓出來的基礎通用大模型，還沒等到正式開放商用，就已經過時了，注定是明日黃花。市場上拼不過巨頭，開放度不如開源社區，幾乎不可能收回高昂的開發成本。

趁早放棄死磕大模型，或許才是明智選擇。

比如國內某AI公司的大模型，此前私有化報價是一年30萬，隨后就宣布對學術研究完全開放，獲得授權可免費商用。做大模型開源社區，也有商業化的可能（如Linux/ Android/紅帽），同時也能避免跟頭部的通用大模型的“硬碰硬”。

（知名投資人關于Llama2開源的討論截圖/來自網絡）

對于應用層開發者和ISV集成商企業來說，用好產業接受度高的閉源大模型，可以更快讓客戶接受，更適合私有化定制部署的業務需求，更快完成商業落地和收入增長。

對于AI創業公司來說，開源直接就能用，避免重復造輪子，可能是更理想、低成本試錯的商業化手段，“報團取暖”貢獻大模型開源項目，推動大模型開源社區的發展，也會獲得社區回饋和商業回饋。

中國大模型發展到高水平，既要有全球領先的閉源大模型打頭陣，也要有具備世界影響力的大模型開源社區。

道阻且長，行則將至。不妨用建設性心態，來看待開源閉源之爭，給國產閉源大模型一些信心，也給國內開源社區一些鼓勵和支持。

審核編輯黃宇

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
27061

瀏覽量
264833
大模型

大模型

+關注

關注
2

文章
1804

瀏覽量
1393

評論

相關推薦

浪潮信息重磅發布“源2.0-M32”開源大模型

浪潮信息近日發布了一款全新的開源大模型——“源2.0-M32”。這款大模型在“源2.0”系列大模型的基礎上，進行了深度的技術創新與升級。

的頭像

發表于 06-05 14:50 ?373次閱讀

通義千問開源千億級參數模型

通義千問近日開源了其首個千億級參數模型Qwen1.5-110B，這是其全系列中首個達到千億級別的開源模型。Qwen1.5-110B模型繼承了

的頭像

發表于 05-08 11:01 ?363次閱讀

通義千問推出1100億參數開源模型

通義千問近日震撼發布1100億參數的開源模型Qwen1.5-110B，這一舉措標志著通義千問在AI領域邁出了重大步伐。該模型成為通義千問全系列首個千億級參數開源

的頭像

發表于 05-06 10:49 ?323次閱讀

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫，用于優化從 PC 到云端的 NVIDIA GPU 上運行的大語言

的頭像

發表于 04-28 10:36 ?212次閱讀

李彥宏：開源模型將逐漸滯后，文心大模型提升訓練與推理效率

李彥宏解釋道，百度自研的基礎模型——文心 4.0，能夠根據需求塑造出適應各類場景的微型版模型，并支持精細調整以及后預訓練。相較于直接使用開源模型，這種經過降維處理的

的頭像

發表于 04-16 14:37 ?155次閱讀

大模型開源開放評測體系司南正式發布

近日，大模型開源開放評測體系司南（OpenCompass2.0）正式發布，旨在為大語言模型、多模態模型等各類模型提供一站式評測服務。Open

的頭像

發表于 02-05 11:28 ?661次閱讀

Meta發布CodeLlama70B開源大模型

Meta發布CodeLlama70B開源大模型 Meta發布了開源大模型CodeLlama70B，號稱是CodeLlama系列體量最大、性能最強的大

發表于 01-31 10:30 ?1042次閱讀

機器人基于開源的多模態語言視覺大模型

ByteDance Research 基于開源的多模態語言視覺大模型 OpenFlamingo 開發了開源、易用的 RoboFlamingo 機器人操作模型，只用單機就可以訓練。

發表于 01-19 11:43 ?171次閱讀

阿里云通義千問720億參數模型宣布開源

12月1日，阿里云通義千問720億參數模型Qwen-72B宣布開源。與此同時，他們還開源了18億參數模型Qwen-1.8B和音頻大模型Qwe

發表于 12-01 17:08 ?952次閱讀

CCS3.3為什么卸不掉？

我的電腦CCS3.3卸不掉，其實我已經從硬盤里把安裝文件夾刪掉了。因為在控制面板里卸不掉，所以也無法重裝。請問高手，怎么辦？通過修改注冊表能行嗎？怎么操作？謝謝！

發表于 11-07 08:31

開源圖形驅動在OpenHarmony上的使用和落地

的小廠商無法獲得閉源GPU廠商的支持，導致視覺流暢體驗較差，限制了非常多OpenHarmony產品的商用，在一定程度上也阻礙了OpenHarmony生態的推廣。 02?開源圖形驅動架構介紹由于從驅動角度

發表于 08-31 18:07

AI大模型的開源算法介紹

AI大模型的開源算法介紹什么是開源？簡單來說就是不收取任何費用，免費提供給用戶的軟件或應用程序。開源是主要用于軟件的術語，除了免費用戶還可以對開源

發表于 08-08 17:25 ?1551次閱讀

WAIC 2023 | 開放原子開源基金會成功舉辦世界人工智能大會大模型開源建設論壇

2023世界人工智能大會在上海舉行，開放原子開源基金會主辦的大模型開源建設論壇受關注。開源大模型工作委員會籌建，致力于推動大

發表于 08-02 10:46 ?1184次閱讀

模型當道開源聚力｜2023開放原子全球開源峰會開源大模型分論壇圓滿收官

6 月 13 日，2023 開放原子全球開源峰會開源大模型分論壇圓滿舉行。本場論壇匯聚了中國大模型領域的專家，包括工業界和學術界的主流玩家，共同探討大

發表于 06-19 11:32 ?482次閱讀

模型當道開源聚力｜2023開放原子全球開源峰會開源大模型分論壇圓滿收官

6月13日，2023開放原子全球開源峰會開源大模型分論壇圓滿舉行。本場論壇匯聚了中國大模型領域的專家，包括工業界和學術界的主流玩家，共同探討大模型

發表于 06-16 21:15 ?1146次閱讀

腦極體
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 華為一場不發手機的發布會，一場沉默且浩瀚的遠征
Hot 安卓影像飛升時刻：vivo X90 Pro+打通HDR任督二脈

New 手機直連SpaceX星鏈，一場“醬油比雞貴”的營銷游戲
New 一臺桌面工作站的智慧之光，照見寧暢“全局智算”版圖

精選推薦
更多

文章

資料

帖子

采用144核，能效提升66%！英特爾至強6處理器震撼上市，加速數據中心升級

章鷹觀察
17小時前

842 閱讀

如何移植FFmpeg

ElfBoard
2天前

581 閱讀

基于Arm Cortex-CM85內核的RA8D1作為控制器通過MIPI DSI實現LVGL顯示

瑞薩MCU小百科
2天前

814 閱讀

便攜式直流接地故障查找儀如何使用——每日了解電力知識

武漢摩恩
2天前

824 閱讀

重磅！英特爾發布intel3制程至強6能效核處理器，賦能數據中心能效升級

章鷹觀察
3天前

819 閱讀

IGBT設計使用指南（芯片資料+電路實例+multisim仿真）

20.13 MB

10積分

101下載

PFSystemKit OSX系統信息框架

李微波
0.55 MB

免費

1下載

baseline Testing配置檢查工具

小麥地
0.14 MB

免費

0下載

Ribbit Twitter(微博)克隆

china
0.24 MB

免費

1下載

模擬列車DCC解碼器開源分享

劉杰
0.02 MB

免費

4下載

I.MX6ULL-飛凌 ElfBoard ELF1板卡 - 如何在Ubuntu中編譯OpenCV庫(X86架構）

jf_25331175
3天前

732 閱讀

鴻蒙原生應用元服務開發-設備管理USB服務開發場景與接口

李洋水蛟龍
3天前

305 閱讀

嵌入式學習-飛凌ElfBoard ELF 1板卡 - 如何在Ubuntu中編譯OpenCV庫

jf_25331175
3天前

919 閱讀

【留言有禮】佳節至，分享“粽”要記憶，傳遞溫馨祝福，贏取精美禮品！

ElecFans小喇叭
4天前

1012 閱讀

無刷電機用的單電阻采樣的FOC，拿天線貼著電機線或者貼近采樣芯片，電機就會停轉

剛剛回國弄
4天前

1517 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看