<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

新火種AI | 谷歌Gemini“抄襲”百度文心一言？AI訓練數據陷難題

作者：一號

編輯：小迪

谷歌過于心急，Gemini推出不到半月，就遭遇兩次“危機”。

美東時間12月6日，谷歌推出了迄今為止規模最大，能力最強的大模型Gemini。其原生多模態的能力，通過一條約6分鐘的演示視頻，展現得淋漓盡致，讓人不得不感慨它的強大，就連馬斯克都評論說，“（Gemini）令人印象深刻”。

谷歌在AI領域的成就有目共睹，盡管之前推出的Bard表現不盡人意，讓谷歌市值一夜蒸發了1000億美元。但經過一年沉淀，加上和DeepMind聯合研發，所以Gemini（雙子星）可是被寄予了厚望。

但是，Gemini發布后僅一天，就有人指控谷歌“造假”。除了在數據對比上沒有使用相同條件，演示視頻效果也是經過剪輯的。逼得谷歌不得不給出文檔承認視頻是經過加工的。

12月14日，視頻“造假”事件還沒降溫，谷歌就宣布對外免費開放Gemini Pro的API。讓不少人高興得奔走相告。因為相較于GPT-4收費版才能擁有的視覺模型，Gemini Pro可以直接給平民AI玩家體驗AI視覺能力的機會。

但就在API開放后不久，就有用戶發現，在Poe上使用Gemini Pro時，如果用簡體中文連續詢問“你好”和“你是誰”這兩個問題時，Gemini Pro會直接說出“我是百度文心大模型”這樣的回答，給網友都看“呆”了。

谷歌Gemini被百度文心一眼“奪舍”了？

微博大V闌夕就發博展示了這樣的效果，就連進一步詢問“你的創始人是誰”時，它也很干脆地回答：李彥宏。

難道Gemini被百度“奪舍”了？不少人懷疑這是因為博主在對話前面設置了提示詞，讓Gemini扮演文心一言，但這位博主強調，沒有任何前置對話。

本著求真的態度，我們也去Poe上試用了一下，結果真的可以復現。

會不會是Poe平臺上的接口用錯了？不過Poe平臺可不是什么野雞套殼網站，它是美版知乎Quora推出的AI聊天機器人平臺，你所熟知的ChatGPT、Claude等知名AI都可以在上面使用。而且如果你使用英文提問Gemini，它就會立刻恢復正常。并且單就從“作案動機”上來講，Poe也沒有必要這么做。

除此之外，還有用戶在谷歌自己的Vertex AI平臺上，使用中文對話，也出現了這種情況。因此，Poe的接口使用出錯，這個可能基本可以被排除，問題應該出在Gemini本身。

使用AI生成的數據進行訓練已不新鮮

這樣看下來，要么就是谷歌使用了百度文心一言的語料進行訓練，要么就是它所使用的語料已經被AI“污染”了。

其實大模型訓練使用其他大模型生成的語料這件事情已經不是第一次發生，并且谷歌還是有“前科”的。在上一代Bard時，谷歌就曾被曝出使用ChatGPT的數據進行訓練，并且根據The Information報道，這件事情還造成了Jacob Devlin從谷歌離職。

就在上周末，字節跳動也被OpenAI禁止使用API接口，原因也是因為說字節在使用GPT訓練自己的AI，違反了使用條例。

如果按照現在每個模型堆“訓練數據量”的操作來看，互聯網上的人類原生的數據很快就會用完，并且各個模型之間也將會很相似。因此，獲取一些未被別人拿去訓練的數據，是模型之間保持差異化的一種方法。因此，有些AI公司會向一些擁有專屬數據的公司購買數據。例如OpenAI就曾表示愿意每年支付高達八位數的費用，用以獲取彭博社自有的歷史和持續的金融文件數據訪問權限。

另一個思路，就是選擇使用AI合成的數據來進行訓練。香港大學、牛津大學和字節跳動的幾名研究院就曾嘗試過使用高質量AI合成圖片，來提升圖像分類模型的性能，結果發現效果還不錯，甚至比真實數據訓練還要好。

AI生成的內容正在“污染”互聯網

而從另一方面來看，AI生成的內容污染互聯網也是一個不得不重視的問題了。尤其是生成式AI大爆發的今年。在文字、圖像、視頻還有音頻等領域，AI生成的內容都正在“污染”互聯網上數據內容。

就在上個月，一些網友發現，在谷歌搜索上輸入已故夏威夷歌手Israel Kamakawiwo’ole的名字是，得到的搜索結果，前幾張圖片都是有AI生成的，而并非真實照片，并且這是一位以彈奏尤克里里而聞名的音樂家，但圖片里的他卻在彈吉他。

在文字方面也是，隨著百家號等媒體平臺上出現的AI幫寫等功能，AI生成的文章已經開始在互聯網上“蔓延”，這讓普通人在互聯網上篩選真實且有效的信息的效率反而降低了?？梢哉f，AI生成內容對互聯網語料的“污染”，可能會導致產生一個新的需求，那就是幫人們分辨內容是否由AI生成的AI。

畢竟，目前訓練AI所需要的數據還是人類所生產的，在數據清洗過程中，需要注意清除一些由其他AI生成的內容。一旦互聯網上AI生成的內容越多，越能以假亂真，那么數據篩選的難度將越大。并且在大模型出現“幻覺”以及AI如何產生“智能涌現”這兩個問題沒有得到徹底解決之前，我想我們都無法做到徹底信賴AI生成的內容。

畢竟一旦AI生成了錯誤的內容，而另一個AI拿著這個內容去訓練，然后再另一個AI拿到新的錯誤內容......這樣“滾雪球”下去，AI最終會生成什么樣的逆天垃圾，我們真的無法想象。

審核編輯黃宇

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

Gemini

Gemini

+關注

關注
0

文章
44

瀏覽量
7485
AI

AI

+關注

關注
87

文章
26683

瀏覽量
264339
文心一言

文心一言

+關注

關注
0

文章
115

瀏覽量
902

評論

相關推薦

谷歌Gemini自曝用文心一言訓練，字節被OpenAI封號，大模型互薅羊毛是常態？

博主@闌夕爆料，對谷歌Gemini進行測試時，如果用中文詢問Gemini的身份，其回答竟然是百度文心一言。 ? 更讓人大跌眼鏡的是，測試人員

的頭像

發表于 12-20 09:03 ?2243次閱讀

<b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b>自曝用文心<b class='flag-5'>一言</b><b class='flag-5'>訓練</b>，字節被OpenAI封號，大模型互薅羊毛是常態？

谷歌Gmail將支持Gemini總結電子郵件內容

谷歌透露，Gemini 將協助 Workspace 和 Google One AI Premium 的用戶理解和處理電子郵件內容。用戶可通過移動應用和網頁版 Gmail 使用 Gemini

發表于 05-15 11:11 ?53次閱讀

百度文心一言用戶破2億，AI原生應用開發數量達19萬

此外，李彥宏還提到，百度在去年 8 月宣布開放文心一言后，不僅在C端借助大模型改造用戶產品，將AI功能融入旗下多款產品；同時在B端，通過云業務推出企業級一站式大模型平臺——千帆大模型平臺。

發表于 04-16 15:05 ?312次閱讀

谷歌Pixel 8將采用Gemini Nano模型，新增兩項AI功能

經谷歌披露，Pixel 8 在配備 Gemini Nano 后，首先將增加兩大創新 AI 功能：其中之一是 Recorder 應用內新增 Summarize 功能，無網絡情況下可記錄并歸納更多關于對話、采訪和演示的有用信息。

發表于 03-29 15:46 ?165次閱讀

百度將為國行iPhone16提供AI功能

谷歌、OpenAI 等公司的AI 。國行iPhone16搭載百度AI功能的話會不會是內置文心一言？當然這些詳細的信息還沒有辦法

發表于 03-25 16:23 ?487次閱讀

新火種AI|谷歌深夜炸彈！史上最強開源模型Gemma，打響新一輪AI之戰

“全球性能最強大、輕量級”的新一代開源系列模型Gemma，瞬間打響AI開源戰爭。據官方介紹，Gemma模型使用了和Gemini同源的技術，總共有20億參數和70億參數兩種規模，每個規模又分預訓練和指令微調兩個版本。其中20億

發表于 02-23 10:21 ?170次閱讀

谷歌AI聊天機器人改名為Gemini

谷歌(Google)近日宣布，旗下備受矚目的AI聊天機器人Bard正式更名為Gemini，并推出了一款功能更加強大的付費版本——Gemini Advanced。這一戰略調整旨在與微軟、

發表于 02-18 11:28 ?569次閱讀

谷歌Gemini被曝夸大營銷？碾壓GPT4純靠“一張嘴”

Gemini對谷歌來說可能走了一大步，但對整個AI領域而言，并沒有說的那么夸張。

發表于 12-09 09:09 ?494次閱讀

新火種AI|谷歌深夜發布復仇神器Gemini，原生多模態碾壓GPT-4？

谷歌背水一戰，發布Gemini，狙擊GPT-4

發表于 12-08 09:09 ?795次閱讀

谷歌揭秘Gemini，AMD對峙英偉達

今天，我們看到谷歌揭開了多模態AI模型Gemini的神秘面紗，AMD挑戰英偉達在AI芯片市場的霸主地位，微軟在英國AI領域的巨額投資，以及3

發表于 12-07 20:05 ?468次閱讀

實測百度新文庫，AI重構最徹底的產品都有什么用？

AI

腦極體
發布于 :2023年10月19日 09:09:22

百度文心一言，率先向全社會開放

官網”體驗。據悉，百度還將開放一批經過全新重構的AI原生應用，讓廣大用戶充分體驗生成式AI的理解、生成、邏輯、記憶四大核心能力。今年3月16日，文心一言開啟邀測。作為全球大廠中首個

發表于 09-04 10:50 ?667次閱讀

文心一言率先全面開放百度放大招

文心一言率先全面開放百度再放大招，文心一言率先全面開放。這是向全社會全面的開放。此外還有一些AI原生應用也會開放給用戶。大家可以在應用商店下載“文心

發表于 08-31 12:57 ?580次閱讀

訓練好的ai模型導入cubemx不成功怎么解決？

訓練好的ai模型導入cubemx不成功咋辦，試了好幾個模型壓縮了也不行，ram占用過大，有無解決方案？

發表于 08-04 09:16

放棄谷歌百度，和chatGPT結對編程。效率會不會更高。#編程 #chatgpt #ai #程序員

谷歌

學習電子知識
發布于 :2023年07月03日 20:16:25

新火種
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 新火種AI|Kimi概念股火了，這家估值180億的AI公司什么來頭？
Hot OpenAI宣戰AGI？GPT-5全面超越GPT-4，核聚變成最大王牌

New 新火種AI|谷歌推出AI搜索引擎惹得出版商擔憂！新聞流量的至暗時刻要來了嗎？
New 新火種AI|重磅突發！OpenAI聯合創始人官宣離職，GPT-4負責人將接任職位

精選推薦
更多

文章

資料

帖子

RRAM機制、材料及其在神經形態計算中的應用

存內計算開發者
16小時前

335 閱讀

e2studio開發磁力計LIS2MDL(1)----輪詢獲取磁力計數據

嵌入式單片機MCU開發
16小時前

350 閱讀

鴻蒙開發接口Ability框架：【AbilityDelegator】

jf_46214456
17小時前

353 閱讀

鴻蒙ArkUI-X跨平臺技術：【概述】

jf_46214456
17小時前

314 閱讀

探索存內計算—基于 SRAM 的存內計算與基于 MRAM 的存算一體的探究

存內計算開發者
17小時前

316 閱讀

基于Borland C++ Builder的Vega仿真程序

hsdou月半
221

免費

21下載

HarmonyOpen Source多任務文件下載引擎案例

姚小熊27
26.19 MB

免費

1下載

iot4j IoT Java客戶端包

懸崖勒馬2
0.04 MB

免費

0下載

Dcat Admin高顏值的后臺極速構建工具

王波
15.52 MB

免費

0下載

8A34044 ClockMatrix評估套件數據手冊

3.28 MB

免費

0下載

芯海 32 位 MCU 開發調試，基于 VS Code 插件實現芯海 32 位 MCU 開發調試

jf_69343398
1天前

298 閱讀

DSP教學實驗箱_DSP算法實驗_嵌入式教程：4-3 有限沖激響應濾波器（FIR）算法（CCS顯示）

創龍教儀
1天前

354 閱讀

飛凌嵌入式-ElfBoard-項目分享|基于ELF 1S開發板完成的物聯網開源項目

jf_13411809
1天前

521 閱讀

【紫光同創盤古PGX-MINI-4K教程】——（盤古PGX-MINI-4K開發板/PGC4KD-6ILPG144第五章）序列檢測器實驗例程

yonglong11
2天前

440 閱讀

ICCVR建立工程運行有問題

chenbingjy
2天前

709 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看