<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

新火種AI | 谷歌Gemini“抄襲”百度文心一言?AI訓練數據陷難題

新火種 ? 來源:新火種 ? 作者:新火種 ? 2023-12-20 09:09 ? 次閱讀

作者:一號

編輯:小迪

谷歌過于心急,Gemini推出不到半月,就遭遇兩次“危機”。

美東時間12月6日,谷歌推出了迄今為止規模最大,能力最強的大模型Gemini。其原生多模態的能力,通過一條約6分鐘的演示視頻,展現得淋漓盡致,讓人不得不感慨它的強大,就連馬斯克都評論說,“(Gemini)令人印象深刻”。

谷歌在AI領域的成就有目共睹,盡管之前推出的Bard表現不盡人意,讓谷歌市值一夜蒸發了1000億美元。但經過一年沉淀,加上和DeepMind聯合研發,所以Gemini(雙子星)可是被寄予了厚望。

但是,Gemini發布后僅一天,就有人指控谷歌“造假”。除了在數據對比上沒有使用相同條件,演示視頻效果也是經過剪輯的。逼得谷歌不得不給出文檔承認視頻是經過加工的。

12月14日,視頻“造假”事件還沒降溫,谷歌就宣布對外免費開放Gemini Pro的API。讓不少人高興得奔走相告。因為相較于GPT-4收費版才能擁有的視覺模型,Gemini Pro可以直接給平民AI玩家體驗AI視覺能力的機會。

但就在API開放后不久,就有用戶發現,在Poe上使用Gemini Pro時,如果用簡體中文連續詢問“你好”和“你是誰”這兩個問題時,Gemini Pro會直接說出“我是百度文心大模型”這樣的回答,給網友都看“呆”了。

谷歌Gemini被百度文心一眼“奪舍”了?

微博大V闌夕就發博展示了這樣的效果,就連進一步詢問“你的創始人是誰”時,它也很干脆地回答:李彥宏。

wKgZomWBqMqAfHd-AAQRnmzppkY379.jpg

難道Gemini被百度“奪舍”了?不少人懷疑這是因為博主在對話前面設置了提示詞,讓Gemini扮演文心一言,但這位博主強調,沒有任何前置對話。

wKgaomWBqMuAEsG6AAFYsarFxxM625.jpg

本著求真的態度,我們也去Poe上試用了一下,結果真的可以復現。

wKgZomWBqMuAAcdgAAP589GT9k0828.jpg

會不會是Poe平臺上的接口用錯了?不過Poe平臺可不是什么野雞套殼網站,它是美版知乎Quora推出的AI聊天機器人平臺,你所熟知的ChatGPT、Claude等知名AI都可以在上面使用。而且如果你使用英文提問Gemini,它就會立刻恢復正常。并且單就從“作案動機”上來講,Poe也沒有必要這么做。

除此之外,還有用戶在谷歌自己的Vertex AI平臺上,使用中文對話,也出現了這種情況。因此,Poe的接口使用出錯,這個可能基本可以被排除,問題應該出在Gemini本身。

wKgaomWBqMyAODq1AACIPl0BLUc359.jpg

使用AI生成的數據進行訓練已不新鮮

這樣看下來,要么就是谷歌使用了百度文心一言的語料進行訓練,要么就是它所使用的語料已經被AI“污染”了。

其實大模型訓練使用其他大模型生成的語料這件事情已經不是第一次發生,并且谷歌還是有“前科”的。在上一代Bard時,谷歌就曾被曝出使用ChatGPT的數據進行訓練,并且根據The Information報道,這件事情還造成了Jacob Devlin從谷歌離職。

就在上周末,字節跳動也被OpenAI禁止使用API接口,原因也是因為說字節在使用GPT訓練自己的AI,違反了使用條例。

wKgZomWBqMyAPJd4AAJ1abXz8sA239.jpg

如果按照現在每個模型堆“訓練數據量”的操作來看,互聯網上的人類原生的數據很快就會用完,并且各個模型之間也將會很相似。因此,獲取一些未被別人拿去訓練的數據,是模型之間保持差異化的一種方法。因此,有些AI公司會向一些擁有專屬數據的公司購買數據。例如OpenAI就曾表示愿意每年支付高達八位數的費用,用以獲取彭博社自有的歷史和持續的金融文件數據訪問權限。

wKgaomWBqM2AIpbBAAMBO88ElR0114.jpg

另一個思路,就是選擇使用AI合成的數據來進行訓練。香港大學、牛津大學和字節跳動的幾名研究院就曾嘗試過使用高質量AI合成圖片,來提升圖像分類模型的性能,結果發現效果還不錯,甚至比真實數據訓練還要好。

AI生成的內容正在“污染”互聯網

而從另一方面來看,AI生成的內容污染互聯網也是一個不得不重視的問題了。尤其是生成式AI大爆發的今年。在文字、圖像、視頻還有音頻等領域,AI生成的內容都正在“污染”互聯網上數據內容。

就在上個月,一些網友發現,在谷歌搜索上輸入已故夏威夷歌手Israel Kamakawiwo’ole的名字是,得到的搜索結果,前幾張圖片都是有AI生成的,而并非真實照片,并且這是一位以彈奏尤克里里而聞名的音樂家,但圖片里的他卻在彈吉他。

在文字方面也是,隨著百家號等媒體平臺上出現的AI幫寫等功能,AI生成的文章已經開始在互聯網上“蔓延”,這讓普通人在互聯網上篩選真實且有效的信息的效率反而降低了??梢哉f,AI生成內容對互聯網語料的“污染”,可能會導致產生一個新的需求,那就是幫人們分辨內容是否由AI生成的AI。

畢竟,目前訓練AI所需要的數據還是人類所生產的,在數據清洗過程中,需要注意清除一些由其他AI生成的內容。一旦互聯網上AI生成的內容越多,越能以假亂真,那么數據篩選的難度將越大。并且在大模型出現“幻覺”以及AI如何產生“智能涌現”這兩個問題沒有得到徹底解決之前,我想我們都無法做到徹底信賴AI生成的內容。

畢竟一旦AI生成了錯誤的內容,而另一個AI拿著這個內容去訓練,然后再另一個AI拿到新的錯誤內容......這樣“滾雪球”下去,AI最終會生成什么樣的逆天垃圾,我們真的無法想象。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Gemini
    +關注

    關注

    0

    文章

    44

    瀏覽量

    7485
  • AI
    AI
    +關注

    關注

    87

    文章

    26683

    瀏覽量

    264339
  • 文心一言
    +關注

    關注

    0

    文章

    115

    瀏覽量

    902
收藏 人收藏

    評論

    相關推薦

    谷歌Gemini自曝用文心一言訓練,字節被OpenAI封號,大模型互薅羊毛是常態?

    博主@闌夕爆料,對谷歌Gemini進行測試時,如果用中文詢問Gemini的身份,其回答竟然是百度文心一言。 ? 更讓人大跌眼鏡的是,測試人員
    的頭像 發表于 12-20 09:03 ?2243次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b>自曝用文心<b class='flag-5'>一言</b><b class='flag-5'>訓練</b>,字節被OpenAI封號,大模型互薅羊毛是常態?

    谷歌Gmail將支持Gemini總結電子郵件內容

    谷歌透露,Gemini 將協助 Workspace 和 Google One AI Premium 的用戶理解和處理電子郵件內容。用戶可通過移動應用和網頁版 Gmail 使用 Gemini
    的頭像 發表于 05-15 11:11 ?53次閱讀

    百度文心一言用戶破2億,AI原生應用開發數量達19萬

    此外,李彥宏還提到,百度在去年 8 月宣布開放文心一言后,不僅在C端借助大模型改造用戶產品,將AI功能融入旗下多款產品;同時在B端,通過云業務推出企業級一站式大模型平臺——千帆大模型平臺。
    的頭像 發表于 04-16 15:05 ?312次閱讀

    谷歌Pixel 8將采用Gemini Nano模型,新增兩項AI功能

    谷歌披露,Pixel 8 在配備 Gemini Nano 后,首先將增加兩大創新 AI 功能:其中之一是 Recorder 應用內新增 Summarize 功能,無網絡情況下可記錄并歸納更多關于對話、采訪和演示的有用信息。
    的頭像 發表于 03-29 15:46 ?165次閱讀

    百度將為國行iPhone16提供AI功能

    谷歌、OpenAI 等公司的AI 。 國行iPhone16搭載百度AI功能的話會不會是內置文心一言?當然這些詳細的信息還沒有辦法
    的頭像 發表于 03-25 16:23 ?487次閱讀

    火種AI|谷歌深夜炸彈!史上最強開源模型Gemma,打響新一輪AI之戰

    “全球性能最強大、輕量級”的新一代開源系列模型Gemma,瞬間打響AI開源戰爭。 據官方介紹,Gemma模型使用了和Gemini同源的技術,總共有20億參數和70億參數兩種規模,每個規模又分預訓練和指令微調兩個版本。 其中20億
    的頭像 發表于 02-23 10:21 ?170次閱讀
    新<b class='flag-5'>火種</b><b class='flag-5'>AI</b>|<b class='flag-5'>谷歌</b>深夜炸彈!史上最強開源模型Gemma,打響新一輪<b class='flag-5'>AI</b>之戰

    谷歌AI聊天機器人改名為Gemini

    谷歌(Google)近日宣布,旗下備受矚目的AI聊天機器人Bard正式更名為Gemini,并推出了一款功能更加強大的付費版本——Gemini Advanced。這一戰略調整旨在與微軟、
    的頭像 發表于 02-18 11:28 ?569次閱讀

    谷歌Gemini被曝夸大營銷?碾壓GPT4純靠“一張嘴”

    Gemini谷歌來說可能走了一大步,但對整個AI領域而言,并沒有說的那么夸張。
    的頭像 發表于 12-09 09:09 ?494次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b>被曝夸大營銷?碾壓GPT4純靠“一張嘴”

    火種AI|谷歌深夜發布復仇神器Gemini,原生多模態碾壓GPT-4?

    谷歌背水一戰,發布Gemini,狙擊GPT-4
    的頭像 發表于 12-08 09:09 ?795次閱讀
    新<b class='flag-5'>火種</b><b class='flag-5'>AI</b>|<b class='flag-5'>谷歌</b>深夜發布復仇神器<b class='flag-5'>Gemini</b>,原生多模態碾壓GPT-4?

    谷歌揭秘Gemini,AMD對峙英偉達

    今天,我們看到谷歌揭開了多模態AI模型Gemini的神秘面紗,AMD挑戰英偉達在AI芯片市場的霸主地位,微軟在英國AI領域的巨額投資,以及3
    的頭像 發表于 12-07 20:05 ?468次閱讀

    實測百度新文庫,AI重構最徹底的產品都有什么用?

    AI
    腦極體
    發布于 :2023年10月19日 09:09:22

    百度文心一言,率先向全社會開放

    官網”體驗。 據悉,百度還將開放一批經過全新重構的AI原生應用,讓廣大用戶充分體驗生成式AI的理解、生成、邏輯、記憶四大核心能力。 今年3月16日,文心一言開啟邀測。作為全球大廠中首個
    的頭像 發表于 09-04 10:50 ?667次閱讀

    文心一言率先全面開放 百度放大招

    文心一言率先全面開放 百度再放大招,文心一言率先全面開放。這是向全社會全面的開放。此外還有一些AI原生應用也會開放給用戶。 大家可以在應用商店下載“文心
    的頭像 發表于 08-31 12:57 ?580次閱讀

    訓練好的ai模型導入cubemx不成功怎么解決?

    訓練好的ai模型導入cubemx不成功咋辦,試了好幾個模型壓縮了也不行,ram占用過大,有無解決方案?
    發表于 08-04 09:16
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>