<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌Gemini被曝夸大營銷?碾壓GPT4純靠“一張嘴”

新火種 ? 來源:新火種 ? 作者:新火種 ? 2023-12-09 09:09 ? 次閱讀

Gemini對谷歌來說可能走了一大步,但對整個AI領域而言,并沒有說的那么夸張。

涉嫌虛假宣傳,交互非實時感知

才短短一天時間,谷歌Gemini就被曝涉嫌造假,夸大宣傳。

作為谷歌用來應對GPT-4的“殺手锏”,Gemini一經亮相就有了兩個碩大的標簽:超過人類專家,碾壓GPT-4。隨便單拎一條出來,都是目前其他大模型所不能比擬的成績。

但也有越來越多的人開始質疑它的真實性,彭博社的Parmy Olsen就是第一個質疑視頻造假的人。

wKgZomVzEneAXXjZAAVz8X4uiIk237.jpg

就在大家震驚于谷歌發布的6分鐘互動視頻里,他指出,Gemini所有交互都不是實時感知的,存在后期制作和剪輯配音的成分。隨后這一說法也得到了谷歌官方的證實,承認Gemini的確使用了靜態圖片和多段提示詞拼湊,才能達成這樣的效果。

簡單來說就是,Gemini不能直接看懂一段動作視頻,只能看懂多張圖片。像演示視頻里人類在玩石頭剪刀布,實際上是把“布”“拳頭”“剪刀”三張照片依次傳給Gemini,然后加上良好的提示詞,才能讓Gemini給出回答,然后再由員工配音念出來。

wKgaomVzEneAV8QDAAO13Fe4PyA903.jpg

而且視頻中展示的許多其他功能并不是谷歌獨有的,GPT Plus3也可以做得到,沃頓商學院教授伊森·莫里克(Ethan Mollick)就用實驗證實了這一點。

雖然從技術原理上來看,能夠讀取圖片和能夠看懂視頻之間,并沒有技術上的鴻溝。但是從產品實現落地的角度看,把讀取圖片約等于能實時看懂視頻,過于強調實時性而壓縮了交互過程中的延遲,這幾乎已經可以理解為虛假宣傳。而是否需要良好的提示詞工程,更是評價模型能力的關鍵問題。

混淆跑分,GPT4測試標準不一致

從谷歌對Gemini的宣傳信息來看,它聲稱Gemini在32項標準性能指標中,有30 項指標都優于GPT-4,跑出90%的高分,超過GPT-4。但實際上,差距微乎其微,而且這種比較并不公平。

Gemini Ultra的90%得分是基于谷歌研究人員開發的一種基于32個樣本的思維鏈的方法。對于同一個問題,Gemini Ultra會生成32個答案以及這些答案的推理。然后,模型會選擇最常見的答案作為最終答案。

wKgZomVzEniAQXv7AAD_QaiUz00699.jpg

但GPT-4的86.4%分數是基于行業評估標準5-shot。HuggingFace技術主管Philipp Schmid特意從Gemini的技術報告中提取數據重做計算,在5-shot的標準下,Gemini的得分實為83.7%,比GPT-4更低。

wKgaomVzEniAay9kAAT7Sd3k3Ts400.jpg

也就是說只有CoT(思維鏈)達到32個例子時,Gemini Ultra才能達到90分超過GPT-4;當例子數量減少到5個,Gemini Ultra得分就不如GPT-4。難怪連谷歌公司高管在之前都回避了關于該模型比GPT-4 強多少的問題,因為它們只是“強”在了不同的標準上。

就像谷歌在5月份發布Palm-2的時候,也挑出了兩個優于GPT-4的指標,但是后來這個大模型怎么樣,大家都清楚。

斯坦福大學基礎模型研究中心主任 Percy Liang也談到,雖然Gemini有很好的基準分數,但由于不知道訓練數據的內容,因此很難解釋這些數據。華盛頓大學計算語言學教授 Emily Bender也指出,谷歌宣傳Gemini是一臺萬能機器,是一個可用于多種不同用途的通用模型。但是谷歌卻在使用狹隘的基準,來評估它期望用于這些不同用途的模型,這意味著它實際上無法得到徹底評估。

倉促上陣,只為趁OpenAI動蕩搞事?

今年3月,OpenAI發布GPT人工智能模型,并推出其支持的付費聊天AI機器人ChatGPT,這其實對谷歌來說壓力很大。

畢竟谷歌已經耗費了數年心血,在人工智能領域投入巨資研究,卻沒想到被半路殺出來的OpenAI彎道超車。

所以在4月,谷歌迫于投資方的巨大壓力,將負責人工智能研究的Google Brain,與母公司Alphabet位于倫敦的人工智能研究實驗室DeepMind合并,為了在今年接下來的時間里研發Gemini模型來回應GPT-4的挑戰。

而在兩周前,OpenAI剛剛重新任命了奧特曼為首席執行官,并任命了新的董事會成員,勉強給這家初創公司的一段動蕩期畫上了句號。這場內斗事件也促使一些客戶開始評估其他AI提供商,谷歌選擇在這個時間點推出Gemini的心思不言而喻。

據報道,當OpenAI董事會暫時罷免首席執行官奧特曼,使公司的未來發展受到質疑時,谷歌迅速發起了一場營銷活動,說服OpenAI企業客戶轉向谷歌?,F在,隨著Gemini的發布,谷歌也正是在利用這種不確定性。

然而,目前大多數人還是不能完整地體驗Gemini。最強大的對標GPT-4的滿血版Gemini Ultra,還需要等待幾個月才能和公眾見面。據谷歌高管的說法,預計將于明年初上市。而現在推出的版本是為谷歌基于文本的搜索聊天機器人Bard的后臺,為其提供更高級的推理、規劃和理解能力。

在接下來的幾個月里,新的Gemini增強版Bard會在170多個國家提供英語版本的首發,不包括歐盟和英國。谷歌負責Bard的副總裁Sissie Hsiao表示,這是因為公司需要與當地監管機構“接軌”。除此之外,Gemini還有一個名為Nano的版本,可以直接在設備上運行的,例如谷歌的新款Pixel手機。

谷歌VS OpenAI:瑜亮之爭鹿死誰手?

12月7日,隨著Gemini的高調發布,谷歌市值一晚就增加逾870億美元,增量相當于OpenAI的最新估值。就目前來說,未上市的OpenAI估值在800億至900億美元之間。

要知道,今年以來谷歌的股價已經上漲了逾50%,大幅跑贏了納斯達克綜合指數,但卻落后于一些科技同行,里面就包括OpenAI最大的投資方微軟。

事實上,谷歌在過去的發展歷史中已經吃過很多次苦頭,推出有缺陷的產品。這對公司發展來說,適得其反。就像今年2月為了應對ChatGPT急急忙忙推出的Bard,因為一次小小失誤就導致股價蒸發了高達1000億美元。

wKgZomVzEnqAdrotAADFpBReZXw314.jpg

哪怕是5月,谷歌宣布在大部分產品中植入生成型人工智能,比如谷歌郵箱和其他軟件,試圖用這個舉動改變市場的看法,但效果卻微乎其微。這也讓谷歌深刻認識到,推出有缺陷的產品帶來的反噬。

但在科技行業,只要足夠強大就足以搶占市場。早期的手機霸主諾基亞和黑莓就經歷過慘痛教訓,蘋果用功能更強大、更直觀的iPhone搶走了它們的市場。在軟件領域,商業上的成功往往來自于性能最好的系統。

幾乎可以肯定的是,隨著Gemini的發布,谷歌或許有望逐漸扭轉那些不利的局面。摩根大通分析師就表示,“谷歌開始通過結合 Gemini的不同模型版本,來解決投資者對生成式人工智能創新和GenAI模型運行成本過高的擔憂?!?/p>

不過如果Gemini Ultra真如谷歌所說那樣在明年1月初發布,那么在頂級人工智能模型的頭部就呆不了太久時間。畢竟在谷歌努力追趕OpenAI的過程中,后者有將近一年的時間來開發新一代人工智能模型GPT-5。

但有一點不能否認,谷歌和OpenAI的這場對決,已是箭在弦上。

審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6003

    瀏覽量

    103509
  • Gemini
    +關注

    關注

    0

    文章

    47

    瀏覽量

    7496
  • 人工智能
    +關注

    關注

    1781

    文章

    44782

    瀏覽量

    231942
  • GPT
    GPT
    +關注

    關注

    0

    文章

    330

    瀏覽量

    15072
  • OpenAI
    +關注

    關注

    9

    文章

    900

    瀏覽量

    6035
收藏 人收藏

    評論

    相關推薦

    谷歌發布史上最強大模型Gemini,全方位領先GPT-4,MMLU基準達人類專家水平

    電子發燒友網報道(文/吳子鵬)美國當地時間周三,谷歌發布了其新一代人工智能模型Gemini(雙子星)。谷歌CEO桑達爾?皮查伊和Deepmind CEO戴密斯·哈薩比斯在谷歌官網聯名發
    的頭像 發表于 12-08 00:11 ?2858次閱讀
    <b class='flag-5'>谷歌</b>發布史上最強大模型<b class='flag-5'>Gemini</b>,全方位領先<b class='flag-5'>GPT</b>-4,MMLU基準達人類專家水平

    谷歌Gmail將支持Gemini總結電子郵件內容

    谷歌透露,Gemini 將協助 Workspace 和 Google One AI Premium 的用戶理解和處理電子郵件內容。用戶可通過移動應用和網頁版 Gmail 使用 Gemini
    的頭像 發表于 05-15 11:11 ?189次閱讀

    股價久違飆漲,商湯要用自己的Scaling law挑戰GPT4

    前一天的“2024年商湯技術交流日”上,商湯發布了對標GPT4-Turbo的大模型日日新大模型SenseNova5.0,追趕GPT4可能是當下中國大模型行業的集體目
    的頭像 發表于 05-08 08:05 ?220次閱讀
    股價久違飆漲,商湯要用自己的Scaling law挑戰<b class='flag-5'>GPT4</b>

    幫忙畫一張詳細的電路圖,謝謝

    能幫忙畫一張詳細的電路圖嗎,謝謝了。因為涉及到外部鏈接,怕誤會發廣告,所以詳細的需求放在附件里面了 *附件:幫忙謝謝.rar
    發表于 05-04 22:59

    谷歌Gemini 1.5深夜爆炸上線,史詩級多模態硬剛GPT-5!最強MoE首破100萬極限上下文紀錄

    我們經歷了LLM劃時代的一夜。GeminiUltra發布還沒幾天,Gemini1.5就來了。卯足勁和OpenAI微軟一較高下的谷歌,開始進入了高產模式。自家最強的Gemini1.0Ultra才發布
    的頭像 發表于 02-19 12:28 ?528次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b> 1.5深夜爆炸上線,史詩級多模態硬剛<b class='flag-5'>GPT</b>-5!最強MoE首破100萬極限上下文紀錄

    Gemini和ChatGPT有什么不同,Gemini將超越ChatGPT?

    Gemini Ultra是首個在MMLU測評上超過人類專家的大模型,取得90.0%的成績。作為對比,人類專家的成績為89.8%,GPT-4為86.4%。
    發表于 12-20 11:45 ?339次閱讀
    <b class='flag-5'>Gemini</b>和ChatGPT有什么不同,<b class='flag-5'>Gemini</b>將超越ChatGPT?

    谷歌推出Gemini 希望擊敗GPT-4

    Gemini不僅僅是一個單一的人工智能模型。有一個簡單版本叫Gemini Nano,旨在在安卓設備上離線運行。有一個更強大的版本叫Gemini Pro,很快將為谷歌的許多人工智能服務提
    的頭像 發表于 12-14 17:30 ?539次閱讀

    谷歌聲稱Gemini超越GPT-4,你有何看法呢?

    誰能想到,一夜之間,人們對于谷歌 Gemini 的看法竟發生了 180° 轉變。
    的頭像 發表于 12-14 09:54 ?339次閱讀
    <b class='flag-5'>谷歌</b>聲稱<b class='flag-5'>Gemini</b>超越<b class='flag-5'>GPT</b>-4,你有何看法呢?

    成都匯陽投資關于谷歌Gemini 王者歸來,AI 算力和應用值得期待

    Gemini 大模型主打多模態,性能對標GPT-4】 當地時間12月6日, 谷歌公司宣布推出其規模最大、功能最強的多模態大模型 Gemini, 其最強大的 TPU (張量處理單元)系
    的頭像 發表于 12-11 14:40 ?684次閱讀
    成都匯陽投資關于<b class='flag-5'>谷歌</b>攜 <b class='flag-5'>Gemini</b> 王者歸來,AI 算力和應用值得期待

    新火種AI|谷歌深夜發布復仇神器Gemini,原生多模態碾壓GPT-4?

    谷歌背水一戰,發布Gemini,狙擊GPT-4
    的頭像 發表于 12-08 09:09 ?853次閱讀
    新火種AI|<b class='flag-5'>谷歌</b>深夜發布復仇神器<b class='flag-5'>Gemini</b>,原生多模態<b class='flag-5'>碾壓</b><b class='flag-5'>GPT</b>-4?

    谷歌Gemini被曝算力達GPT-4五倍,手握TPU王牌碾壓OpenAI

    根據Patel和Nishball的說法,此前屢屢被爆料將成為GPT-4大殺器的谷歌Gemini,已經開始在新的TPUv5 Pod上進行訓練了,算力高達~1e26 FLOPS,比訓練GPT
    的頭像 發表于 09-04 16:02 ?662次閱讀
    <b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b>被曝算力達<b class='flag-5'>GPT</b>-4五倍,手握TPU王牌<b class='flag-5'>碾壓</b>OpenAI

    chatGPT和GPT4有什么區別

    chatGPT和GPT4有什么區別 GPT(Generative Pre-trained Transformer)系列模型由OpenAI公司開發,是一組用于自然語言處理(NLP)任務的人工智能模型
    的頭像 發表于 08-09 15:18 ?2251次閱讀

    你考慮用GPT4搞電機嗎?

    最近的GPT4有多火這里不需要贅述了。微軟,蘋果,baidu等各巨頭紛紛跟進。這個賽道最近是各種資本涌入,猶如PC互聯網轉型到移動互聯網時的爆發。
    發表于 07-05 09:16 ?246次閱讀
    你考慮用<b class='flag-5'>GPT4</b>搞電機嗎?

    GPT-4創造力竟全面碾壓人類!最新創造力測試GPT4排名前1%

    來源:新智元最近,一項有關GPT-4的創造力思維測試火了。來自蒙大拿大學和UMWestern大學的研究團隊發現,GPT-4在Torrance創造性思維測試(TTCT)中的得分直接排在了前1%。不管是
    的頭像 發表于 06-26 10:06 ?408次閱讀
    <b class='flag-5'>GPT</b>-4創造力竟全面<b class='flag-5'>碾壓</b>人類!最新創造力測試<b class='flag-5'>GPT4</b>排名前1%

    GPT-4創造力竟全面碾壓人類!最新創造力測試GPT4排名前1%

    來源:新智元 最近,一項有關GPT-4的創造力思維測試火了。 來自蒙大拿大學和UM Western大學的研究團隊發現,GPT-4在Torrance創造性思維測試(TTCT)中的得分直接排在
    的頭像 發表于 06-25 10:35 ?294次閱讀
    <b class='flag-5'>GPT</b>-4創造力竟全面<b class='flag-5'>碾壓</b>人類!最新創造力測試<b class='flag-5'>GPT4</b>排名前1%
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>