<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

谷歌Gemini被曝夸大營銷？碾壓GPT4純靠“一張嘴”

Gemini對谷歌來說可能走了一大步，但對整個AI領域而言，并沒有說的那么夸張。

涉嫌虛假宣傳，交互非實時感知

才短短一天時間，谷歌Gemini就被曝涉嫌造假，夸大宣傳。

作為谷歌用來應對GPT-4的“殺手锏”，Gemini一經亮相就有了兩個碩大的標簽：超過人類專家，碾壓GPT-4。隨便單拎一條出來，都是目前其他大模型所不能比擬的成績。

但也有越來越多的人開始質疑它的真實性，彭博社的Parmy Olsen就是第一個質疑視頻造假的人。

就在大家震驚于谷歌發布的6分鐘互動視頻里，他指出，Gemini所有交互都不是實時感知的，存在后期制作和剪輯配音的成分。隨后這一說法也得到了谷歌官方的證實，承認Gemini的確使用了靜態圖片和多段提示詞拼湊，才能達成這樣的效果。

簡單來說就是，Gemini不能直接看懂一段動作視頻，只能看懂多張圖片。像演示視頻里人類在玩石頭剪刀布，實際上是把“布”“拳頭”“剪刀”三張照片依次傳給Gemini，然后加上良好的提示詞，才能讓Gemini給出回答，然后再由員工配音念出來。

而且視頻中展示的許多其他功能并不是谷歌獨有的，GPT Plus3也可以做得到，沃頓商學院教授伊森·莫里克（Ethan Mollick）就用實驗證實了這一點。

雖然從技術原理上來看，能夠讀取圖片和能夠看懂視頻之間，并沒有技術上的鴻溝。但是從產品實現落地的角度看，把讀取圖片約等于能實時看懂視頻，過于強調實時性而壓縮了交互過程中的延遲，這幾乎已經可以理解為虛假宣傳。而是否需要良好的提示詞工程，更是評價模型能力的關鍵問題。

混淆跑分，GPT4測試標準不一致

從谷歌對Gemini的宣傳信息來看，它聲稱Gemini在32項標準性能指標中，有30 項指標都優于GPT-4，跑出90%的高分，超過GPT-4。但實際上，差距微乎其微，而且這種比較并不公平。

Gemini Ultra的90%得分是基于谷歌研究人員開發的一種基于32個樣本的思維鏈的方法。對于同一個問題，Gemini Ultra會生成32個答案以及這些答案的推理。然后，模型會選擇最常見的答案作為最終答案。

但GPT-4的86.4%分數是基于行業評估標準5-shot。HuggingFace技術主管Philipp Schmid特意從Gemini的技術報告中提取數據重做計算，在5-shot的標準下，Gemini的得分實為83.7%，比GPT-4更低。

也就是說只有CoT（思維鏈）達到32個例子時，Gemini Ultra才能達到90分超過GPT-4；當例子數量減少到5個，Gemini Ultra得分就不如GPT-4。難怪連谷歌公司高管在之前都回避了關于該模型比GPT-4 強多少的問題，因為它們只是“強”在了不同的標準上。

就像谷歌在5月份發布Palm-2的時候，也挑出了兩個優于GPT-4的指標，但是后來這個大模型怎么樣，大家都清楚。

斯坦福大學基礎模型研究中心主任 Percy Liang也談到，雖然Gemini有很好的基準分數，但由于不知道訓練數據的內容，因此很難解釋這些數據。華盛頓大學計算語言學教授 Emily Bender也指出，谷歌宣傳Gemini是一臺萬能機器，是一個可用于多種不同用途的通用模型。但是谷歌卻在使用狹隘的基準，來評估它期望用于這些不同用途的模型，這意味著它實際上無法得到徹底評估。

倉促上陣，只為趁OpenAI動蕩搞事？

今年3月，OpenAI發布GPT人工智能模型，并推出其支持的付費聊天AI機器人ChatGPT，這其實對谷歌來說壓力很大。

畢竟谷歌已經耗費了數年心血，在人工智能領域投入巨資研究，卻沒想到被半路殺出來的OpenAI彎道超車。

所以在4月，谷歌迫于投資方的巨大壓力，將負責人工智能研究的Google Brain，與母公司Alphabet位于倫敦的人工智能研究實驗室DeepMind合并，為了在今年接下來的時間里研發Gemini模型來回應GPT-4的挑戰。

而在兩周前，OpenAI剛剛重新任命了奧特曼為首席執行官，并任命了新的董事會成員，勉強給這家初創公司的一段動蕩期畫上了句號。這場內斗事件也促使一些客戶開始評估其他AI提供商，谷歌選擇在這個時間點推出Gemini的心思不言而喻。

據報道，當OpenAI董事會暫時罷免首席執行官奧特曼，使公司的未來發展受到質疑時，谷歌迅速發起了一場營銷活動，說服OpenAI企業客戶轉向谷歌?，F在，隨著Gemini的發布，谷歌也正是在利用這種不確定性。

然而，目前大多數人還是不能完整地體驗Gemini。最強大的對標GPT-4的滿血版Gemini Ultra，還需要等待幾個月才能和公眾見面。據谷歌高管的說法，預計將于明年初上市。而現在推出的版本是為谷歌基于文本的搜索聊天機器人Bard的后臺，為其提供更高級的推理、規劃和理解能力。

在接下來的幾個月里，新的Gemini增強版Bard會在170多個國家提供英語版本的首發，不包括歐盟和英國。谷歌負責Bard的副總裁Sissie Hsiao表示，這是因為公司需要與當地監管機構“接軌”。除此之外，Gemini還有一個名為Nano的版本，可以直接在設備上運行的，例如谷歌的新款Pixel手機。

谷歌VS OpenAI：瑜亮之爭鹿死誰手？

12月7日，隨著Gemini的高調發布，谷歌市值一晚就增加逾870億美元，增量相當于OpenAI的最新估值。就目前來說，未上市的OpenAI估值在800億至900億美元之間。

要知道，今年以來谷歌的股價已經上漲了逾50%，大幅跑贏了納斯達克綜合指數，但卻落后于一些科技同行，里面就包括OpenAI最大的投資方微軟。

事實上，谷歌在過去的發展歷史中已經吃過很多次苦頭，推出有缺陷的產品。這對公司發展來說，適得其反。就像今年2月為了應對ChatGPT急急忙忙推出的Bard，因為一次小小失誤就導致股價蒸發了高達1000億美元。

哪怕是5月，谷歌宣布在大部分產品中植入生成型人工智能，比如谷歌郵箱和其他軟件，試圖用這個舉動改變市場的看法，但效果卻微乎其微。這也讓谷歌深刻認識到，推出有缺陷的產品帶來的反噬。

但在科技行業，只要足夠強大就足以搶占市場。早期的手機霸主諾基亞和黑莓就經歷過慘痛教訓，蘋果用功能更強大、更直觀的iPhone搶走了它們的市場。在軟件領域，商業上的成功往往來自于性能最好的系統。

幾乎可以肯定的是，隨著Gemini的發布，谷歌或許有望逐漸扭轉那些不利的局面。摩根大通分析師就表示，“谷歌開始通過結合 Gemini的不同模型版本，來解決投資者對生成式人工智能創新和GenAI模型運行成本過高的擔憂?！?/p>

不過如果Gemini Ultra真如谷歌所說那樣在明年1月初發布，那么在頂級人工智能模型的頭部就呆不了太久時間。畢竟在谷歌努力追趕OpenAI的過程中，后者有將近一年的時間來開發新一代人工智能模型GPT-5。

但有一點不能否認，谷歌和OpenAI的這場對決，已是箭在弦上。

審核編輯：劉清

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

谷歌

谷歌

+關注

關注
27

文章
6003

瀏覽量
103509
Gemini

Gemini

+關注

關注
0

文章
47

瀏覽量
7496
人工智能

人工智能

+關注

關注
1781

文章
44782

瀏覽量
231942
GPT

GPT

+關注

關注
0

文章
330

瀏覽量
15072
OpenAI

OpenAI

+關注

關注
9

文章
900

瀏覽量
6035

評論

相關推薦

谷歌發布史上最強大模型Gemini，全方位領先GPT-4，MMLU基準達人類專家水平

電子發燒友網報道（文/吳子鵬）美國當地時間周三，谷歌發布了其新一代人工智能模型Gemini（雙子星）。谷歌CEO桑達爾?皮查伊和Deepmind CEO戴密斯·哈薩比斯在谷歌官網聯名發

的頭像

發表于 12-08 00:11 ?2858次閱讀

<b class='flag-5'>谷歌</b>發布史上最強大模型<b class='flag-5'>Gemini</b>，全方位領先<b class='flag-5'>GPT</b>-4，MMLU基準達人類專家水平

谷歌Gmail將支持Gemini總結電子郵件內容

谷歌透露，Gemini 將協助 Workspace 和 Google One AI Premium 的用戶理解和處理電子郵件內容。用戶可通過移動應用和網頁版 Gmail 使用 Gemini

的頭像

發表于 05-15 11:11 ?189次閱讀

股價久違飆漲，商湯要用自己的Scaling law挑戰GPT4

前一天的“2024年商湯技術交流日”上，商湯發布了對標GPT4-Turbo的大模型日日新大模型SenseNova5.0，追趕GPT4可能是當下中國大模型行業的集體目

的頭像

發表于 05-08 08:05 ?220次閱讀

股價久違飆漲，商湯要用自己的Scaling law挑戰<b class='flag-5'>GPT4</b>

幫忙畫一張詳細的電路圖,謝謝

能幫忙畫一張詳細的電路圖嗎，謝謝了。因為涉及到外部鏈接，怕被誤會發廣告，所以詳細的需求放在附件里面了 *附件：幫忙謝謝.rar

發表于 05-04 22:59

谷歌Gemini 1.5深夜爆炸上線，史詩級多模態硬剛GPT-5！最強MoE首破100萬極限上下文紀錄

我們經歷了LLM劃時代的一夜。GeminiUltra發布還沒幾天，Gemini1.5就來了。卯足勁和OpenAI微軟一較高下的谷歌，開始進入了高產模式。自家最強的Gemini1.0Ultra才發布

的頭像

發表于 02-19 12:28 ?528次閱讀

<b class='flag-5'>谷歌</b><b class='flag-5'>Gemini</b> 1.5深夜爆炸上線，史詩級多模態硬剛<b class='flag-5'>GPT</b>-5！最強MoE首破100萬極限上下文紀錄

Gemini和ChatGPT有什么不同，Gemini將超越ChatGPT？

Gemini Ultra是首個在MMLU測評上超過人類專家的大模型，取得90.0%的成績。作為對比，人類專家的成績為89.8%，GPT-4為86.4%。

發表于 12-20 11:45 ?339次閱讀

<b class='flag-5'>Gemini</b>和ChatGPT有什么不同，<b class='flag-5'>Gemini</b>將超越ChatGPT？

谷歌推出Gemini 希望擊敗GPT-4

Gemini不僅僅是一個單一的人工智能模型。有一個簡單版本叫Gemini Nano，旨在在安卓設備上離線運行。有一個更強大的版本叫Gemini Pro，很快將為谷歌的許多人工智能服務提

的頭像

發表于 12-14 17:30 ?539次閱讀

谷歌聲稱Gemini超越GPT-4，你有何看法呢？

誰能想到，一夜之間，人們對于谷歌 Gemini 的看法竟發生了 180° 轉變。

的頭像

發表于 12-14 09:54 ?339次閱讀

<b class='flag-5'>谷歌</b>聲稱<b class='flag-5'>Gemini</b>超越<b class='flag-5'>GPT</b>-4，你有何看法呢？

成都匯陽投資關于谷歌攜 Gemini 王者歸來，AI 算力和應用值得期待

【Gemini 大模型主打多模態，性能對標GPT-4】當地時間12月6日，谷歌公司宣布推出其規模最大、功能最強的多模態大模型 Gemini, 其最強大的 TPU (張量處理單元)系

的頭像

發表于 12-11 14:40 ?684次閱讀

成都匯陽投資關于<b class='flag-5'>谷歌</b>攜 <b class='flag-5'>Gemini</b> 王者歸來，AI 算力和應用值得期待

新火種AI|谷歌深夜發布復仇神器Gemini，原生多模態碾壓GPT-4？

谷歌背水一戰，發布Gemini，狙擊GPT-4

的頭像

發表于 12-08 09:09 ?853次閱讀

新火種AI|<b class='flag-5'>谷歌</b>深夜發布復仇神器<b class='flag-5'>Gemini</b>，原生多模態<b class='flag-5'>碾壓</b><b class='flag-5'>GPT</b>-4？

谷歌Gemini被曝算力達GPT-4五倍，手握TPU王牌碾壓OpenAI

根據Patel和Nishball的說法，此前屢屢被爆料將成為GPT-4大殺器的谷歌Gemini，已經開始在新的TPUv5 Pod上進行訓練了，算力高達~1e26 FLOPS，比訓練GPT

發表于 09-04 16:02 ?662次閱讀

chatGPT和GPT4有什么區別

chatGPT和GPT4有什么區別 GPT（Generative Pre-trained Transformer）系列模型由OpenAI公司開發，是一組用于自然語言處理（NLP）任務的人工智能模型

發表于 08-09 15:18 ?2251次閱讀

你考慮用GPT4搞電機嗎？

最近的GPT4有多火這里不需要贅述了。微軟，蘋果，baidu等各巨頭紛紛跟進。這個賽道最近是各種資本涌入，猶如PC互聯網轉型到移動互聯網時的爆發。

發表于 07-05 09:16 ?246次閱讀

GPT-4創造力竟全面碾壓人類！最新創造力測試GPT4排名前1%

來源：新智元最近，一項有關GPT-4的創造力思維測試火了。來自蒙大拿大學和UMWestern大學的研究團隊發現，GPT-4在Torrance創造性思維測試（TTCT）中的得分直接排在了前1%。不管是

發表于 06-26 10:06 ?408次閱讀

GPT-4創造力竟全面碾壓人類！最新創造力測試GPT4排名前1%

來源：新智元最近，一項有關GPT-4的創造力思維測試火了。來自蒙大拿大學和UM Western大學的研究團隊發現，GPT-4在Torrance創造性思維測試（TTCT）中的得分直接排在

發表于 06-25 10:35 ?294次閱讀

新火種
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 新火種AI|Kimi概念股火了，這家估值180億的AI公司什么來頭？
Hot OpenAI宣戰AGI？GPT-5全面超越GPT-4，核聚變成最大王牌

New 新火種AI|蘋果終于邁進了AI時代，是創新還是救贖？
New 新火種AI|超越蘋果成為市值第二大公司！英偉達的時代已然來臨...

精選推薦
更多

文章

資料

帖子

RL78/F24 CANFD參考例程

瑞薩MCU小百科
1小時前

117 閱讀

如何移植libwebsockets

ElfBoard
3小時前

146 閱讀

使用理想二極管控制器的汽車應用冗余電源拓撲

德州儀器
5小時前

274 閱讀

電力電子中的電大、電小尺寸？

英飛凌工業半導體
2天前

214 閱讀

PSpice學習筆記 - TI器件模型導入

工程師看海
2小時前

139 閱讀

開發工程師所需STM32資料集錦（一）

Duke
29.36 MB

免費

534下載

從零開始寫RISC-V處理器

5.43 MB

免費

96下載

Freeboard物聯網監控

王浩
1.39 MB

2積分

2下載

Stampie Email服務

fejlkel
0.02 MB

2積分

2下載

frpc高性能RPC庫

楊平
0.02 MB

2積分

1下載

為什么我的電源會出現振鈴和過熱？

久醉不醒
17小時前

117 閱讀

無線鼠標主板，可以自己照著做嗎？

angel725
1天前

366 閱讀

【Vision Board創客營連載體驗】基于Vision Board的垃圾分類

大菠蘿Alpha
1天前

187 閱讀

【Vision Board創客營連載體驗】使用 Vision Board 做一個 UVC Camera

ouxiaolong
2天前

185 閱讀

【Vision Board創客營連載體驗】TinyMaix進行手寫數字識別

ouxiaolong
2天前

497 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看