<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

OpenAI又打出王炸！一句話生成60秒視頻，馬斯克：人類認輸吧

電子發燒友網報道（文/梁浩斌）在大年初七，春節假期的尾聲，OpenAI突然發布的AI文字生成視頻模型Sora被全網刷屏，馬斯克甚至感嘆“gg Humans”（gg是good game的縮寫，在競技游戲中原意為稱贊對方打得不錯，但目前主流的含義是代表認輸退出）。

文字生成視頻的AI模型其實之前也有不少，比如去年11月美國AI初創公司Pika Labs發布的Pika 1.0；去年Runway推出了文生視頻模型Gen-1，并完成了兩次迭代；還有谷歌團隊發布的視頻生成模型VideoPoet。但問題在于，此前市面上的文生視頻模型只能生成數秒，最高十多秒的視頻。而Sora一上來就是60秒的視頻長度，且生成視頻的細節、質量幾乎“秒殺”其他文生視頻模型，這足以顛覆目前的視頻生成模型初創公司的格局。

視頻生成質量炸裂，好萊塢時代要結束了？

Sora生成的視頻效果有多強？下面是OpenAI在官網展示的第一個視頻，也是最能夠表現Sora實力的視頻。

這個視頻的提示詞為“一位時尚女士走在東京的街道上，街道上充滿了溫暖的霓虹燈和動畫城市標志。她穿著黑色皮夾克、紅色長裙和黑色靴子，拿著一個黑色錢包。她戴著太陽鏡，涂著紅色口紅。她走路自信而隨意。街道潮濕且反光，形成了五顏六色燈光的鏡面效果。許多行人四處走動?！?br />
從視頻中，無論是運鏡還是人物、地面、背景的細節，還有拉進鏡頭后人物面部上的皺紋、毛發、墨鏡上的反光，都幾乎可以以假亂真，畫面穩定不錯位。在長達60秒的視頻里，畫面隨鏡頭的大幅度運動并沒有出現錯位的情況，整體風格保持了驚人的一致性。

在復雜場景方面，另一個演示視頻同樣展現了Sora的炸裂效果。下面這個視頻使用的提示詞為：“一段美麗的自制視頻展示了2056年尼日利亞拉各斯的人們。用手機相機拍攝?！?br />
同樣是運鏡幅度巨大的場景，同時背景有大量的人物。在以往的文生圖模型中，類似這種背景有人群的圖片都會產生很多錯位，很容易看出AI的痕跡，而在Sora生成的這個視頻里，背景人群不仔細看很難發現有錯誤，特別是在動態的視頻當中。另一方面在視頻后半段的人物近景里，大幅度運動的鏡頭同樣沒有對人物造成影響，畫面細節極為穩定。

Sora生成視頻的穩定，不止于單鏡頭的運動，即使是多鏡頭的畫面切換中，依然能夠保持色彩、畫面風格的一致

除了真實場景之外，Sora還能以動畫風格生成視頻。比如使用提示詞：“動畫場景特寫了一個跪在融化的紅燭旁的毛茸茸的小怪物。藝術風格是3D和現實主義的，重點是照明和紋理。這幅畫的基調是驚奇和好奇，因為怪物睜大眼睛張著嘴凝視著火焰。它的姿勢和表情傳達出一種天真和頑皮的感覺，就好像它是第一次探索周圍的世界。暖色和戲劇性燈光的使用進一步增強了圖像的舒適氛圍?！?br />

生成出的動畫形象與皮克斯電影幾乎不相上下，此前在動畫電影中大費周章渲染出的毛發，如今AI直接一鍵生成！難怪會有網友表示“好萊塢的時代要結束了”。

有博主將Sora跟Pika、Runway、Stable Video等幾個模型進行對比，對其輸入同樣的提示詞：“美麗、多雪的東京城熙熙攘攘。鏡頭穿過熙熙攘攘的城市街道，跟隨幾個享受美麗的下雪天氣和在附近攤位購物的人。絢麗的櫻花花瓣隨著雪花隨風飛舞?！?br />
結果Sora生成的視頻無論是時間長度、還是運鏡、畫面細節，都完勝其他幾個模型生成出的視頻。比如Pika和Runway生成的視頻在短短幾秒時間里都只有固定鏡頭畫面，Stable Video有鏡頭移動的變化，但時長太短。

Sora還未完美，OpenAI揭秘背后技術

目前Sora還未對大眾開放，OpenAI表示Sora正在面向部分用戶開放，以評估關鍵領域的潛在危害或風險。同時，OpenAI也邀請了一批視覺藝術家、設計師和電影制作人加入以推動模型的發展。

當然，在驚艷的演示視頻外，Sora的視頻生成也并非完美。OpenAI也表示，目前的模型可能難以準確模擬復雜場景的物理特性，也可能不理解因果關系的具體實例，比如一個人咬了一口餅干，餅干上可能沒有咬痕。Sora生成的視頻還可能混淆提示詞中關于空間的細節（比如左右），并且難以準確描述隨時間發生的事件，比如跟隨特定的鏡頭軌跡等。

比如上面動圖中所使用的提示詞為“五只灰狼崽在一條偏僻的碎石路上嬉戲追逐，周圍都是草地。小狗們奔跑跳躍，相互追逐，相互撕咬，嬉戲玩?！?，但實際畫面中灰狼數量出錯，并且部分是憑空出現又憑空消失，出現身體互相重疊等現象。

對于Sora背后使用的技術，OpenAI在官網上發布了一篇報告進行了介紹，但只提到了方便大模型進行訓練的數據處理方式和對Sora局限性的評價，沒有太多技術細節。

根據介紹，Sora是一種diffusion模型，它從一個看起來像靜態噪聲的視頻開始生成視頻，并通過多個步驟去除噪聲來逐漸轉換視頻。與GPT相似，Sora算法層面也采用了transformer，以釋放出強大的擴展性能。

OpenAI表示，Sora是以過于公司對DALL·E和GPT模型的研究作為基礎，使用了DALL·E 3中的重新標注技術。通過用一個能夠生成詳細描述的標注模型，為訓練集中的所有視頻生成詳細的文字說明，這能夠提高文字準確性的同時，還能提升視頻的整體質量。

與DALL·E 3類似，OpenAI也使用了GPT將簡短的用戶提示詞轉換為更詳細的文本，所以Sora能夠準確理解用戶提示，并生成對應視頻。

另外，OpenAI還透露了Sora的其他能力，包括接受圖像和文本說明輸出視頻、能夠以時間線向前或向后擴展視頻、生成圖像、改變視頻風格和環境、無縫連接兩個不同視頻等等。

業界大佬評價：“真的非常?！薄爸忻繟I差距進一步拉大”

Sora的“刷屏”，引起了多位業內大佬的關注。前阿里技術副總裁賈揚清也感嘆“Sora真的非常?！?，并認為對標OpenAI的公司有一波被其他大廠因為害怕錯過AI而收購相關公司的機會。對于其他算法小廠，賈揚清建議“要不就算法上媲美OpenAI，要不就垂直領域深耕應用，要不就開源”，最后他預言AI infra（AI基礎設施）的需求會繼續猛增。

360董事長周鴻祎則回應了如何看待Sora的問題，他認為科技競爭最終比拼的是讓人才密度和深厚積累，“很多人說 Sora的效果吊打Pika和Runway。這很正常，和創業者團隊比，OpenAl 這種有核心技術的公司實力還是非常強勁的。有人認為有了AI以后創業公司只需要做個體戶就行，實際今天再次證明這種想法是非?？尚Φ??！?br />
周鴻祎還表示，AI不一定那么快顛覆所有行業，但它能激發更多人的創作力。關于國內外的AI大模型差距，周鴻祎認為國內大模型發展距離GPT-4.0還有一年半的差距，并且相信OpenAl手里應該還藏著一些秘密武器?！皧W特曼是個營銷大師，知道怎樣掌握節奏，他們手里的武器并沒有全拿出來。這樣看來中國跟美國的AI差距可能還在加大?！?br />
關于大模型本身，周鴻祎對Sora理解為OpenAl利用它的大語言模型優勢，把LLM和 Diffusion結合起來訓練，讓Sora實現了對現實世界的理解和對世界的模擬兩層能力，這樣產生的視頻才是真實的，才能跳出2D的范圍模擬真實的物理世界。而得益于大量視頻的訓練，周鴻祎認為AI對世界的理解將遠超文字學習，可能未來一到兩年就能實現AGI（通用人工智能）。

而作為去年年底爆火的AI視頻生成初創公司Pika創始人，郭文景將Sora的發布視為動力，表示“我們覺得這是一個很振奮人心的消息，我們已經在籌備直接沖，將直接對標 Sora?！?br />

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
26659

瀏覽量
264327
算力

算力

+關注

關注
1

文章
675

瀏覽量
14390
OpenAI

OpenAI

+關注

關注
8

文章
815

瀏覽量
5944
大模型

大模型

+關注

關注
2

文章
1627

瀏覽量
1242

評論

相關推薦

文生視頻Pika 1.0爆火！一句話生成視頻，普通人也能當“導演”

幾乎不需要任何門檻，用戶只需要輸入一句話，就可以生成想要的各種風格的視頻，并通過簡單的描述，更改視頻中的形象和風格。 ? Pika labs官方宣傳

發表于 12-01 01:08 ?3032次閱讀

馬斯克指責OpenAI背離初衷，OpenAI否認并予以回應

身為多家知名企業如特斯拉、SpaceX以及社交網絡平臺X的創始人，馬斯克早在2015年OpenAI創立之初便同薩姆·奧爾特曼聯手合作。然而自2018年退出公司之后，馬斯克開始對OpenAI

發表于 03-07 09:43 ?242次閱讀

OpenAI回應馬斯克起訴：營利性條款存在分歧

文章指出，致力于非盈利活動的OpenAI，共從馬斯克處募資不足4500萬美元（約合人民幣3.24億元），自其他捐贈者處募得9000余萬美元（約合人民幣6.48億元）。

發表于 03-06 12:01 ?183次閱讀

新火種AI|馬斯克OpenAI開戰！神秘Q星細節曝光，GPT-5被迫延遲？

OpenAI的聯合創始人和總裁Greg Brockman告上了法庭。這對于風頭正盛的OpenAI來說，無異于一枚“深水炸彈”。在馬斯克的訴狀里，他重點提及當年OpenAI與其簽訂的

發表于 03-05 21:13 ?226次閱讀

馬斯克狀告OpenAI，OpenAI回應馬斯克訴訟

馬斯克在長達46頁、1.4萬字的訴訟文件中，控訴OpenAI背離了其初衷——即致力于開發開源人工通用智能（AGI）并服務全人類。

發表于 03-04 15:33 ?530次閱讀

馬斯克控告OpenAI違約、要求恢復開源；OpenAI否認三連

2024年3月1日，特斯拉CEO埃隆·馬斯克 (Elon Musk) 向美國舊金山高等法院提起訴訟，起訴OpenAI和該公司CEO山姆·阿爾特曼 (Sam Altman) ，OpenAI聯合創始人

發表于 03-04 13:59 ?273次閱讀

馬斯克:AI發展速度前所未見但馬斯克起訴OpenAI及其創始人

馬斯克：AI發展速度前所未見? 現在市場上對于任何OpenAI的消息都非常敏感，我們分享一下馬斯克對OpenAI起訴的一些事項。 馬斯克在日

發表于 03-02 15:29 ?1036次閱讀

馬斯克稱特斯拉視頻生成技術超過Sora

特斯拉CEO埃隆·馬斯克在社交媒體平臺上發表言論，聲稱特斯拉所掌握的視頻生成技術超越了OpenAI最新發布的Sora模型。馬斯克自信地表示，特斯拉在這一領域的技術實力堪稱全球頂尖，甚至

發表于 02-20 14:16 ?269次閱讀

Sora助推OpenAI估值飆升275%

近日，人工智能領域的領軍企業OpenAI發布了其首個文生視頻模型——Sora。這款模型具備令人驚嘆的能力：用戶只需通過一句話，便能生成長達1分鐘的高清

發表于 02-20 14:12 ?215次閱讀

埃隆·馬斯克拒絕OpenAI股份，質疑其合規性

早前于2015年，馬斯克協助創辦、贊助并招攬重要人才到OpenAI這一非營利機構，然而在2018年的內部紛爭后，與其分道揚鑣退出董事局。OPENAI為獲取更多融資及算力支持，2018年后轉為商業化模式，并得到微軟的巨額投資。

發表于 02-20 11:26 ?172次閱讀

特斯拉視頻生成技術超越OpenAI，展示真實模擬視頻

馬斯克早先也曾指出，其公司自一年前便具備相似OpenAI的視頻生成能力。不僅如此，一名X用戶對此表示贊賞，認為OpenAI的研究成就證明了特斯拉的實力。

發表于 02-19 16:52 ?524次閱讀

馬斯克稱人類首次植入腦機接口芯片

近日，馬斯克在社交媒體上宣布了一個里程碑式的成就：人類首次植入了腦機接口（Neuralink）芯片植入手術，并且恢復良好。

發表于 01-31 09:50 ?395次閱讀

馬斯克再次對OpenAI首席科學家拋出橄欖枝

馬斯克在2015年幫助建立、資助和吸引主要人才加入openai非營利組織，并說服蘇茨克維從谷歌出來加入openai。2018年，馬斯克因與opena

發表于 12-11 09:32 ?235次閱讀

馬斯克:人類已經是半機器人

馬斯克:人類已經是半機器人? 就在腦機接口如火如荼之際還冒出來這個說法，似乎有點聳人聽聞。 馬斯克近日在推特上發文稱因為我們的記憶大部分都外包給了電腦；所以可以說人類已經是半機器人了。

發表于 06-13 23:47 ?1181次閱讀

微軟 CEO 反駁馬斯克：我們沒有控制 OpenAI

、推特、SpaceX 掌門人埃隆?馬斯克（Elon Musk）曾公開表示，如果微軟沒有直接控制 OpenAI，它應該也擁有很強的發言權。馬斯克對于 AI 的發展持批評態度，他曾與 270000 多人發表公開信

發表于 05-18 08:41 ?363次閱讀

Hobby觀察
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 比WiFi、藍牙更先進？詳解華為主導的“星閃”技術
Hot 激光雷達上車元年已至，車載激光雷達量產情況如何？

New 海外大廠調低2024營收預期，碳化硅市場增長到頂了？
New 電動汽車時代，國產車規級ADC的新機遇

精選推薦
更多

文章

資料

帖子

康謀產品 | 車載以太網：智能汽車通信的加速器

康謀自動駕駛
14小時前

329 閱讀

多調制信號解調應用（一）：使用K70M選件對多調制信號進行解調

羅德與施瓦茨中國
13小時前

251 閱讀

鴻蒙OS開發：【一次開發，多端部署】（應用UX設計原則）

jf_46214456
14小時前

226 閱讀

關于MOS管，你需要知道的那些事

仁懋電子
21小時前

383 閱讀

仁懋MOSFET：為房車儲能系統注入強勁動力

仁懋電子
21小時前

335 閱讀

電子工程手冊系列叢書國內外半導體光電器件實用手冊

wsppddt1990
20685

免費

0下載

輸出可調直流穩壓電源的設計(2012大學生電子設計競賽論文)

2070KB

2積分

598下載

基于LT346x-Young1直流到直流單輸出電源的參考設計

ytrwv
401.1KB

免費

7下載

awsbox輕量級的PaaS

劉杰
0.15 MB

免費

0下載

Pydiction vim的Python代碼自動完成插件

李輝
0.45 MB

免費

0下載

【紫光同創盤古PGX-MINI-4K教程】——（盤古PGX-MINI-4K開發板/PGC4KD-6ILPG144第五章）序列檢測器實驗例程

yonglong11
1天前

165 閱讀

ICCVR建立工程運行有問題

chenbingjy
1天前

397 閱讀

交流110V日本無刷電機

jf_43330017
2天前

499 閱讀

關于 TPS56339 降壓芯片的EN管腳的疑惑

jf_39880977
1天前

276 閱讀

全志R128 SDK HAL 模塊開發指南之 MSGBOX

文小二
1天前

295 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看