<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

除了刷屏的Sora，國內外還有哪些AI視頻生成工具

電子發燒友網報道（文/李彎彎）近日，OpenAI發布的文生視頻模型Sora全網刷屏。相比之前的文生視頻模型，Sora無論是視頻時長，還是畫面精細度，細節完整性，或是多鏡頭拍攝，都更為突出。Sora的發布也讓AI生成視頻有了突破性進展。

過去一年多，全球科技公司都在發布各種大模型，然而AI生成內容更多集中在文本和圖片方面，AI視頻生成方面卻進展緩慢。從當前的形勢來看，AI視頻生成在今年或許會有一番新景象。那么目前國內外都有哪些AI視頻生成工具，效果如何呢？

Sora

OpenAI發布的新型視頻生成模型Sora，其核心能力是能夠生成長達一分鐘的高清視頻，這一時長遠超之前的生成模型。而且，Sora生成的視頻不僅畫質卓越，細節豐富，而且幀率高、連續性好，幾乎達到了無縫銜接的效果。

從OpenAI官網展示的一個視頻來看，輸入提示詞“一位時尚女士走在東京的街道上，街道上充滿了溫暖的霓虹燈和動畫城市標志。她穿著黑色皮夾克、紅色長裙和黑色靴子，拿著一個黑色錢包。她戴著太陽鏡，涂著紅色口紅。她走路自信而隨意。街道潮濕且反光，形成了五顏六色燈光的鏡面效果。許多行人四處走動?！?br />
生成的視頻，無論是運鏡還是人物、地面、背景的細節，還有拉進鏡頭后人物面部上的皺紋、毛發、墨鏡上的反光，都幾乎可以以假亂真，畫面穩定不錯位。在長達60秒的視頻里，畫面隨鏡頭的大幅度運動并沒有出現錯位的情況，整體風格保持了驚人的一致性。

據IDC中國預測，Sora將率先在短視頻、廣告、互動娛樂、影視制作和媒體等行業中得到應用。在這些領域，利用Sora的多模態大模型能力，可以輔助內容行業的工作者更高效地創作視頻，不僅加快了生產速度，還提高了產出數量，并為用戶帶來前所未有的視覺體驗。這將助力企業實現成本降低、效率提升，并進一步優化用戶體驗。

Pika 1.0

在OpenAI發布視頻生成模型Sora之前，去年11月29日，美國AI初創公司Pika labs發布的文生視頻產品Pika 1.0呈現的效果在當時也相當驚艷。Pika labs是一家成立于去年4月份的初創公司，創始人郭文景和聯合創始人兼CTO Chenlin Meng，都是斯坦福大學AI Lab博士生。一位專注于NLP（自然語言處理）和圖形學，另一位主攻計算機視覺方向。

據介紹，該公司推出的視頻生成模型Pika 1.0能夠生成和編輯3D動畫、動漫、卡通和電影。視頻生成方面，可以通過文字生成視頻，也可以圖片生成視頻。比如，只需輸入提示詞“馬斯克穿著太空服，3D動畫”，一個動畫版本、穿著太空服準備乘坐火箭上太空的馬斯克即可生成，外形、動作、背景等元素均十分逼真，可以媲美花大成本制作的3D動畫影像。

Pika 1.0還可以通過原有視頻生成更高質量的視頻。該公司當時展示了一個騎馬的黑白原視頻，通過Pika 1.0生成了物種不同風格的動畫，幾乎涵蓋現有電影和動畫大部分風格，看上去質量效果非常好。除了視頻生成，Pika 1.0還能夠進行視頻編輯，用戶只需要選定編輯區域，就能根據文本提示詞修改特定區域。

在當時來看，Pika 1.0的出現可以說效果好于之前的文生視頻模型。然而隨著現在Sora的出現，Pika或許會感覺到壓力。Pika公司創始人郭文景表示，“我們覺得這是一個很振奮人心的消息，我們已經在籌備升級中，將直接對標 Sora?！?br />
Gen-2

相比于OpenAI和Pika，成立于2018年的AI初創公司Runway應該是最早探索視頻生成領域的企業。2022年2月，Runway發布了Gen-1，可以對原視頻進行風格化的編輯。3月該公司又發布了生成式AI視頻模型Gen-2，允許用戶輸入文本提示生成四秒長視頻，8月，Runway添加了一個選項，可以將 Gen-2 中人工智能生成的視頻延長至 18 秒。

在隨后的幾個月，Runway還對Gen-2 做了幾次更新。之后更是推出動態筆刷Motion Brush，它是Runway視頻生成工具Gen-2的一部分。Runway動態筆刷是一種利用人工智能技術讓靜止圖片中的物體動起來的功能，你只需要在圖片上用畫筆涂抹你想要動起來的部分，Runway就會自動識別物體的運動軌跡和特征，生成逼真的動態效果。該工具的發布引起業界不小的關注。

在Pika 1.0和Sora出現之前，Runway的Gen-2模型被認為是AI視頻制作的頂尖模型，它制作出來的視頻效果逼真、流暢、高清。隨著OpenAI Sora的發布，Runway接下來或許會有新動作，在Sora發布之后，Runway CEO第一時間在X上發推特稱“game on（競爭開始了）”。

Stable Video Diffusion

在圖片生成領域遙遙領先的Stability AI，去年11月發布了其最新的AI模型Stable Video Diffusion，這款模型能夠通過現有圖片生成視頻，是基于之前發布的Stable Diffusion文本轉圖片模型的延伸，不過當時，這款模型并不是對所有人開放的。

據介紹，Stable Video Diffusion當時還處于Stability AI所謂的“研究預覽”階段。想要使用這款模型的人必須同意一些使用條款，其中規定了Stable Video Diffusion的預期應用場景（例如教育或創意工具、設計和其他藝術過程等）和非預期的場景（例如對人或事件的事實或真實的表達）。

從網友對比反饋來看，Stable Video Diffusion生成視頻的效果可以與當時被看好的的Runway 和Pika Labs 的AI生成視頻相媲美。不過局限性在于，Stability AI的視頻生成模型，不能生成沒有運動或緩慢的攝像機平移的視頻，也不能通過文本進行控制，也不能渲染文字（至少不能清晰地渲染），也不能一致地“正確地”生成人臉和人物。

寫在最后

目前來看，在視頻生成方面，表現比較優秀的幾個模型就是上文提到的OpenAI發布的Sora，以及Pika labs、Runway、Stability AI發布的視頻模型。其中Sora無論是在時長，還是運鏡、畫面細節等方面都更為突出。Stability AI的模型目前還不能進行文本生成視頻。

除了這幾款視頻生成工具之外，還有一些企業在文生視頻方面也有動作，包括Adobe，該公司宣布已收購AI視頻生成創業公司Rephrase.ai；谷歌，其團隊已經發布發布了視頻生成模型VideoPoet。

國內的字節跳動、百度、阿里在這方面也有動作。字節跳動此前就推出了一款視頻模型Boximator，可以通過文本精準控制生成視頻中人物或物體的動作。不過近日，字節跳動對此回應稱，Boximator是視頻生成領域控制對象運動的技術方法研究項目，目前還無法作為完善的產品落地，距離國外領先的視頻生成模型在畫面質量、保真率、視頻時長等方面還有很大差距。

另外值得關注的是，2月23日消息，谷歌資深科學家、VideoPoet項目負責人蔣路已加入字節跳動旗下短視頻社交平臺TikTok。字節跳動接下來在視頻生成方面的研究還是可以期待一下。

早前就傳出百度文心大模型視頻生成功能在內測中，不過目前還沒進展的消息。阿里在去年底也上線了Animate Anyone模型，通過一張圖片就能生成視頻，當時有網友用一張照片生成了一段跳舞視頻，每一個動作都十分自然，幾乎可以亂真，在網絡上引起大量傳播。

總的來說，目前國內外已經有不少企業在探索視頻生成領域，包括國內的字節跳動、百度、阿里，雖然已經逐漸有一些進展。不過相比OpenAI、Pika labs、Runway等的視頻模型，還存在差距。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

OpenAI

OpenAI

+關注

關注
8

文章
815

瀏覽量
5944
大模型

大模型

+關注

關注
2

文章
1627

瀏覽量
1242
Sora

Sora

+關注

關注
0

文章
74

瀏覽量
139

評論

相關推薦

阿里云視頻生成技術創新！視頻生成使用了哪些AI技術和算法

照片就能讓 EMO 合成演戲唱歌視頻。 ? 阿里云在視頻生成領域的創新 ? EMO（Emote Portrait Alive）是一個由阿里巴巴集團智能計算研究院開發的框架，一個音頻驅動的 AI 肖像

的頭像

發表于 05-08 00:07 ?2650次閱讀

智譜AI正研發對標Sora的國產文生視頻模型

智譜AI，這家國內估值超過200億的AI大模型獨角獸企業，正全力投入研發一款與OpenAI的Sora相媲美的國產文生視頻模型。據公司內部人士

的頭像

發表于 05-07 09:22 ?230次閱讀

OpenAI視頻生成工具Sora將于年內正式向公眾推出

OpenAI的首席技術官Mira Murati在近期采訪中透露，公司正計劃在今年晚些時候正式向公眾正式推出其視頻生成工具Sora。Murati表示，盡管具體的推出時間可能需要幾個月，但OpenAI正在積極準備，并期待在未來能夠為

的頭像

發表于 03-19 11:41 ?429次閱讀

新火種AI|圍攻光明頂：Sora效應下的AI視頻生成競賽

Sora的出現，讓AI視頻生成領域真正“活”了起來

的頭像

發表于 03-16 11:12 ?256次閱讀

OpenAI表示Sora還有很長的路要走

近日，OpenAI發布的Sora視頻生成器在技術圈內引起了廣泛關注。盡管其初步展示的效果令人印象深刻，但該工具目前仍處在研究階段，距離實際應用還有相當的距離。

的頭像

發表于 02-27 17:38 ?375次閱讀

sora模型怎么使用 sora模型對現實的影響

美國當地時間2024年2月15日，OpenAI正式發布文生視頻模型Sora ，并發布了48個文生視頻案例和技術報告，正式入局視頻生成領域。So

發表于 02-22 16:42 ?696次閱讀

OpenAI文生視頻模型Sora要點分析

近日，美國人工智能公司OpenAI發布了首個視頻生成模型Sora。不同于此前許多AI大模型文生圖或視頻時，會出現人物形象前后不一致等問題

發表于 02-22 16:37 ?569次閱讀

openai發布首個視頻生成模型sora

美國當地時間2024年2月15日，OpenAI正式發布文生視頻模型Sora ，并發布了48個文生視頻案例和技術報告，正式入局視頻生成領域。So

發表于 02-21 16:45 ?719次閱讀

馬斯克稱特斯拉視頻生成技術超過Sora

特斯拉CEO埃隆·馬斯克在社交媒體平臺上發表言論，聲稱特斯拉所掌握的視頻生成技術超越了OpenAI最新發布的Sora模型。馬斯克自信地表示，特斯拉在這一領域的技術實力堪稱全球頂尖，甚至超越了OpenAI這一人工智能領域的佼佼者。

發表于 02-20 14:16 ?269次閱讀

OpenAI發布Sora模型，瞬間生成高清大片

近日，人工智能領域的領軍企業OpenAI發布了一款名為“Sora”的視頻生成AI模型，再次展示了其在AI技術領域的創新實力。Sora以其出色

發表于 02-20 13:33 ?341次閱讀

探索OpenAI Sora視頻AI生成技術及其應用如何使用指南

OpenAI的Sora現已擴展其能力范圍，進入視頻生成領域，標志著人工智能技術在多媒體內容創作上的一個重大突破。Sora的視頻AI功能使得用

發表于 02-20 12:01 ?919次閱讀

OpenAI新年開出王炸，視頻生成模型Sora問世

近日，OpenAI在AI生成視頻領域取得重大突破，發布了全新的生成式人工智能模型“Sora”。該模型在視

發表于 02-20 11:46 ?400次閱讀

AI視頻年大爆發！2023年AI視頻生成領域的現狀全盤點

2023年，也是AI視頻元年。過去一年究竟有哪些爆款應用誕生，未來視頻生成領域面臨的難題還有哪些？

發表于 02-20 10:40 ?592次閱讀

OpenAI發布文生視頻模型Sora，引領AI視頻生成新紀元

在人工智能(AI)領域掀起新一輪革命浪潮的，正是OpenAI最新推出的文生視頻大模型——Sora。這款被業界廣泛贊譽的模型，以其“逼真”和“富有想象力”的視頻生成能力，徹底顛覆了傳統

發表于 02-19 11:03 ?472次閱讀

OpenAI發布首個視頻生成模型Sora

OpenAI近日宣布推出其全新的文本到視頻生成模型——Sora。這一突破性的技術將視頻創作帶入了一個全新的紀元，為用戶提供了前所未有的創作可能性。

發表于 02-18 10:07 ?620次閱讀

Carol Li
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 國內最值得關注的10家人工智能語音識別公司
Hot 國內外 18 家藍牙芯片廠商及產品型號集合

New AI大模型正在加速上車，全面賦能汽車行業
New 大模型在端側迅速落地，面臨哪些挑戰

精選推薦
更多

文章

資料

帖子

康謀產品 | 車載以太網：智能汽車通信的加速器

康謀自動駕駛
14小時前

321 閱讀

多調制信號解調應用（一）：使用K70M選件對多調制信號進行解調

羅德與施瓦茨中國
13小時前

245 閱讀

鴻蒙OS開發：【一次開發，多端部署】（應用UX設計原則）

jf_46214456
13小時前

223 閱讀

關于MOS管，你需要知道的那些事

仁懋電子
21小時前

376 閱讀

仁懋MOSFET：為房車儲能系統注入強勁動力

仁懋電子
21小時前

328 閱讀

抑制△I噪聲的PCB設計方法

inameissen
189 MB

免費

0下載

SYPhotoBrowser輕便圖片瀏覽器

h1654155216.9102
3.90 MB

免費

0下載

Wazuh端點和云工作負載保護

楊萬富
7.31 MB

免費

3下載

flutter_ocr Flutter開發的OCR軟件

吳湛
0.45 MB

免費

3下載

瑞薩AE-CLOUD1溫度顯示器開源分享

李鴻洋
0.00 MB

免費

6下載

【紫光同創盤古PGX-MINI-4K教程】——（盤古PGX-MINI-4K開發板/PGC4KD-6ILPG144第五章）序列檢測器實驗例程

yonglong11
1天前

157 閱讀

ICCVR建立工程運行有問題

chenbingjy
1天前

389 閱讀

交流110V日本無刷電機

jf_43330017
2天前

487 閱讀

關于 TPS56339 降壓芯片的EN管腳的疑惑

jf_39880977
1天前

268 閱讀

全志R128 SDK HAL 模塊開發指南之 MSGBOX

文小二
1天前

282 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看