<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

4DGen:基于動態3D高斯的可控4D生成新工作

CVer ? 來源:CVer ? 2024-01-04 15:57 ? 次閱讀

一、研究背景

盡管3D和視頻生成取得了飛速的發展,由于缺少高質量的4D數據集,4D生成始終面臨著巨大的挑戰。過去幾篇工作嘗試了Text-To-4D的任務,但依然存在兩個主要問題:

1.由于輸入依賴于單視角的圖片或者簡單的文本描述,并不能保證得到精準的4D結果,需要花費大量的時間進行反復調整。

2.盡管采用了Hexplane作為4D的表征,基于NeRF的方法在高分辨率和長視頻上的渲染所需要的計算時間和顯存占用是難以接受的。即使采用了一個超分辨的后處理網絡,依然會有模糊和閃爍的結果。

為了解決上述問題,4DGen定義了“Grounded 4D Generation“新型任務形式,并且設計了新的算法框架實現高質量的4D內容生成。

二、任務定義

過往的4D生成工作是“one click“的方式,并不能對生成的結果進行有效的控制。4DGen提出了“Grounded 4D Generation“的形式,通過利用視頻序列和可選的3D模型作為4D生成的控制信息,可以實現更為精準的4D內容生成。用戶可通過輸入視頻序列或3D模型來約束4D結果的運動和外觀;當用戶僅提供單張圖片作為輸入時,可借助預訓練好的視頻生成模型來得到視頻序列;當用戶未提供3D模型時,可通過單張圖片重建3D模型來作為起始點。

4b408368-a72d-11ee-8b88-92fbcf53809c.png

三、方法介紹

4DGen框架的輸入起始點為用戶給定或者模型生成的視頻序列,對于任意的單張圖片,借助多視角生成模型(multi-view diffusion model),可以得到不同視角的圖片。4DGen通過對第一幀多視圖進行三維重建,得到初始的靜態3D Gaussians作為4D生成的起始點。

由于4D數據的匱乏,需要盡可能的從先驗模型中蒸餾信息。4DGen將每一幀生成的多視圖作為2D偽標簽,并且采用多視圖生成的點云作為3D點的偽標簽來監督訓練過程。

因為多視圖生成具有ill-posed的特點,得到的偽標簽在不同視角之間,不同時序之間存在不連續性,需要引入時間和空間上的一致性損失函數進行約束。相較于擬合多視圖DDIM采樣得到的圖片,score distillation sampling(SDS)是根據先驗的擴散模型對場景表達進行似然估計。

4DGen依據正面視角計算任意視角圖片在Zero123模型上的SDS損失,用于提升空間上的連續性。為了緩解閃爍問題,4DGen引入了無監督的時間平滑約束。通過計算平面的平滑損失和Gaussians不同時刻的平滑損失,有效提升了時間上的一致性。

4b490ca4-a72d-11ee-8b88-92fbcf53809c.png

四、實施細節

4DGen的 4D表達采用了4D Gaussian Spaltting的方式,通過一個多分辨率Hexplane對每個Gaussian進行編碼。將6個時空平面的特征進行相加,并經過一個額外的MLP解碼得到對應Gaussian在不同時刻的位置偏移量。

訓練上采用三階段方式,第一階段對場景進行靜態建模,第二階段利用2D和3D的偽標簽進行動態場景的初步建模,第三建模利用平滑損失增強模型的細節和連續性。

所有實驗可以在一張RTX3090上完成,對于2.5萬個Gaussians只需45分鐘的訓練,對于9萬個Gaussians訓練2小時可以得到更加好的細節效果。

五、實驗結果

4DGen可以實現不同視角、不同時間的高質量圖片渲染。相較于對比方法在細節表達、噪聲去除、顏色還原、時空連續性等方面有顯著提升。更多視覺效果可以參考項目主頁。

4b62246e-a72d-11ee-8b88-92fbcf53809c.png

量化對比上,4DGen采用了不同時序圖片和參考圖片的CLIP距離來衡量生成質量,采用CLIP-T衡量不同時間下的圖像連續性。4DGen在多項指標上明顯優于過往方法。

4b7e341a-a72d-11ee-8b88-92fbcf53809c.png

六、總結

4DGen定義了” Grounded 4D Generation“的任務形式,通過視頻序列和可選3D模型的引入提升了4D生成的可控性。通過高效的4D Gaussian Splatting的表達,2D和3D偽標簽的監督和時空的連續性約束,使得4DGen可以實現高分辨率、長時序的高質量的4D內容生成。






審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編解碼
    +關注

    關注

    1

    文章

    138

    瀏覽量

    19410
  • SDS
    SDS
    +關注

    關注

    0

    文章

    47

    瀏覽量

    15303
  • 3D模型
    +關注

    關注

    1

    文章

    70

    瀏覽量

    15606
  • MLP
    MLP
    +關注

    關注

    0

    文章

    56

    瀏覽量

    4110

原文標題:3DGS殺瘋了!4DGen:基于動態3D高斯的可控4D生成新工作

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    顛覆傳統!4D主動學習法,電子技術難學嗎?

    電子技術4D
    李皆寧講電子
    發布于 :2023年09月04日 11:18:33

    豐田 4D芯片區分方法

    本帖最后由 ⊙菰輈億葉⊙ 于 2014-3-2 22:57 編輯 豐田 4D芯片區分方法
    發表于 03-02 22:55

    誰有滑動變阻器的3D模型VR4的?

    誰有VR4封裝的滑動變阻器的3D模型?請幫我一把,急需?。?!謝謝了?。?!
    發表于 05-27 22:19

    生成顯示4D數據——LabVIEW中3D Mesh的研究,附贈256色色譜生成

    各種設置,再也不用在程序框圖編寫煩人的屬性節點了。而且還有右鍵另存為的功能導出圖片??!見3D Scatter.vi控件:框圖:4 附贈256色色譜生成器(\Color Spectrum\Color
    發表于 07-11 13:34

    客廳新用法:4D VR館

    `有了虛擬實境VR頭戴式顯示器,和4D影院的區別可能主要就是遇到座椅了。這個多自由度運動座椅放在家里不太劃算,但是把家里的一般沙發直接改造成運動沙發感覺好多了。Kickstarter 上正在眾籌
    發表于 02-24 11:18

    AD+Solidworks配合=3D模型相關問題

    ),絲印丟失。元器件的3D效果完美重建模。③使用AD-SW插件直接轉換(器件生成還是選用由3D封裝STEP生成選項)理論效果完美,絲印、走線、器件、焊盤均完美,且各層
    發表于 07-12 11:33

    Elements 4D一款先進的增強現實學習應用

    蘋果在6月發布的一段宣傳視頻《The App Effect》,其中在03:46的時候,Elements 4D的Gaia Dempsey介紹了一款神奇的“Elements 4D by DAQRI
    發表于 09-20 10:16

    用于BBB的4D系統Gen4 LCD觸摸屏如何校準

    我在使用電阻式觸摸屏的4D Systems Gen4 7“LCD顯示器上校準觸摸屏時遇到問題。在顯示器中心附近,校準非常接近但邊緣附近的距離超過0.25英寸。在左下方LCD的一角指針出現在觸摸點
    發表于 10-22 14:21

    Litestar 4D照明工程設計軟件

    4D是一套功能強大,靈活性高且能自由配置的照明設計軟件:確保了每個環節都能高效完成。它正在幫助數以百計的客戶,使得他們每日的工作效率大大提高。了解詳情可加QQ:2987619807
    發表于 03-26 10:53

    浩辰3D軟件入門教程:如何比較3D模型

    差異。步驟一:點選「比較模型」功能在浩辰3D軟件的開始菜單中,選擇「工具」選項卡,并且點選「比較模型」功能。輸入參考模型和工作模型的文件信息。如果參考模型存在修改后,未保存的情況,則按照提示進行保存
    發表于 12-15 13:45

    AD的3D模型繪制功能介紹

    一共提供了4種類型,類型1常規型,類型2時圓柱體模型,類型3是外部模型,類型4是球體模型。我們根據器件實際形狀來選擇類型?!   D(2)3D模型類型選擇  比如我們要畫0805電阻的
    發表于 01-14 16:48

    3D軟件中如何應用文本特征?3D文本特征應用技巧

    輪廓的方向;(3)其他情況若是放置于圓弧或曲線時,同樣可以通過繪制樣條曲線+旋轉的方式,對文本輪廓進行重新定位。3、文本特征生成創建文本輪廓后,可使用「拉伸」命令生成
    發表于 04-22 17:28

    浩辰3D的「3D打印」你會用嗎?3D打印教程

    、空隙填充若3D模型存在空隙,浩辰3D能自動識別3D模型上的空隙,并以紅X的形式標出,點擊確認后,即可直接填滿這個空隙,完成填補,從而便于打印設備的工作機制。
    發表于 05-27 19:05

    3D圖像生成算法的原理是什么?

    什么是3D圖形芯片?3D圖像生成算法的原理是什么?
    發表于 06-04 06:29

    3D NAND與4D NAND之間的差別在哪兒?

    什么是3D NAND?什么是4D NAND?3D NAND與4D NAND之間的差別在哪兒?
    發表于 06-18 06:06
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>