<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

南開大學和字節跳動聯合開發一款StoryDiffusion模型

冬至配餃子 ? 來源:網絡整理 ? 作者:網絡整理 ? 2024-05-07 14:46 ? 次閱讀

近日,南開大學和字節跳動聯合開發的 StoryDiffusion 模型解決了擴散模型生成連貫圖像與視頻的難題。其核心在于“一致自注意力”機制,強化圖像間一致性,無需額外訓練即可提升現有文本到圖像模型的表現。加之“語義運動預測器”,利用語義空間預測圖像序列間的流暢變換,尤其在長視頻生成中展現了前所未有的穩定性與主體一致性。此框架使基于文本的復雜故事視覺化成為可能,不僅在角色與場景細節一致性上超越 IP-Adapter 等工具,還能精準匹配文本描述。

南開大學和字節跳動聯合開發的StoryDiffusion模型是一種新的機器學習技術,主要用于生成具有長距離相關性的圖像和視頻。以下是該模型的一些主要特點:

1.一致性自注意力(Consistent Self-Attention):該模型通過一種新的自注意力計算方法,在生成圖像時建立批內圖像之間的聯系,以保持人物的一致性。這種機制無需訓練即可生成主題一致的圖像,解決了在一系列生成的圖像中保持內容一致性的挑戰,尤其是對于包含復雜主題和細節的圖像。

2.語義運動預測器(Semantic Motion Predictor):為了將這種方法擴展到長視頻生成,StoryDiffusion引入了語義運動預測器,將圖像編碼到語義空間,并預測語義空間中的運動,以生成視頻。這種基于語義空間的運動預測比僅基于潛在空間的預測更加穩定。

3.兩階段長視頻生成方法:通過Consistent self-attention機制生成的圖像可以順利過渡為視頻,實現兩階段長視頻生成方法。結合這兩個部分,可以生成常長且高質量的AIGC視頻。

4.用戶交互性:用戶可以通過提供一系列用戶輸入的條件圖像,使用Image-to-Video模型生成視頻。此外,用戶還可以通過Jupyter notebook或本地adio demo來生成漫畫。

5.應用范圍:StoryDiffusion的應用范圍廣泛,包括漫畫生成、圖像轉視頻等多種場景。

StoryDiffusion模型利用了一種稱為StoryGAN的生成模型,該模型可以根據輸入的故事情節和場景描述生成相關的圖像和視頻。這項技術有助于解決傳統圖像和視頻生成技術中的局限性,使得生成的圖像和視頻更加自然和連貫。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8141

    瀏覽量

    130683
  • 字節跳動
    +關注

    關注

    0

    文章

    267

    瀏覽量

    8732
收藏 人收藏

    評論

    相關推薦

    羅姆與芯馳科技面向智能座艙聯合開發出參考設計“REF66004”

    全球知名半導體制造商羅姆(總部位于日本京都市)與領先的車規芯片企業芯馳科技面向智能座艙聯合開發出參考設計“REF66004”。
    的頭像 發表于 04-03 14:06 ?873次閱讀
    羅姆與芯馳科技面向智能座艙<b class='flag-5'>聯合開發</b>出參考設計“REF66004”

    字節跳動發布AI角色互動應用“話爐”,涉足AI社交賽道

     值得注意的是,字節跳動CEO梁汝波在2024年度全體會議上指出,盡管字節跳動在2023年才初步涉足GPT領域,然而同期眾多先進的大模型創業
    的頭像 發表于 03-25 16:40 ?604次閱讀

    南開大學OpenHarmony技術俱樂部揭牌成立

    3月7日,由OpenAtom OpenHarmony(以下簡稱“OpenHarmony”)項目群技術指導委員會與南開大學共同舉辦的“南開大學OpenHarmony技術俱樂部成立大會”在津南校區綜合
    的頭像 發表于 03-08 08:37 ?172次閱讀
    <b class='flag-5'>南開大學</b>OpenHarmony技術俱樂部揭牌成立

    字節跳動被曝正秘密研發多個AI產品

    據多位知情人士透露,科技巨頭字節跳動正在人工智能(AI)大模型領域秘密研發多個創新產品。其中,多模態數字人產品備受矚目,該產品將結合先進的AI技術與虛擬形象,為用戶提供全新的交互體驗。此外,
    的頭像 發表于 03-05 11:22 ?461次閱讀

    字節跳動「突襲」交換機!

    因為字節跳動自研交換機,早在2019年,就開始悄悄布局了。
    的頭像 發表于 02-26 15:34 ?440次閱讀
    <b class='flag-5'>字節</b><b class='flag-5'>跳動</b>「突襲」交換機!

    字節跳動澄清未推出中文版Sora

    近日,有傳聞稱字節跳動在Sora文生視頻模型發布之前,已經推出了一款名為Boximator的顛覆性視頻模型。傳聞還指出,這款
    的頭像 發表于 02-20 13:58 ?333次閱讀

    字節跳動推出一款顛覆性視頻模型—Boximator

    在 Sora 引爆文生視頻賽道之前,國內的字節跳動也推出了一款顛覆性視頻模型——Boximator。
    的頭像 發表于 02-20 13:44 ?486次閱讀
    <b class='flag-5'>字節</b><b class='flag-5'>跳動</b>推出<b class='flag-5'>一款</b>顛覆性視頻<b class='flag-5'>模型</b>—Boximator

    字節跳動推出AI聊天機器人Coze扣子

    近日,字節跳動正式推出了名為“Coze扣子”的AI聊天機器人開發平臺。自2月1日起,這一平臺已正式上線,為開發者和用戶提供了一個全新的交互體驗。
    的頭像 發表于 02-03 09:31 ?777次閱讀

    字節跳動否認借助OpenAI技術研發大模型,已刪除GPT生成數據

    據悉,有媒體曝光,字節跳動可能涉足未公開地使用OpenAI技術來開發自家的大規模語言模型,這與OpenAI的服務條款相悖。因此,該公司的賬戶現已經被OpenAI暫時禁用。
    的頭像 發表于 12-18 10:39 ?230次閱讀

    字節跳動否認使用OpenAI技術開發大語言模型,并正與后者進行溝通?

    回顧過去,字節跳動早在 4月份就明文規定,嚴禁將 GPT 模型生成的數據添加到大模型的訓練數據集中,并且指導工程師們在使用 GPT 時遵循服務條款。更值得關注是,9 月時,
    的頭像 發表于 12-18 09:53 ?222次閱讀

    字節跳動旗下PICO近半員工離職 但字節跳動表示會長期投入XR

    ,字節跳動也會長期投入XR(擴展現實)業務。 PICO成立于2015年3月,致力于“成為領先的世界級XR平臺,成就開發者與創作者,共同為全球消費者創造更美好的生活體驗”。于2021年9月并入
    的頭像 發表于 10-24 17:38 ?1346次閱讀

    字節跳動旗下火山引擎自研的視頻編解碼芯片已出片

    字節跳動旗下火山引擎自研的視頻編解碼芯片已出片 在8月22日的一場活動中,據字節跳動視頻架構負責人、火山引擎視頻云架構技術總監王悅介紹,字節
    的頭像 發表于 08-23 18:56 ?1696次閱讀

    模型顛覆研發模式:字節跳動是如何在單元測試中落地大模型的?

    在接受 InfoQ 采訪時,字節跳動算法專家張樹波表示,大語言模型是一項人工智能基礎技術的突破,必然會帶來多個行業的變革。2023 年初,字節跳動
    的頭像 發表于 08-16 14:48 ?539次閱讀

    字節跳動AI開啟測試 代號“Grace”

    字節跳動AI開啟測試 代號“Grace” 字節跳動AI開啟測試;目前在內測階段,需要邀請或授權的相關賬號登錄后才可使用。代號為Grace;這是一個對話類AI項目,支持文本生成圖片等需求
    的頭像 發表于 08-07 16:58 ?931次閱讀

    綜述:基于柔性致動器的跳躍運動

    近日,南開大學劉遵峰教授等人近期在Advanced Functional Materials期刊上發表題為“Recent Development of Jumping Motions Based
    的頭像 發表于 05-24 15:36 ?293次閱讀
    綜述:基于柔性致動器的跳躍運動
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>