<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

TikTok引入前谷歌VideoPoet負責人蔣路,發力AI視頻生成

甲子光年 ? 來源:甲子發現 ? 2024-02-22 13:36 ? 次閱讀

獨家獲悉,谷歌高級科學家、卡內基梅隆大學(CMU)計算機學院兼職教授蔣路,已經加入TikTok。

蔣路是谷歌 VideoPoet 項目負責人,VideoPoet 是谷歌在 2023 年 12 月推出的視頻生成大模型,類似 OpenAI 剛剛發布的 Sora。

近期,昆侖萬維創始人周亞輝在朋友圈表示,有個論文的作者加入字節北美做Tech Leader,正是指《VideoPoet: A large language model for zero-shot video generation》論文的作者蔣路。

資料顯示,蔣路先后在西安交通大學、布魯塞爾自由大學、卡內基梅隆大學學習計算機,并先后進入微軟亞洲研究院、谷歌研究院、雅虎研究院實習。

2017 年,蔣路畢業后加入谷歌。他是谷歌云 AI 的創始成員,也是李佳博士和李飛飛博士首次聘請的研究員。此后,蔣路進入谷歌研究院工作。

蔣路的研究曾被應用到谷歌多個產品,如 YouTube、云服務、云 AutoML、廣告、Waymo 和翻譯服務,影響了全球數十億用戶的日常生活。

蔣路的工作在自然語言處理(ACL)和計算機視覺(CVPR)的頂級會議上被提名為最佳論文。他是研究社區的活躍成員,擔任美國國家種子基金(NSF SBIR)的 AI 評審專家,并定期擔任 CVPR、ICCV、NeurlPS、ACM Multimedia 和 AAAI 等著名會議的領域主席。

蔣路的研究興趣主要在多媒體交叉領域,他專注于生成式 AI 和視頻創作。2019 年起,他就開始嘗試將 Transformer 用在圖像、視頻生成研究上。

與 Sora 采用的 Diffusion + Transformer 架構不同,蔣路負責的 VideoPoet 視頻生成模型采用了單 Transformer 架構,可以將任何自回歸語言模型或大型語言模型轉換為高質量的視頻生成器,支持生成方形或縱向視頻,以針對短格式內容定制生成視頻,并支持視頻輸入生成音頻。

VideoPoet 采用了名為 Tokenizer 的數據處理技術,可以將視頻和音頻片段編碼為離散標記序列(discrete tokens),這些標記也可以被轉換回原始表示。其中,視頻和圖像數據使用名為 MAGVIT V2 的技術,音頻數據使用 SoundStream 的技術。

VideoPoet 通過使用多個 Tokenizer 訓練一個自回歸語言模型,以學習跨視頻、圖像、音頻和文本模態。一旦模型根據某些上下文生成了標記,這些標記就可以通過分詞器解碼器轉換回可查看的表示。

fe1ad37c-d143-11ee-a297-92fbcf53809c.png

3 周前,蔣路本人在職場社交平臺宣布了自己在谷歌的 Last Day,并特別表示對在谷歌所做的視頻生成項目(VideoPoet,MAGVIT,WALT等)感到自豪。

蔣路表示自己將繼續留在灣區,開始視頻生成領域的新旅程?,F在來看,新的旅程就是 TikTok。

值得一提的是,字節跳動已經在大模型領域全面布局,模型層推出了自研的「云雀大模型」以及類 ChatGPT 對話機器人產品豆包。2023 年底,字節跳動成立新的 AI 應用部門 Flow,并在海外推出了 Coze 等多款產品。抖音集團 CEO 張楠也于近期卸任,專注于 AI 工具剪映的發展。

字節跳動近期辟謠了推出中文版 Sora,并表示:“還無法完善產品落地,距離國外模型有很大差距?!钡硪环矫?,字節跳動正在大力招攬人才。

大模型戰場,字節跳動將會如何攪局?




審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    206

    文章

    27273

    瀏覽量

    201979
  • 計算機視覺
    +關注

    關注

    8

    文章

    1611

    瀏覽量

    45697
  • OpenAI
    +關注

    關注

    9

    文章

    880

    瀏覽量

    6022
  • TikTok
    +關注

    關注

    2

    文章

    206

    瀏覽量

    7106

原文標題:獨家:TikTok引入前谷歌VideoPoet負責人蔣路,發力AI視頻生成|甲子光年

文章出處:【微信號:jazzyear,微信公眾號:甲子光年】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    OpenAI又打出王炸!一句話生成60秒視頻,馬斯克:人類認輸吧

    了文生視頻模型Gen-1,并完成了兩次迭代;還有谷歌團隊發布的視頻生成模型VideoPoet。但問題在于,此
    的頭像 發表于 02-19 09:02 ?3400次閱讀
    OpenAI又打出王炸!一句話<b class='flag-5'>生成</b>60秒<b class='flag-5'>視頻</b>,馬斯克:人類認輸吧

    三星電子任命半導體業務新負責人,加碼AI芯片市場

    三星電子近日宣布,任命Young Hyun Jun為半導體部門的新負責人,此舉旨在進一步加碼AI芯片市場,以追趕包括SK海力士在內的競爭對手。
    的頭像 發表于 05-27 14:06 ?216次閱讀

    三星電子更換設備解決方案部門負責人

    三星電子近日宣布重要人事調整,旨在進一步優化公司管理結構和推動業務發展。未來事業企劃團負責人全永鉉將出任設備解決方案(DS)部門負責人,全面接管芯片等業務的全球運營。
    的頭像 發表于 05-21 15:11 ?321次閱讀

    谷歌發布全新視頻生成模型Veo與Imagen文生圖模型

    谷歌近日宣布了兩項重大技術進展,首先是視頻生成模型Veo的正式推出。這款先進的模型能夠支持生成質量更高的視頻內容,讓用戶能夠根據自己的需求設定光照、鏡頭語言、
    的頭像 發表于 05-16 10:46 ?136次閱讀

    阿里云視頻生成技術創新!視頻生成使用了哪些AI技術和算法

    照片就能讓 EMO 合成演戲唱歌視頻。 ? 阿里云在視頻生成領域的創新 ? EMO(Emote Portrait Alive)是一個由阿里巴巴集團智能計算研究院開發的框架,一個音頻驅動的 AI 肖像
    的頭像 發表于 05-08 00:07 ?2868次閱讀

    小鵬汽車迎來新AI負責人,研發XNGP技術

    小鵬汽車近日迎來新的AI團隊負責人——Cruise公司前高級資深機器學習工程師LiuXianming。他將帶領小鵬AI團隊研發XNGP技術,為公司的自動駕駛領域注入新的活力。
    的頭像 發表于 03-26 10:43 ?343次閱讀

    新火種AI|圍攻光明頂:Sora效應下的AI視頻生成競賽

    Sora的出現,讓AI視頻生成領域真正“活”了起來
    的頭像 發表于 03-16 11:12 ?299次閱讀

    除了刷屏的Sora,國內外還有哪些AI視頻生成工具

    。Sora的發布也讓AI生成視頻有了突破性進展。 ? 過去一年多,全球科技公司都在發布各種大模型,然而AI生成內容更多集中在文本和圖片方面,
    的頭像 發表于 02-26 08:42 ?3429次閱讀
    除了刷屏的Sora,國內外還有哪些<b class='flag-5'>AI</b><b class='flag-5'>視頻生成</b>工具

    openai發布首個視頻生成模型sora

    美國當地時間2024年2月15日 ,OpenAI正式發布文生視頻模型Sora ,并發布了48個文生視頻案例和技術報告 ,正式入局視頻生成領域 。Sora能夠根據提示詞生成60s的連貫
    的頭像 發表于 02-21 16:45 ?784次閱讀

    OpenAI新年開出王炸,視頻生成模型Sora問世

    近日,OpenAI在AI生成視頻領域取得重大突破,發布了全新的生成式人工智能模型“Sora”。該模型在視頻生成方面展現出了驚人的能力,通過文
    的頭像 發表于 02-20 11:46 ?439次閱讀

    AI視頻年大爆發!2023年AI視頻生成領域的現狀全盤點

    2023年,也是AI視頻元年。過去一年究竟有哪些爆款應用誕生,未來視頻生成領域面臨的難題還有哪些?
    的頭像 發表于 02-20 10:40 ?660次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>視頻</b>年大爆發!2023年<b class='flag-5'>AI</b><b class='flag-5'>視頻生成</b>領域的現狀全盤點

    OpenAI發布文生視頻模型Sora,引領AI視頻生成新紀元

    在人工智能(AI)領域掀起新一輪革命浪潮的,正是OpenAI最新推出的文生視頻大模型——Sora。這款被業界廣泛贊譽的模型,以其“逼真”和“富有想象力”的視頻生成能力,徹底顛覆了傳統視頻生成
    的頭像 發表于 02-19 11:03 ?514次閱讀

    谷歌地圖引入生成AI功能

    谷歌近日宣布,在其廣受歡迎的谷歌地圖應用中引入了全新的生成AI功能。這一創新功能利用大型模型,深入分析了地圖上超過2.5億個地點的詳細信息
    的頭像 發表于 02-06 16:42 ?2997次閱讀

    谷歌推出AI擴散模型Lumiere

    近日,谷歌研究院重磅推出全新AI擴散模型Lumiere,這款模型基于谷歌自主研發的“Space-Time U-Net”基礎架構,旨在實現視頻生成的一次性完成,同時保證
    的頭像 發表于 02-04 13:49 ?657次閱讀

    超算負責人離職,特斯拉下一代自動駕駛何去何從?

    電子發燒友網報道(文/周凱揚)早在去年 12 月初就有新聞爆料,稱特斯拉超算 Dojo 項目負責人Ganesh Venkataramanan已經離職。據傳在其離職后,該項目將由FSD 負責人
    的頭像 發表于 01-02 09:19 ?1177次閱讀
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>