據美國商標與專利局近日發布的信息,微軟已獲新型專利,利用深度學習構建真實感十足的多模態 3D 面部模擬肖像。
此項專利名為《多模態三維面部建模及追蹤,制作栩栩如生的虛擬肖像》。其系統包括處理器和存儲器系統,前者負責收集初始數據(即面部初始模樣)以及多元數據信號(例如用戶聲波等音頻數據),再將兩者整合并進行擬合處理。
3D 面部建模與追蹤技術通過捕捉用戶面部特征,建立 3D 頂點,并對中性面部頂點進行變形,以呈現出數字面部模型的各種表情。
此外,該系統運用深度學習技術設計虛擬肖像,可模擬用戶面部表情,用戶亦可進行微調,使之更具個性。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
微軟
+關注
關注
4文章
6410瀏覽量
103149 -
存儲器
+關注
關注
38文章
7211瀏覽量
162298 -
深度學習
+關注
關注
73文章
5256瀏覽量
120049
發布評論請先 登錄
相關推薦
包含具有多種類型信息的3D模型
、安全和高效的建筑系統,讓居住者能夠擁有可持續、彈性舒適且符合人體工程學的建筑。建筑信息模型
(BIM) 是建筑工程師在建筑物和其他結構設計中使用的一種3D建模過程。BIM軟件提供了一個基于模型
發表于 03-28 17:18
谷歌推出多模態VLOGGER AI
谷歌最新推出的VLOGGER AI技術引起了廣泛關注,這項創新的多模態模型能夠讓靜態肖像圖“活”起來并“說話”。用戶只需提供一張人物肖像照片
谷歌發布VLOGGER AI模型,實現肖像朗讀音頻內容
具體來說,VLOGGER AI 采用一種適應虛擬肖像的多模態 Diffusion 模型,通過 MENTOR 數據庫進行訓練,涵蓋了超80萬個人物肖像
大模型+多模態的3種實現方法
我們知道,預訓練LLM已經取得了諸多驚人的成就, 然而其明顯的劣勢是不支持其他模態(包括圖像、語音、視頻模態)的輸入和輸出,那么如何在預訓練LLM的基礎上引入跨模態的信息,讓其變得更強
PADS VX2.7 下載安裝及3D模型導入的注意事項
://mentor.mr-wu.cn/
安裝方式按照安裝包內的指導完成即可。
破解注意事項:1.用最新版饅頭破解
2.必須關閉殺毒軟件,否則破解后不可用!
二:3D模型導入
1.從3D模型
發表于 11-22 17:54
深度學習在醫學圖像分割與病變識別中的應用實戰
來源:易百納技術社區
基于深度學習的醫學圖像分割與病變識別隨著人工智能技術的不斷發展,其在醫療領域的應用越來越受到關注。其中,基于深度
發表于 09-04 11:11
光學3D表面輪廓儀可以測金屬嗎?
光學3D表面輪廓儀是基于白光干涉技術,結合精密Z向掃描模塊、3D 建模算法等快速、準確測量物體表面的形狀和輪廓的檢測儀器。它利用光學投射原理,通過光學傳感器對物體表面進行掃描,并根據反射光的信息來
發表于 08-21 13:41
實時3D藝術最佳實踐-燈光指南
的照明技術下看起來更糟。
Unity游戲引擎使燈光工作簡單易懂。的手機游戲的表現受到你的照明決定的影響,所以需要使用照明高效。
本指南也可在統一學習課程的格式-手臂和統一呈現:3D藝術
移動應用程序
發表于 08-02 08:34
實時3D藝術最佳實踐-紋理技術解讀
、mipmapping和法線貼圖。
本指南也以Unity學習課程的形式提供-Arm&Unity Presents:移動應用程序的3D藝術優化
發表于 08-02 06:12
更強更通用:智源「悟道3.0」Emu多模態大模型開源,在多模態序列中「補全一切」
熱度。Flamingo 具備強大的多模態上下文少樣本學習能力。 Flamingo 走的技術路線是將大語言模型與一個預訓練視覺編碼器結合,并插入可學習
STEP與WRL 3D模型的區別
“ KiCad 7支持兩種格式的3D模型:STEP和WRL。本文簡述了STEP與WRL的區別,以及這兩種格式在哪些場合應用更合理。 ”
簡介
這兩種格式在本質上是不同的。wrl格式是一種細分的表面
發表于 06-16 11:26
求分享8MPLUS-BB的3D cad模型嗎?
以下是我的請求列表,
你能分享 8MPLUS-BB 的 3D cad 模型嗎?
我可以請求共享 8MPLUS-BB 的 Altium 設計文件嗎?
我們已經采購了 EVM 板,并計劃設計一個外殼。
發表于 06-05 13:37
評論