<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

CVer

文章:213 被閱讀:16.1w 粉絲數:2 關注數:0 點贊數:0

廣告

Vision Mamba:速度與內存的雙重突破

為了進一步評估研究方法在下游任務上(即分割、檢測和實例分割)的效率,本文將骨干網與常用的特征金字塔網....
的頭像 CVer 發表于 01-31 14:14 ?1636次閱讀
Vision Mamba:速度與內存的雙重突破

Adobe提出DMV3D:3D生成只需30秒!讓文本、圖像都動起來的新方法!

因此,本文研究者的目標是實現快速、逼真和通用的 3D 生成。為此,他們提出了 DMV3D。DMV3D....
的頭像 CVer 發表于 01-30 16:20 ?461次閱讀
Adobe提出DMV3D:3D生成只需30秒!讓文本、圖像都動起來的新方法!

高分工作!Uni3D:3D基礎大模型,刷新多個SOTA!

我們主要探索了3D視覺中scale up模型參數量和統一模型架構的可能性。在NLP / 2D vis....
的頭像 CVer 發表于 01-30 15:56 ?403次閱讀
高分工作!Uni3D:3D基礎大模型,刷新多個SOTA!

ICLR 2024 清華/新國大/澳門大學提出一模通吃的多粒度圖文組合檢索MUG:通過不確定性建模,兩行代碼完成部署

如上圖所示,不再采用嚴格的一對一匹配,而是促使模型專注于一對多匹配,即從細粒度過渡到粗粒度。因此,首....
的頭像 CVer 發表于 01-25 16:53 ?309次閱讀
ICLR 2024 清華/新國大/澳門大學提出一模通吃的多粒度圖文組合檢索MUG:通過不確定性建模,兩行代碼完成部署

Harvard FairSeg:第一個用于醫學分割的公平性數據集

為了解決這些挑戰,我們提出了第一個大規模醫學分割領域的公平性數據集, Harvard-FairSeg....
的頭像 CVer 發表于 01-25 16:52 ?278次閱讀
Harvard FairSeg:第一個用于醫學分割的公平性數據集

谷歌MIT最新研究證明:高質量數據獲取不難,大模型就是歸途

另一個極端是,監督學習方法(即SupCE)會將所有這些圖像視為單一類(如「金毛獵犬」)。這就忽略了這....
的頭像 CVer 發表于 01-15 15:40 ?289次閱讀
谷歌MIT最新研究證明:高質量數據獲取不難,大模型就是歸途

頂刊TIP 2023!浙大提出:基于全頻域通道選擇的的無監督異常檢測

Density-based方法:基于密度的方法通常采用預訓練的模型來提取輸入圖像的有意義嵌入向量,測....
的頭像 CVer 發表于 01-11 16:02 ?337次閱讀
頂刊TIP 2023!浙大提出:基于全頻域通道選擇的的無監督異常檢測

北京大學提出Repaint123:紋理質量、多視角一致性新SOTA!

之前,將圖像轉換為3D的方法通常采用Score Distillation Sampling (SDS....
的頭像 CVer 發表于 01-08 16:13 ?274次閱讀
北京大學提出Repaint123:紋理質量、多視角一致性新SOTA!

基于DiAD擴散模型的多類異常檢測工作

現有的基于計算機視覺的工業異常檢測技術包括基于特征的、基于重構的和基于合成的技術。最近,擴散模型因其....
的頭像 CVer 發表于 01-08 14:55 ?526次閱讀
基于DiAD擴散模型的多類異常檢測工作

4DGen:基于動態3D高斯的可控4D生成新工作

盡管3D和視頻生成取得了飛速的發展,由于缺少高質量的4D數據集,4D生成始終面臨著巨大的挑戰。
的頭像 CVer 發表于 01-04 15:57 ?392次閱讀
4DGen:基于動態3D高斯的可控4D生成新工作

語言模型的弱監督視頻異常檢測方法

LGT Adapter由局部關系Transformer和全局關系圖卷積串聯組成??紤]到常規的Tran....
的頭像 CVer 發表于 01-02 15:20 ?369次閱讀
語言模型的弱監督視頻異常檢測方法

SegRefiner:通過擴散模型實現高精度圖像分割

一類常見的 Refinement 方法是 Model-Specific 的,其通過在已有分割模型中引....
的頭像 CVer 發表于 12-28 11:24 ?683次閱讀
SegRefiner:通過擴散模型實現高精度圖像分割

Aleth-NeRF:低光增強與曝光糾正的新方向!不良光照場景下的新視角合成

最經典的原始NeRF為例,局部隱蔽場通過NeRF的MLP網絡產生,與原始NeRF的兩個輸出color....
的頭像 CVer 發表于 12-21 16:43 ?448次閱讀
Aleth-NeRF:低光增強與曝光糾正的新方向!不良光照場景下的新視角合成

沒有證據證實LK-99為常溫超導體

委員會說:「一些樣品在 100 攝氏度時的電阻率發生了急劇變化,然而,我們認為相變是由(樣品中的)雜....
的頭像 CVer 發表于 12-19 11:38 ?570次閱讀
沒有證據證實LK-99為常溫超導體

更強!Alpha-CLIP:讓CLIP關注你想要的任何地方!

然而CLIP必須以整張圖片作為輸入并進行特征提取,無法關注到指定的任意區域。然而,自然的2D圖片中往....
的頭像 CVer 發表于 12-10 10:28 ?558次閱讀
更強!Alpha-CLIP:讓CLIP關注你想要的任何地方!

何愷明新作RCG:無自條件圖像生成新SOTA!與MIT首次合作!

它有望超越條件圖像生成,并推動諸如分子設計或藥物發現這種不需要人類給注釋的應用往前發展(這也是為什么....
的頭像 CVer 發表于 12-10 10:24 ?588次閱讀
何愷明新作RCG:無自條件圖像生成新SOTA!與MIT首次合作!

計算機視覺迎來GPT時刻!UC伯克利三巨頭祭出首個純CV大模型!

在損失函數上,研究者從自然語言社區汲取靈感,即掩碼 token 建模已經「讓位給了」序列自回歸預測方....
的頭像 CVer 發表于 12-05 15:34 ?588次閱讀
計算機視覺迎來GPT時刻!UC伯克利三巨頭祭出首個純CV大模型!

超分畫質大模型!華為和清華聯合提出CoSeR:基于認知的萬物超分大模型

一是缺乏泛化能力。為了實現更好的超分效果,通常需要針對特定場景使用特定傳感器采集到的數據來進行模型訓....
的頭像 CVer 發表于 12-04 16:22 ?420次閱讀
超分畫質大模型!華為和清華聯合提出CoSeR:基于認知的萬物超分大模型

低成本擴大輸入分辨率!華科大提出Monkey:新的多模態大模型

下圖展示了Monkey的卓越性能,在 18 個不同的數據集上進行測試的結果表明,Monkey能夠很好....
的頭像 CVer 發表于 12-04 15:33 ?911次閱讀
低成本擴大輸入分辨率!華科大提出Monkey:新的多模態大模型

SAFA:高效時空視頻超分辨率的尺度自適應特征聚合

在時空超分中,除了 I0.5{HR}, 我們還要得到 I0{HR}, I1{HR},如果把它們看成三....
的頭像 CVer 發表于 11-29 16:31 ?367次閱讀
SAFA:高效時空視頻超分辨率的尺度自適應特征聚合

清華D提出首個二值化光譜重建算法

相比于常規的三通道 RGB 圖像,高光譜圖像包含幾十上百個波段,從而捕獲了關于成像場景更豐富的信息。....
的頭像 CVer 發表于 11-29 15:43 ?269次閱讀
清華D提出首個二值化光譜重建算法

小模型也能進行上下文學習!字節&amp;華東師大聯合提出自進化文本識別器

場景文本識別(Scene Text Recognition)的目標是將圖像中的文本內容提取出來。實際....
的頭像 CVer 發表于 11-27 16:28 ?583次閱讀
小模型也能進行上下文學習!字節&amp;華東師大聯合提出自進化文本識別器

通過擴散模型理解不可學習樣本對于數據隱私保護的脆弱性

一個直接的解決方案是設計一個特定的訓練方案,可以在不可利用的數據上進行訓練。這是不太理想的,因為它只....
的頭像 CVer 發表于 11-25 14:46 ?325次閱讀
通過擴散模型理解不可學習樣本對于數據隱私保護的脆弱性

通過擴散模型理解不可學習樣本對于數據隱私保護的脆弱性

在深度學習領域,網絡上充斥著大量可自由訪問的數據,其中包括像ImageNet和MS-Celeb-1M....
的頭像 CVer 發表于 11-25 14:45 ?328次閱讀
通過擴散模型理解不可學習樣本對于數據隱私保護的脆弱性

哈工大提出Myriad:利用視覺專家進行工業異常檢測的大型多模態模型

最近,大型多模態(即視覺和語言)模型(LMM)在圖像描述、視覺理解、視覺推理等多種視覺任務上表現出了....
的頭像 CVer 發表于 11-21 16:08 ?819次閱讀
哈工大提出Myriad:利用視覺專家進行工業異常檢測的大型多模態模型

谷歌新作UFOGen:通過擴散GAN實現大規模文本到圖像生成

擴散模型和 GAN 的混合模型最早是英偉達的研究團隊在 ICLR 2022 上提出的 DDGAN(《....
的頭像 CVer 發表于 11-21 16:02 ?384次閱讀
谷歌新作UFOGen:通過擴散GAN實現大規模文本到圖像生成

基于幾何分析的神經輻射場編輯方法

神經輻射場作為近期一個廣受關注的隱式表征方法,能合成照片級真實的多視角圖像。但因為其隱式建模的性質,....
的頭像 CVer 發表于 11-20 16:56 ?313次閱讀
基于幾何分析的神經輻射場編輯方法

RayDF:實時渲染!基于射線的三維重建新方法

在機器視覺和機器人領域的許多前沿應用中,學習準確且高效的三維形狀表達是十分重要的。然而,現有的基于三....
的頭像 CVer 發表于 11-17 16:23 ?460次閱讀
RayDF:實時渲染!基于射線的三維重建新方法

英偉達特供版芯片將上市:性能最高不到H100的20%

本周四,一些媒體首次報道了英偉達特供芯片的消息。報道稱,這三款新產品是在 H100 GPU 的基礎版....
的頭像 CVer 發表于 11-13 16:44 ?524次閱讀
英偉達特供版芯片將上市:性能最高不到H100的20%

GPT-4V在異常檢測上有多少強?華科大等最新測評來了!

不同領域的數據集包含各種數據類型和類別,如圖像、視頻、點云、時間序列等。每種數據類型可能需要不同的異....
的頭像 CVer 發表于 11-13 16:25 ?488次閱讀
GPT-4V在異常檢測上有多少強?華科大等最新測評來了!
亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>