<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

英偉達發布視頻AI大模型論文，自動駕駛是其潛在應用領域

電子發燒友網報道（文/李彎彎）近日，英偉達與慕尼黑大學等院校的研究人員聯合發布了一篇有關視頻潛在擴散模型（VideoLDM，Latent Diffusion Model）的論文，該模型能夠將文本轉換成視頻，實現高分辨率的長視頻合成。

研究人員指出，該模型其中一大具有潛力的應用領域，是駕駛數據的高分辨率視頻合成，能夠模擬特定駕駛場景，在自動駕駛領域中具有巨大的應用潛力。

AI大模型在自動駕駛領域的應用探索

當下，文字大模型、文生圖大模型發展迅速，受限于視頻訓練數據的計算成本高昂以及缺乏大規模公開可用的數據集等原因，視頻大模型的發展相對較慢。VideoLDM則成功解決了這個關鍵問題。

從原理上來分析，VideoLDM基于圖像數據集預訓練，并在此基礎上加入時間維度以形成視頻框架，最后在編碼的視頻序列上進行微調，得到視頻生成器。

目前，VideoLDM生成視頻的最高分辨率可達2048×1280、24幀。在論文中，該研究團隊給出了幾個駕駛場景視頻的生成案例：

在自動駕駛領域，AI大模型被認為能夠賦能感知標注、決策推理等環節。今年4月11日，毫末智行了一款自動駕駛生成式大模型DriveGPT，中文名雪湖·海若。據介紹，毫末DriveGPT雪湖·海若現階段主要用于解決自動駕駛的認知決策問題。

DriveGPT雪湖·海若的底層模型采用GPT（Generative Pre-trained Transformer）生成式預訓練大模型，與ChatGPT使用自然語言進行輸入與輸出有所不同，DriveGPT輸入是感知融合后的文本序列，輸出是自動駕駛場景文本序列，即將自動駕駛場景Token化，形成“Drive Language”，最終完成自車的決策規控、障礙物預測以及決策邏輯鏈的輸出等任務。

毫末表示，DriveGPT雪湖·海若首發車型新摩卡DHT-PHEV，即將量產上市。DriveGPT雪湖·海若可以逐步應用到城市NOH、捷徑推薦、智能陪練以及脫困場景中。

汽車是AI大模型一大重要應用場景

隨著眾多AI大模型的發展，其商業應用場景也引起諸多思考，其中汽車被認為是其中一大重要的應用場景。最近，百度、阿里、商湯發布AI大模型，都在汽車智能方面展示出能力。

3月16日，百度正式發布文心一言，在發布會上，李彥宏展示了文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成五個使用場景中的綜合能力。

其中在多模態生成方面，文心一言展示出了文本、圖片、音頻和視頻的生成能力。李彥宏表示，多模態是生成式AI一個明確的發展趨勢。未來，隨著百度多模態統一大模型的能力增強，文心一言的多模態生成能力會不斷提升。

文心一言發布之后，長安汽車官宣，旗下逸達將成為國內首款搭載文心一言的量產車型，后續將通過軟件升級的形式搭載到新車上。除了長安汽車外，集度、吉利、嵐圖、紅旗、長城、東風日產、愛馳、零跑、海馬等多家車企都已確認將內測體驗并接入其相關能力，與百度共同打造針對汽車智能場景的大模型人工智能交互體驗。

4月11日，阿里也正式發布其AI大模型通義千問。與文心一言、ChatGPT類似，作為大語言模型，通義千問支持多輪交互及復雜指令理解、多模態融合以及外部增強API，能夠實現多輪對話、文案創作、邏輯推理、多模態理解、多語言支持等功能。

在近日第二十屆上海國際汽車工業展覽會上，阿里集團副總裁、斑馬智行CEO張春暉談到，汽車是大模型最大的交互應用場景，智能汽車操作系統將會被重塑。他表示，AliOS智能汽車操作系統已接入通義千問大模型進行測試，相關技術會率先在智己汽車上落地。

商湯科技推出的“日日新SenseNova”大模型體系，含中文語言大模型應用平臺“商量SenseChat”、圖片生成模型“秒畫SenseMirage”、AI數字人視頻生成平臺“如影SenseAvatar”、3D內容生成平臺“瓊宇SenseSpace”和“格物SenseThings”等，

在此次展會上，商湯科技展示了其大模型在車艙智能化方面的實力，商湯語言大模型“商量SenseChat”會與嘉賓交流互動，并推薦個性化體驗內容。商量SenseChat還支持郵件模式，會自動提煉郵件關鍵信息，幫助用戶節省閱讀時間?！懊氘婼enseMirage”文生圖創作平臺亦首次與展示艙結合，借助商湯AIGC模型能力自動為嘉賓生成各種風格的照片。

在“日日新SenseNova”大模型體系的支持，其自動駕駛產品方案也獲得持續創新的能力。商湯絕影率先實現BEV感知在國內首批量產落地，還首創自動駕駛GOP感知體系，充分提升數據利用效率，引領感知技術突破。

商湯絕影的自動駕駛GOP感知體系可將目標數據獲取的人力成本降低94%，目前已投入量產。憑借通用視覺模型，絕影有效實現了對超過3000種物體目標的高精度識別，降低智能駕駛系統對激光雷達和高精度地圖的依賴。

小結

今年以來，AI大模型的發展如火如荼，國內外眾多科技企業紛紛入局。隨著各種AI大模型陸續發布，其商業應用場景也引起業界關注，而汽車被認為是其中一大重要的應用場景。

從目前的情況來看，百度、阿里發布的AI大模型已經在推進汽車領域的應用。不過當前主要還是在智能座艙方面，用于人工智能交流對話等領域，在自動駕駛方面的應用少有提及。估計原因在于，雖然其AI大模型都具有視頻生成能力，但這方面的能力還有待升級。就如李彥宏在發布會上就提到，視頻生成能力方面，因為成本較高，現階段還未對所有用戶開放，當然未來會逐步接入。

可以看到，AI大模型在汽車的智能座艙、自動駕駛等領域都將有所作為，業界也正在推進AI大模型加速上車，預計在智能座艙方面會率先落地，而在自動駕駛方面還需要在視頻能力方面有更多突破。而英偉達此次發布視頻模型論文，可能會起到一定的引領作用。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

英偉達

英偉達

+關注

關注
22

文章
3464

瀏覽量
88759
自動駕駛

自動駕駛

+關注

關注
774

文章
13205

瀏覽量
163738

評論

相關推薦

百度發布全球首個L4級自動駕駛大模型

近日，百度Apollo宣布了全球首個支持L4級自動駕駛的大模型Apollo ADFM（Autonomous Driving Foundation Model）。這一突破性的技術成果，標志著自動駕駛

的頭像

發表于 05-17 09:58 ?157次閱讀

進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

。 **5.**自動駕駛 在自動駕駛領域，Blackwell 架構的 GPU 可以用于感知和決策算法的計算，提高車輛的安全性和自主性。這些只是英偉

發表于 05-13 17:16

智能駕駛大模型：有望顯著提升自動駕駛系統的性能和魯棒性

智能駕駛大模型是近年來人工智能領域和自動駕駛領域最為前沿的研究方向之一，它融合了深度學習、多模態融合、世界

發表于 05-07 17:20 ?887次閱讀

英偉達參投英國自動駕駛公司融資

英偉達近日宣布，將參與英國自動駕駛技術領軍企業Wayve Technologies Ltd的10.5億美元融資。此次融資由軟銀集團主導，Wayve的現有股東微軟也增加了投資。

發表于 05-07 14:51 ?170次閱讀

未來已來，多傳感器融合感知是自動駕駛破局的關鍵

巨大的進展；自動駕駛開始摒棄手動編碼規則和機器學習模型的方法，轉向全面采用端到端的神經網絡AI系統，它能模仿學習人類司機的駕駛，遇到場景直接輸入傳感器數據，再直接輸出轉向、制動和加速信

發表于 04-11 10:26

上海人工智能實驗室發布自動駕駛視頻生成模型GenAD

上海人工智能實驗室近日取得重大技術突破，聯合香港科技大學、德國圖賓根大學及香港大學共同研發并發布了大規模自動駕駛視頻生成模型——GenAD。這一創新

發表于 03-26 10:40 ?230次閱讀

高通自動駕駛靠軟件開發革新力壓英偉達自動駕駛芯片

拋開價格不談，英偉達自動駕駛芯片毫無疑問是最強的，設計范圍在2019年底確定的Orin至今仍是量產最強的自動駕駛芯片，但除了奔馳外的歐美大廠更傾向于選擇高通平臺

發表于 02-20 13:50 ?965次閱讀

自動駕駛領域的數據集匯總

發自動駕駛論文哪少的了數據集，今天筆者將為大家推薦一篇最新的綜述，總結了200多個自動駕駛領域的數據集，大家堆工作量的時候也可以找一些小眾的數據集刷榜~

發表于 01-19 10:48 ?495次閱讀

LabVIEW開發自動駕駛的雙目測距系統

精確的距離信息，從而提高車輛的主動安全性能。這一系統的開發和應用有望在自動駕駛領域取得更多突破性進展。 ? 這是LabVIEW的一個功能介紹，更多的使用方法與開發案例，歡迎登錄官網，了解更多信息。有需要LabVIEW項目合作開發，請與我們聯系。

發表于 12-19 18:02

英偉達拓展中國自動駕駛團隊高通能否戰勝英偉達

英偉達（Nvidia）微信官方賬號發布消息，該公司正在擴大在中國的自動駕駛團隊，要招募的職缺大約25個，包括：產品工程、系統整合、車輛測試、規劃控制、地圖等。

發表于 12-01 10:46 ?1246次閱讀

李彥宏：大模型將走向多模態，自動駕駛是大模型重構物理世界的典型代表

世界之外，一定會重構物理世界，自動駕駛就是大模型重構物理世界的一個典型應用?！崩顝┖瓯硎?，大模型將會讓百度的自動駕駛能力超越經驗系統，更聰明處理復雜場景，實現更廣泛的時空覆蓋。作為整

發表于 10-18 19:20 ?333次閱讀

【KV260視覺入門套件試用體驗】八、VITis AI自動駕駛多任務執行MultiTask V3

是一種模型，旨在同時執行自動駕駛場景中的不同任務，同時實現優異的性能和效率。這些任務包括對象檢測、分割、車道檢測、可行駛區域分割和深度估算，這些都是自動駕駛感知模塊的重要組成部分。三、代碼實現

發表于 09-26 16:43

華為盤古大模型如何賦能自動駕駛？

，作為高度靈活、高度模塊化的AI技術平臺，不僅可以應用于智慧城市、工業制造等領域，也可以為自動駕駛注入更強勁的AI動力。那么，華為盤古大模型

發表于 08-31 10:18 ?1560次閱讀

地平線促進自由開放的學術研究推動自動駕駛技術發展

? 地平線研究員胡義涵和劉強代表全體合作者上臺領獎 6月，在加拿大溫哥華舉辦的計算機視覺領域頂級會議CVPR上，首篇以自動駕駛為主題的最佳論文“Planning-oriented

發表于 06-27 11:40 ?502次閱讀

NVIDIA 自動駕駛實驗室：如何通過 AI 分割模型增強自動駕駛安全性

感知至關重要，在處理未知條件時尤為明顯。本期自動駕駛實驗室視頻中，將討論一種名為 SegFormer 的 Vision Transformer 模型，它能夠在保持高效率的同時生成魯棒的語義分割結果

發表于 06-16 11:45 ?496次閱讀

Carol Li
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 國內最值得關注的10家人工智能語音識別公司
Hot 國內外 18 家藍牙芯片廠商及產品型號集合

New 邊緣AI網關，將具備更強大的計算和學習能力
New 邊緣AI硬件技術、算法、平臺正在不斷創新/升級優化

精選推薦
更多

文章

資料

帖子

采用144核，能效提升66%！英特爾至強6處理器震撼上市，加速數據中心升級

章鷹觀察
14小時前

763 閱讀

如何移植FFmpeg

ElfBoard
2天前

557 閱讀

基于Arm Cortex-CM85內核的RA8D1作為控制器通過MIPI DSI實現LVGL顯示

瑞薩MCU小百科
2天前

778 閱讀

便攜式直流接地故障查找儀如何使用——每日了解電力知識

武漢摩恩
2天前

803 閱讀

重磅！英特爾發布intel3制程至強6能效核處理器，賦能數據中心能效升級

章鷹觀察
2天前

813 閱讀

E-Ink電子紙芯片S1D13521規格書

kmno4
2570

免費

69下載

21個單片機設計題目和設計資料合集免費下載

大學不要走
2.34 MB

免費

169下載

Julia編程基礎

bigbangboom
3.02 MB

免費

0下載

BytePS高性能分布式深度學習訓練框架

風尚男人
0.37 MB

免費

0下載

高精度低噪聲 1.5A LDO 穩壓器PCD3932數據手冊

pc16211
0.75 MB

免費

0下載

I.MX6ULL-飛凌 ElfBoard ELF1板卡 - 如何在Ubuntu中編譯OpenCV庫(X86架構）

jf_25331175
3天前

713 閱讀

鴻蒙原生應用元服務開發-設備管理USB服務開發場景與接口

李洋水蛟龍
3天前

300 閱讀

嵌入式學習-飛凌ElfBoard ELF 1板卡 - 如何在Ubuntu中編譯OpenCV庫

jf_25331175
3天前

897 閱讀

【留言有禮】佳節至，分享“粽”要記憶，傳遞溫馨祝福，贏取精美禮品！

ElecFans小喇叭
4天前

977 閱讀

無刷電機用的單電阻采樣的FOC，拿天線貼著電機線或者貼近采樣芯片，電機就會停轉

剛剛回國弄
4天前

1481 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看