<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達發布視頻AI大模型論文,自動駕駛是其潛在應用領域

Carol Li ? 來源:電子發燒友網 ? 作者:李彎彎 ? 2023-04-23 00:02 ? 次閱讀

電子發燒友網報道(文/李彎彎)近日,英偉達與慕尼黑大學等院校的研究人員聯合發布了一篇有關視頻潛在擴散模型(VideoLDM,Latent Diffusion Model)的論文,該模型能夠將文本轉換成視頻,實現高分辨率的長視頻合成。

研究人員指出,該模型其中一大具有潛力的應用領域,是駕駛數據的高分辨率視頻合成,能夠模擬特定駕駛場景,在自動駕駛領域中具有巨大的應用潛力。

AI大模型在自動駕駛領域的應用探索

當下,文字大模型、文生圖大模型發展迅速,受限于視頻訓練數據的計算成本高昂以及缺乏大規模公開可用的數據集等原因,視頻大模型的發展相對較慢。VideoLDM則成功解決了這個關鍵問題。

從原理上來分析,VideoLDM基于圖像數據集預訓練,并在此基礎上加入時間維度以形成視頻框架,最后在編碼的視頻序列上進行微調,得到視頻生成器。

目前,VideoLDM生成視頻的最高分辨率可達2048×1280、24幀。在論文中,該研究團隊給出了幾個駕駛場景視頻的生成案例:

pYYBAGRCZSOAQuZdAAfWNjkpXd4563.png

在自動駕駛領域,AI大模型被認為能夠賦能感知標注、決策推理等環節。今年4月11日,毫末智行了一款自動駕駛生成式大模型DriveGPT,中文名雪湖·海若。據介紹,毫末DriveGPT雪湖·海若現階段主要用于解決自動駕駛的認知決策問題。

DriveGPT雪湖·海若的底層模型采用GPT(Generative Pre-trained Transformer)生成式預訓練大模型,與ChatGPT使用自然語言進行輸入與輸出有所不同,DriveGPT輸入是感知融合后的文本序列,輸出是自動駕駛場景文本序列,即將自動駕駛場景Token化,形成“Drive Language”,最終完成自車的決策規控、障礙物預測以及決策邏輯鏈的輸出等任務。

毫末表示,DriveGPT雪湖·海若首發車型新摩卡DHT-PHEV,即將量產上市。DriveGPT雪湖·海若可以逐步應用到城市NOH、捷徑推薦、智能陪練以及脫困場景中。

汽車是AI大模型一大重要應用場景

隨著眾多AI大模型的發展,其商業應用場景也引起諸多思考,其中汽車被認為是其中一大重要的應用場景。最近,百度、阿里、商湯發布AI大模型,都在汽車智能方面展示出能力。

3月16日,百度正式發布文心一言,在發布會上,李彥宏展示了文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成五個使用場景中的綜合能力。

其中在多模態生成方面,文心一言展示出了文本、圖片、音頻和視頻的生成能力。李彥宏表示,多模態是生成式AI一個明確的發展趨勢。未來,隨著百度多模態統一大模型的能力增強,文心一言的多模態生成能力會不斷提升。

文心一言發布之后,長安汽車官宣,旗下逸達將成為國內首款搭載文心一言的量產車型,后續將通過軟件升級的形式搭載到新車上。除了長安汽車外,集度、吉利、嵐圖、紅旗、長城、東風日產、愛馳、零跑、海馬等多家車企都已確認將內測體驗并接入其相關能力,與百度共同打造針對汽車智能場景的大模型人工智能交互體驗。

4月11日,阿里也正式發布其AI大模型通義千問。與文心一言、ChatGPT類似,作為大語言模型,通義千問支持多輪交互及復雜指令理解、多模態融合以及外部增強API,能夠實現多輪對話、文案創作、邏輯推理、多模態理解、多語言支持等功能。

在近日第二十屆上海國際汽車工業展覽會上,阿里集團副總裁、斑馬智行CEO張春暉談到,汽車是大模型最大的交互應用場景,智能汽車操作系統將會被重塑。他表示,AliOS智能汽車操作系統已接入通義千問大模型進行測試,相關技術會率先在智己汽車上落地。

商湯科技推出的“日日新SenseNova”大模型體系,含中文語言大模型應用平臺“商量SenseChat”、圖片生成模型“秒畫SenseMirage”、AI數字人視頻生成平臺“如影SenseAvatar”、3D內容生成平臺“瓊宇SenseSpace”和“格物SenseThings”等,

在此次展會上,商湯科技展示了其大模型在車艙智能化方面的實力,商湯語言大模型“商量SenseChat”會與嘉賓交流互動,并推薦個性化體驗內容。商量SenseChat還支持郵件模式,會自動提煉郵件關鍵信息,幫助用戶節省閱讀時間?!懊氘婼enseMirage”文生圖創作平臺亦首次與展示艙結合,借助商湯AIGC模型能力自動為嘉賓生成各種風格的照片。

在“日日新SenseNova”大模型體系的支持,其自動駕駛產品方案也獲得持續創新的能力。商湯絕影率先實現BEV感知在國內首批量產落地,還首創自動駕駛GOP感知體系,充分提升數據利用效率,引領感知技術突破。

商湯絕影的自動駕駛GOP感知體系可將目標數據獲取的人力成本降低94%,目前已投入量產。憑借通用視覺模型,絕影有效實現了對超過3000種物體目標的高精度識別,降低智能駕駛系統對激光雷達和高精度地圖的依賴。

小結

今年以來,AI大模型的發展如火如荼,國內外眾多科技企業紛紛入局。隨著各種AI大模型陸續發布,其商業應用場景也引起業界關注,而汽車被認為是其中一大重要的應用場景。

從目前的情況來看,百度、阿里發布的AI大模型已經在推進汽車領域的應用。不過當前主要還是在智能座艙方面,用于人工智能交流對話等領域,在自動駕駛方面的應用少有提及。估計原因在于,雖然其AI大模型都具有視頻生成能力,但這方面的能力還有待升級。就如李彥宏在發布會上就提到,視頻生成能力方面,因為成本較高,現階段還未對所有用戶開放,當然未來會逐步接入。

可以看到,AI大模型在汽車的智能座艙、自動駕駛等領域都將有所作為,業界也正在推進AI大模型加速上車,預計在智能座艙方面會率先落地,而在自動駕駛方面還需要在視頻能力方面有更多突破。而英偉達此次發布視頻模型論文,可能會起到一定的引領作用。



聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    22

    文章

    3464

    瀏覽量

    88759
  • 自動駕駛
    +關注

    關注

    774

    文章

    13205

    瀏覽量

    163738
收藏 人收藏

    評論

    相關推薦

    百度發布全球首個L4級自動駕駛模型

    近日,百度Apollo宣布了全球首個支持L4級自動駕駛的大模型Apollo ADFM(Autonomous Driving Foundation Model)。這一突破性的技術成果,標志著自動駕駛
    的頭像 發表于 05-17 09:58 ?157次閱讀

    進一步解讀英偉 Blackwell 架構、NVlink及GB200 超級芯片

    。 **5.**自動駕駛自動駕駛領域,Blackwell 架構的 GPU 可以用于感知和決策算法的計算,提高車輛的安全性和自主性。 這些只是英偉
    發表于 05-13 17:16

    智能駕駛模型:有望顯著提升自動駕駛系統的性能和魯棒性

    智能駕駛模型是近年來人工智能領域自動駕駛領域最為前沿的研究方向之一,它融合了深度學習、多模態融合、世界
    的頭像 發表于 05-07 17:20 ?887次閱讀
    智能<b class='flag-5'>駕駛</b>大<b class='flag-5'>模型</b>:有望顯著提升<b class='flag-5'>自動駕駛</b>系統的性能和魯棒性

    英偉達參投英國自動駕駛公司融資

    英偉達近日宣布,將參與英國自動駕駛技術領軍企業Wayve Technologies Ltd的10.5億美元融資。此次融資由軟銀集團主導,Wayve的現有股東微軟也增加了投資。
    的頭像 發表于 05-07 14:51 ?170次閱讀

    未來已來,多傳感器融合感知是自動駕駛破局的關鍵

    巨大的進展;自動駕駛開始摒棄手動編碼規則和機器學習模型的方法,轉向全面采用端到端的神經網絡AI系統,它能模仿學習人類司機的駕駛,遇到場景直接輸入傳感器數據,再直接輸出轉向、制動和加速信
    發表于 04-11 10:26

    上海人工智能實驗室發布自動駕駛視頻生成模型GenAD

    上海人工智能實驗室近日取得重大技術突破,聯合香港科技大學、德國圖賓根大學及香港大學共同研發并發布了大規模自動駕駛視頻生成模型——GenAD。這一創新
    的頭像 發表于 03-26 10:40 ?230次閱讀

    高通自動駕駛靠軟件開發革新力壓英偉自動駕駛芯片

    拋開價格不談,英偉自動駕駛芯片毫無疑問是最強的,設計范圍在2019年底確定的Orin至今仍是量產最強的自動駕駛芯片,但除了奔馳外的歐美大廠更傾向于選擇高通平臺
    的頭像 發表于 02-20 13:50 ?965次閱讀
    高通<b class='flag-5'>自動駕駛</b>靠軟件開發革新力壓<b class='flag-5'>英偉</b>達<b class='flag-5'>自動駕駛</b>芯片

    自動駕駛領域的數據集匯總

    自動駕駛論文哪少的了數據集,今天筆者將為大家推薦一篇最新的綜述,總結了200多個自動駕駛領域的數據集,大家堆工作量的時候也可以找一些小眾的數據集刷榜~
    的頭像 發表于 01-19 10:48 ?495次閱讀
    <b class='flag-5'>自動駕駛</b><b class='flag-5'>領域</b>的數據集匯總

    LabVIEW開發自動駕駛的雙目測距系統

    精確的距離信息,從而提高車輛的主動安全性能。這一系統的開發和應用有望在自動駕駛領域取得更多突破性進展。 ? 這是LabVIEW的一個功能介紹,更多的使用方法與開發案例,歡迎登錄官網,了解更多信息。有需要LabVIEW項目合作開發,請與我們聯系。
    發表于 12-19 18:02

    英偉達拓展中國自動駕駛團隊 高通能否戰勝英偉

    英偉達(Nvidia)微信官方賬號發布消息,該公司正在擴大在中國的自動駕駛團隊,要招募的職缺大約25個,包括:產品工程、系統整合、車輛測試、規劃控制、地圖等。
    的頭像 發表于 12-01 10:46 ?1246次閱讀

    李彥宏:大模型將走向多模態,自動駕駛是大模型重構物理世界的典型代表

    世界之外,一定會重構物理世界,自動駕駛就是大模型重構物理世界的一個典型應用?!崩顝┖瓯硎?,大模型將會讓百度的自動駕駛能力超越經驗系統,更聰明處理復雜場景,實現更廣泛的時空覆蓋。 作為整
    的頭像 發表于 10-18 19:20 ?333次閱讀
    李彥宏:大<b class='flag-5'>模型</b>將走向多模態,<b class='flag-5'>自動駕駛</b>是大<b class='flag-5'>模型</b>重構物理世界的典型代表

    【KV260視覺入門套件試用體驗】八、VITis AI自動駕駛多任務執行MultiTask V3

    是一種模型,旨在同時執行自動駕駛場景中的不同任務,同時實現優異的性能和效率。這些任務包括對象檢測、分割、車道檢測、可行駛區域分割和深度估算,這些都是自動駕駛感知模塊的重要組成部分。 三、代碼實現
    發表于 09-26 16:43

    華為盤古大模型如何賦能自動駕駛?

    ,作為高度靈活、高度模塊化的AI技術平臺,不僅可以應用于智慧城市、工業制造等領域,也可以為自動駕駛注入更強勁的AI動力。那么,華為盤古大模型
    的頭像 發表于 08-31 10:18 ?1560次閱讀

    地平線促進自由開放的學術研究 推動自動駕駛技術發展

    ? 地平線研究員胡義涵和劉強代表全體合作者上臺領獎 6月,在加拿大溫哥華舉辦的計算機視覺領域頂級會議CVPR上,首篇以自動駕駛為主題的最佳論文“Planning-oriented
    的頭像 發表于 06-27 11:40 ?502次閱讀

    NVIDIA 自動駕駛實驗室:如何通過 AI 分割模型增強自動駕駛安全性

    感知至關重要,在處理未知條件時尤為明顯。 本期自動駕駛實驗室視頻中,將討論一種名為 SegFormer 的 Vision Transformer 模型,它能夠在保持高效率的同時生成魯棒的語義分割結果
    的頭像 發表于 06-16 11:45 ?496次閱讀
    NVIDIA <b class='flag-5'>自動駕駛</b>實驗室:如何通過 <b class='flag-5'>AI</b> 分割<b class='flag-5'>模型</b>增強<b class='flag-5'>自動駕駛</b>安全性
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>