<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

千億參數多模態大模型,“紫東太初”規?;瘧眉铀?/h1>

電子發燒友網報道(文/李彎彎)過去近一年時間,國內外大模型技術越來越成熟,并逐步在不同場景中實現實現應用。在國內,作為早早布局多模態大模型的科研機構,中國科學院自動化研究所自2019年開始在語音、文本、圖像等單模態大模型研究和應用的基礎上,向多模態大模型攻關,并于2021年7月正式發布了全球首個千億參數多模態大模型紫東太初。

2023年6月16日,中國科學院自動化研究所和武漢人工智能研究院發布紫東太初2.0。2023年8月,中科院旗下紫東太初的大模型位列首批通過《生成式人工智能服務管理暫行辦法》備案的名單,可正式上線面向公眾提供服務。如今,紫東太初已經在不同領域實現應用。

紫東太初多模態大模型的技術進展

紫東太初是全球首個圖文音(視覺-文本-語音)三模態預訓練模型(OPT-Omni-Perception pre-Trainer),同時具備跨模態理解與跨模態生成能力。

紫東太初2.0在文本、圖像、語音三模態的基礎上,融入3D點云、視頻、信號等更多模態數據,現已支持多輪問答、文本創作、圖像生成、3D 理解、信號分析等全面問答任務,擁有更強的認知、理解、創作能力,帶來全新互動體驗。

紫東太初多模態大模型擁有三大關鍵技術和六大核心能力。三大關鍵技術:多模態理解與生成多任務統一建模;面向國產化軟硬件的高效訓練與部署;多模態預訓練模型架構設計與優化。六大核心能力:多模態統一表示與語義關聯;預訓練模型網絡架構合計;模型適配與分布式訓練;跨模態內容轉化與生成;標注受限自監督模型學習;模型輕量化與推理加速。

近期,為推動數字技術與行業應用深度融合,提供更加先進的新一代人工智能解決方案,助力產業升級和發展,武漢人工智能研究院基于“紫東太初”全模態大模型,搭建全棧國產化“紫東太初”大模型開放服務平臺?!白蠔|太初”跨模態通用人工智能平臺以多模態大模型為核心,基于全棧國產化基礎軟硬件平臺,可支撐全場景AI應用。

武漢人工智能研究院院長王金橋不久前表示,武漢人工智能研究院是以科技創新與成果轉化雙輪驅動的新型研發機構,作為湖北省人工智能產業鏈“鏈創”平臺,基于“紫東太初”多模態大模型,在智能制造、智慧醫療等多個領域打造了典型示范應用,并搭建全棧國產化自主可控的紫東太初大模型開放服務平臺,全力打造湖北省數字經濟智能底座。

“紫東太初”大模型正在賦能千行百業

據介紹,目前紫東太初已經在各行各業中實現應用。據武漢人工智能研究院官網介紹,該機構基于“紫東太初”多模態大模型攜手長安歐尚,共同引入了元宇宙的概念,創造出YYDS虛擬數字人,可以通過復刻自己或者親人的形象和聲音,捏出專屬的語音助手。

攜手杭州市文廣旅游局、杭州移動,基于“紫東太初”多模態大模型打造文旅場景首個多模態AI數字人“杭小憶”,為杭州文化旅游提供具有親和力、感染力、吸引力的代言人形象。利用AR/VR技術還原南宋御街歷史風貌,包含陶瓷燒制釉變、活字印刷、特色小吃等場景。

在紡織制造領域,該機構與魏橋集團合作了布匹缺陷檢測設備,該設備通過接入“紫東太初”大模型的質檢攝像頭識別70多種布匹瑕疵,能夠在較短時間內就滿足生產的精度要求,在驗布檢驗環節相比人工實現了質的突破,瑕疵識別檢出率高達95%。還能夠基于聲音發現瑕疵,提升紡織行業織布、驗布效率,助力紡織工業質檢。

在醫療領域,“紫東太初-火石數智燧石醫療大模型”最新應用成果于近期正式發布,九州通醫療器械集團項目總監徐琳介紹,對于骨科疾病治療場景來說,按照監管要求,目前很多醫院設備科的工作人員,是拿著放大鏡一顆一顆地去數骨釘等耗材,統計使用數量、類型,驗收器械的批號和實物是否一致,這種核驗過程不夠高效快捷。

她透露,今年3月起,九州通與武漢人工智能研究院聯合進行技術研發,歷經半年,完成骨科內植入耗材系統“骨科嫦娥”智慧系統研發。系統利用人工智能、深度神經卷積以及大模型等技術,在一個完整手術治療周期內,對骨科復雜植入物和工具進行智慧識別、全程追蹤、報表統計、能效分析、數據查詢、共享協同等閉環式、智慧化高效管理,試行效果良好。

“江城洛神”是基于“紫東太初”大模型打造的人工智能內容創作平臺,通過多模態技術實現圖像編輯與生成,輔助內容生產,用戶無需任何專業技能,只需輕輕一點,便可輕松創造出屬于自己的藝術作品,可廣泛運用于設計、影視、游戲等多個領域。

以室內裝修設計領域為例,只需提供一張戶型圖,“江城洛神”就可自動生成多種裝修設計樣式,提示詞越多、越精細,生成質量就越高,還能根據不同提示自動對結果進行編輯。

王金橋表示,“紫東太初”大模型正在賦能千行百業,推動數字經濟全面發展?!白蠔|太初”人工智能開放服務平臺目前已成功應用于汽車制造質檢、媒體信息服務、文化旅游、手語教育、紡織生產質檢、醫療器械等10余個領域,形成規?;瘧寐涞?。

小結

人工智能未來的10年將是生成式人工智能的10年,如今國內外各大科技巨頭及AI企業已經從初期招兵買馬啟動大模型產品的技術研發,進入到拓展應用場景的階段。如今市面上已經發布的大模型有幾百款。然而,通用大模型就如早期的操作系統一樣,最終只會需要一兩個或者兩三個。未來,就看誰能夠真正了解市場需求,最終脫穎而出了。





聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
收藏 人收藏

    評論

    相關推薦

    通義千問開源千億參數模型

    通義千問近日開源了其首個千億參數模型Qwen1.5-110B,這是其全系列中首個達到千億級別的開源模型。Qwen1.5-110B模型繼承了
    的頭像 發表于 05-08 11:01 ?293次閱讀

    商湯科技聯合海通證券發布多模態全棧式大模型

    商湯科技近日隆重推出了其最新研發的“日日新SenseNova 5.0”大模型體系,并與海通證券攜手,共同發布了業內首個專為金融行業量身打造的多模態全棧式大模型。此次強強聯合旨在加速
    的頭像 發表于 05-07 14:15 ?181次閱讀

    聯發科天璣9300搭載通義千問大模型,阿里云提供解決方案

    通義千問大模型已開源多項版本,包括18億、70億、140億及720億參數等版本伴隨視覺、音頻多模態能力提升。阿里云于去年10月發布的通義千問2.0,其參數
    的頭像 發表于 03-28 09:55 ?165次閱讀

    蘋果發布300億參數MM1多模態模型

    近日,科技巨頭蘋果公司在一篇由多位專家共同撰寫的論文中,正式公布了其最新的多模態模型研究成果——MM1。這款具有高達300億參數的多模態模型
    的頭像 發表于 03-19 11:19 ?335次閱讀

    螞蟻推出20億參數模態遙感模型SkySense

    據了解,負責開發的百靈團隊利用自身擁有的19億遙感影像數據集進行了預訓練,從而生成了具有20.6億參數的SkySense大模型。官方稱其為全球范圍內參數規模最大、任務覆蓋最全且識別精度
    的頭像 發表于 02-28 15:53 ?275次閱讀

    1-2B參數規模模型的使用心得

    模型時代,根據大模型縮放定律,大家通常都在追求模型參數規模更大、訓練的數據更多,從而使得大模型
    的頭像 發表于 12-28 11:47 ?573次閱讀
    1-2B<b class='flag-5'>參數</b><b class='flag-5'>規模</b>大<b class='flag-5'>模型</b>的使用心得

    從Google多模態模型看后續大模型應該具備哪些能力

    前段時間Google推出Gemini多模態模型,展示了不凡的對話能力和多模態能力,其表現究竟如何呢?
    的頭像 發表于 12-28 11:19 ?521次閱讀
    從Google多<b class='flag-5'>模態</b>大<b class='flag-5'>模型</b>看后續大<b class='flag-5'>模型</b>應該具備哪些能力

    模型+多模態的3種實現方法

    我們知道,預訓練LLM已經取得了諸多驚人的成就, 然而其明顯的劣勢是不支持其他模態(包括圖像、語音、視頻模態)的輸入和輸出,那么如何在預訓練LLM的基礎上引入跨模態的信息,讓其變得更強大、更通用呢?本節將介紹“大
    的頭像 發表于 12-13 13:55 ?810次閱讀
    大<b class='flag-5'>模型</b>+多<b class='flag-5'>模態</b>的3種實現方法

    中國電信大模型做得怎么樣了?

    千億參數的星辰大模型發布。從2021年10月啟動自研城市治理大模型,星辰大模型已經走過語義大模型
    發表于 11-15 12:24 ?382次閱讀
    中國電信大<b class='flag-5'>模型</b>做得怎么樣了?

    探究編輯多模態大語言模型的可行性

    不同于單模態模型編輯,多模態模型編輯需要考慮更多的模態信息。文章出發點依然從單模態
    發表于 11-09 14:53 ?287次閱讀
    探究編輯多<b class='flag-5'>模態</b>大語言<b class='flag-5'>模型</b>的可行性

    北大&amp;華為提出:多模態基礎大模型的高效微調

    深度學習的大模型時代已經來臨,越來越多的大規模預訓練模型在文本、視覺和多模態領域展示出杰出的生成和推理能力。然而大模型巨大的
    的頭像 發表于 11-08 16:20 ?330次閱讀
    北大&amp;華為提出:多<b class='flag-5'>模態</b>基礎大<b class='flag-5'>模型</b>的高效微調

    云知聲千億參數山海大模型首次亮相

    8月28日,山海大模型迎來又一次迭代升級,當前版本參數規模達到千億,實現了多學科能力、醫療能力雙提升,實測性能在C-Eval全球大模型綜合性
    的頭像 發表于 08-31 16:00 ?428次閱讀
    云知聲<b class='flag-5'>千億</b><b class='flag-5'>參數</b>山海大<b class='flag-5'>模型</b>首次亮相

    盤古大模型和紫東太初的區別

    盤古大模型和紫東太初的區別 無論是盤古大模型還是紫東太初,都是關于宇宙起源的理論模型,二者都試圖解釋宇宙的起源、演化以及它們之間的聯系。盡管
    的頭像 發表于 08-31 09:01 ?790次閱讀

    更強更通用:智源「悟道3.0」Emu多模態模型開源,在多模態序列中「補全一切」

    當前學界和工業界都對多模態模型研究熱情高漲。去年,谷歌的 Deepmind 發布了多模態視覺語言模型 Flamingo ,它使用單一視覺語言模型
    的頭像 發表于 07-16 20:45 ?420次閱讀
    更強更通用:智源「悟道3.0」Emu多<b class='flag-5'>模態</b>大<b class='flag-5'>模型</b>開源,在多<b class='flag-5'>模態</b>序列中「補全一切」

    單張消費級顯卡微調多模態模型

    把大模型的訓練門檻打下來!我們在單張消費級顯卡上實現了多模態模型(LaVIN-7B, LaVIN-13B)的適配和訓練
    的頭像 發表于 06-30 10:43 ?1473次閱讀
    單張消費級顯卡微調多<b class='flag-5'>模態</b>大<b class='flag-5'>模型</b>

    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>