<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

高通:未來幾個月有望在終端側運行超100億參數的模型

Carol Li ? 來源:電子發燒友網 ? 作者:李彎彎 ? 2023-07-26 00:15 ? 次閱讀

電子發燒友網報道(文/李彎彎)日前,在2023世界半導體大會暨南京國際半導體博覽會上,高通全球副總裁孫剛發表演講時談到,目前高通能夠支持參數超過10億的模型在終端上運行,未來幾個月內超過100億參數的模型將有望在終端側運行。

大模型在終端側運行的重要性

生成式AI正在快速發展,數據顯示,2020年至2022年,生成式AI相關的投資增長425%,初步預估生成式AI市場規模將達到1萬億美元。

然而孫剛指出,云經濟難以支持生成式AI規?;卣?,為實現規?;卣?,AI處理的中心正在向邊緣轉移。比如XR、汽車、手機、PC、物聯網,生成式AI將影響各類終端上的應用。

高通在這方面展示出了領先的優勢,高通AI引擎由多個硬件和軟件組件組成,用于在驍龍移動平臺上為終端側AI推理加速。它采用異構計算架構,包括高通Hexagon處理器、Adreno GPU、Kryo CPU傳感器中樞,共同支持在終端上運行AI應用程序。

在7月初的2023年世界人工智能大會上,高通就已經展示了全球首個在終端側運行生成式AI(AIGC)模型Stable Diffusion的技術演示,和全球最快的終端側語言-視覺模型(LVM)ControlNet運行演示。這兩款模型的參數量已經達到10億-15億,僅在十幾秒內就能夠完成一系列推理,根據輸入的文字或圖片生成全新的AI圖像。

今年7月18日,Meta官宣將發布其開源大模型LLaMA的商用版本,為初創企業和其他企業提供了一個強大的免費選擇,以取代OpenAI和谷歌出售的昂貴的專有模型。隨后,高通發布公告稱,從2024年起,Llama 2將能在旗艦智能手機和PC上運行。

高通技術公司高級副總裁兼邊緣云計算解決方案業務總經理Durga Malladi表示,為了有效地將生成式人工智能推廣到主流市場,人工智能將需要同時在云端和邊緣終端(如智能手機、筆記本電腦、汽車和物聯網終端)上運行。

在高通看來,和基于云端的大語言模型相比,在智能手機等設備上運行Llama 2 等大型語言模型的邊緣云計算具有許多優勢,不僅成本更低、性能更好,還可以在斷網的情況下工作,而且可以提供更個性化、更安全的AI服務。

如何讓大模型在終端規?;瘮U展

生成式AI進入未來生活的趨勢已經不可阻擋,為了讓生成式AI規?;瘮U展到更多終端設備中,高通提出了混合AI架構的運行方式,即在云端和設備終端的邊緣側之間分配算力,協同處理AI工作負載。

所謂混合AI,是指充分利用邊緣側終端算力支持生成式AI應用的方式,相比僅在云端運行的AI,前者能夠帶來高性能、個性化且更安全的體驗。

比如,如果模型、提示或生成內容的長度小于某個限定值,且精度足夠,推理就可以完全在終端側進行;如果任務相對復雜,則可以部分依靠云端模型;如果需要更多實時內容,模型也可以接入互聯網獲取信息。

在未來,不同的生成式AI用不同分流方式的混合AI架構,AI也能在此基礎上持續演進:
?大量生成式AI的應用,比如圖像生成或文本創作,需求AI能夠進行實時響應。在這種任務上,終端可通過運行不太復雜的推理完成大部分任務。

在AI計算的實現上,軟件和硬件同樣重要,因為必須在端側做到運算更快,效率更高,并推動AI應用在廣泛終端上的部署和普及。

高通在2022年6月推出AI軟件棧(Qualcomm AI Stack),其支持包括TensorFlow、Pytorch和ONNX在內的所有主流開發框架,所有runtimes(運行時,即某門編程語言的運行環境)和操作系統。借助高通AI軟件棧,開發者在智能手機領域開發的軟件可以快速擴展至汽車、XR、可穿戴設備等其他產品線進行使用。

高通技術公司產品管理高級副總裁兼AI負責人Ziad Asghar表示,未來公司需要加大終端側技術上的研發,尤其是進一步提升量化的算法。例如服務器上訓練的模型一般采用32位浮點運算(FP32),而我們在手機端現在能夠支持INT4計算,這能大大提高端側的處理能力。

小結

不僅僅是大模型的訓練需要極大的算力和功耗,部署也同樣如此。如果要讓大模型在更多的領域實現落地應用,除了在云端部署之后,在終端側部署也很關鍵。目前已經有諸多廠商在該領域進行探索,包括高通,期待未來大模型能夠走進人們生活的方方面面。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 高通
    +關注

    關注

    76

    文章

    7224

    瀏覽量

    188327
收藏 人收藏

    評論

    相關推薦

    深圳恒興?。圃鞓I的新星:精電主軸的崛起...

    的高精度和穩定性要求。三、精電主軸的未來發展趨勢隨著制造業的不斷發展和技術的不斷進步,
    發表于 05-13 09:55

    【大語言模型:原理與工程實踐】大語言模型的應用

    的創造力進行結合,從而創造出更加豐富多樣的內容。隨著技術的不斷發展,自動提示生成技術有望逐漸成熟。這將使大語言模型變得更加自主,能夠自行構建和改進提示詞以達到理想的結果。這將極大地提高大語言模型的工作效率和應用范圍,為其
    發表于 05-07 17:21

    STM8L運行一段時間后死機,手動復位無效,只能上電復位怎么解決?

    我們的是電池供電,LDO給主板供電,設備在用戶手上運行一段時間后,莫名死機,回來拆機發現STM8L RST管腳始終處于低電平,必須拔電池上電才能復位,復位后一切正常,之后幾個月都不會再出現。其它設備也發現這種現象,沒有規律。找不到誘發因素,也無法復現,導致至今都找不到解決
    發表于 04-15 07:56

    真實用戶體驗,終端模型能為信息無障礙做些什么

    終端模型
    腦極體
    發布于 :2024年03月20日 17:04:44

    COMSOL Multiphysics材料與表面仿真中的應用

    領域帶來了全新的研究方向和應用前景。 COMSOL Multiphysics是一款功能強大的多物理場仿真軟件,能夠對表面進行精確的仿真分析。通過建立三維模型,并設置相應的物理場參數,可以實現對
    發表于 02-20 09:20

    AD-96TOF1-EBZ無法識別驅動及DragonBoard410c無法運行demo是由什么原因導致的?

    驅動程序。 然后,我使用了內置龍牌中的linux系統。當我運行aditof-demo.sh時,程序閃回,閃回之前顯示以下錯誤報告。 幾個月前我正常使用了它,但最近出現了這些錯誤
    發表于 12-27 07:13

    【飛騰派4G版免費試用】仙女姐姐的嵌入式實驗室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

    和1750參數的GPT-3都是非常由有競爭力的 MetaAI研究人員認為,當前大模型成本阻礙了學術研究,因此,開發出這個更小更強的模型
    發表于 12-22 10:18

    電機水里泡了幾個月的時間,啟動電機就啟動不了了是為什么?

    電機水里泡了幾個月的時間,啟動電機就啟動不了了,是不是電機燒了呢?
    發表于 12-11 06:39

    聯發科天璣9300最高可運行330億參數AI大模型

    聯發科天璣9300最高可運行330億參數AI大模型 聯發科這個是要把AI大模型帶到手機端的節奏嗎?聯發科正式發布了天璣9300旗艦5G生成式AI移動芯片,天璣9300號稱最高可
    的頭像 發表于 11-07 19:00 ?1245次閱讀

    高通第三代驍龍8采用4納米工藝 支持在終端運行100參數的生成式AI

    高通第三代驍龍8采用4納米工藝 支持在終端運行100參數的生成式AI 前兩天高通公司在驍龍峰會發布了針對筆記本電腦的驍龍X Elite和針對手機移動端的第三代驍龍8。 高通第三代
    的頭像 發表于 10-26 19:29 ?1568次閱讀
    高通第三代驍龍8采用4納米工藝 支持在<b class='flag-5'>終端</b>側<b class='flag-5'>運行</b>超<b class='flag-5'>100</b>億<b class='flag-5'>參數</b>的生成式AI

    地平線旭日3成功部署運行參數規模高達14億的大語言模型

    近日,地平線成功在旭日3中的BPU計算單元上,部署運行參數規模高達14億的大語言模型(Large Language Model , LLM)。這不僅是業界在端側成功部署大模型的一次突破
    的頭像 發表于 09-12 09:24 ?584次閱讀

    瑞昱再獲急單 下半年出貨有望逐季回溫

    法人指出,瑞昱最近成功地顧客訂購電視soc緊急訂單了,這也是幾個月又一次的大客戶緊急訂單,客戶的目標主要是針對消費者市場需求,下半年、瑞昱在今年3/4季度運營有望持續加熱。
    的頭像 發表于 08-02 11:47 ?571次閱讀

    RISC -V跑大模型(一)

    去年,ChatGPT的出現震驚了全世界,在短短幾個月的時間內,ChatGPT的月活躍用戶達到了1億。ChatGPT的成功讓許多人第一次知道了大語言模型(Large Language Model
    的頭像 發表于 07-17 15:13 ?474次閱讀
    RISC -V跑大<b class='flag-5'>模型</b>(一)

    天垓100率先完成百億級參數模型訓練,天數智芯迎來新的里程碑

    的Aquila語言基礎模型,使用代碼數據進行繼續訓練,穩定運行19天,模型收斂效果符合預期,證明天數智芯有支持百億級參數模型訓練的能力。
    發表于 06-12 15:46 ?107次閱讀
    天垓<b class='flag-5'>100</b>率先完成百億級<b class='flag-5'>參數</b>大<b class='flag-5'>模型</b>訓練,天數智芯迎來新的里程碑

    天數智芯天垓100率先完成百億級參數模型訓練

    的Aquila語言基礎模型,使用代碼數據進行繼續訓練,穩定運行19天,模型收斂效果符合預期,證明天數智芯有支持百億級參數模型訓練的能力。
    的頭像 發表于 06-12 15:23 ?729次閱讀
    天數智芯天垓<b class='flag-5'>100</b>率先完成百億級<b class='flag-5'>參數</b>大<b class='flag-5'>模型</b>訓練
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>