<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

模型壓縮技術，加速AI大模型在終端側的應用

電子發燒友網報道（文/李彎彎）當前，全球眾多科技企業都在積極研究AI大模型，然而因為參數規模太大，要想實現AI大模型在邊/端側部署，需要用到模型壓縮技術。當前谷歌、微軟、騰訊等廠商在該領域均有布局，加速AI技術與智能終端的融合。

為什么需要模型壓縮技術

模型壓縮是一種縮小訓練后的神經網絡的技術，目的是保證模型預測效果的前提下，盡可能地降低模型的大小。模型壓縮之后，所需要的計算資源變小，有利于在移動端部署。

有一個很形象的例子，深度學習變臉業務，假設在模型優化前，原始模型處理每個視頻要30秒，那么一張GPU卡一分鐘只能處理2個視頻。假設APP的使用峰值是1000人同時使用，那么這家公司至少要有500張GPU卡才能滿足需求。

如果模型壓縮技術能讓模型變小許多，使得每個視頻處理只需要10秒，那么這個客戶可能只需要150張卡就能滿足業務需求。每年的成本可以從原來的3000萬控制在1000萬左右，省下的2000萬，就是模型壓縮技術的價值。

量化、網絡剪枝和知識蒸餾

模型壓縮的方法主要有量化、網絡剪枝、知識蒸餾。量化的意思是，將浮點計算轉成低比特定點計算，模型由大量的浮點型權重組成，如果能用float32替代原有的float64表示，模型就近乎減小一倍，量化也是最容易實現的一種壓縮方式。

傳統意義上的量化即為將連續信號轉換為離散信號，在神經網絡的量化中，即將浮點數float32→int8，int4，int2等，量化其本質就是低精度，常規精度一般使用FP32存儲模型權重，低精度則表示FP16，或INT8等數值格式，不過目前低精度往往指的是INT8。

模型壓縮，使得原本只能在云端運行大模型，也能夠部署在終端設備上。比如，近年來很流行的基礎模型 Stable Diffusion ，它是一個非常出色的從文本到圖像的生成式 AI 模型，能夠基于任何文本輸入，在數十秒內創作出逼真圖像。Stable Diffusion 的參數超過 10 億，此前主要限于在云端運行。

高通 AI Research 利用高通 AI 軟件棧（Qualcomm AI Stack）執行全棧 AI 優化，首次實現了在Android 智能手機上部署 Stable Diffusion，其中就用到了模型壓縮技術量化的方法。

據介紹，高通的全棧 AI 研究指跨應用、神經網絡模型、算法、軟件和硬件進行優化。針對 Stable Diffusion，他們從 Hugging Face 的 FP32 1-5 版本開源模型入手，通過量化、編譯和硬件加速進行優化，使其能在搭載第二代驍龍 8 移動平臺的手機上運行。

為了把模型從 FP32 壓縮為 INT8，高通使用了其 AI 模型增效工具包 (AIMET) 的訓練后量化。自適應舍入 (AdaRound) 等先進的高通 AIMET 量化技術能夠在更低精度水平保持模型準確性，無需進行重新訓練。

這些技術能夠應用于構成 Stable Diffusion 的所有組件模型，即基于 Transformer 的文本編碼器、VAE 解碼器和 UNet。這對于讓模型適合于在終端上運行至關重要。

網絡剪枝，是指除神經網絡中冗余的通道、神經元節點等。深度學習模型可以看作是一個復雜樹狀結構，如果能減去一些對結果沒什么影響的旁枝，就可以實現模型的減小。

模型的構成是由許多浮點型的神經元相連接，每一層根據神經元的權重將信息向下傳遞。但是有一些神經元的權重非常小，這類神經元對整個模型加載的信息影響微乎其微。如果可以把這些權重較小的神經元刪減掉，既減少了模型大小，也不會對模型的效果帶來大的影響。

每一層把數值小的神經元去掉，但是剪枝粒度維持到多大也是有講究的，比如可以把每層最小的5個減掉，也可能只剪3個，或者每層有每層不同的策略。剪多了，模型精度影響會比較大，剪少了沒有效果。所以這里面需要大量的嘗試和迭代。

知識蒸餾，是指將大模型作為教師模型，用其輸出訓練性能接近、結構更簡的學生模型。一般而言，大模型往往是單個復雜網絡或者是若干網絡的集合，擁有良好的性能和泛化能力，而小模型因為網絡規模較小，表達能力有限。

因此，可以利用大模型學習到的知識去指導小模型訓練，使得小模型具有與大模型相當的性能，但是參數數量大幅降低，從而實現模型壓縮。

小結

當下，AI大模型發展如火如荼，然而因為參數規模太大，不僅僅是訓練，大模型的部署推理，也需要倚賴豐富的計算資源。如果想要大模型能夠在邊/終端側實現部署，這其中就需要用到模型壓縮技術，如高通使用量化的方法，讓Stable Diffusion能夠在手機上運行。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
27061

瀏覽量
264829

評論

相關推薦

STM CUBE AI錯誤導入onnx模型報錯的原因？

使用cube-AI分析模型時報錯，該模型是pytorch的cnn轉化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.

發表于 05-27 07:15

【大語言模型：原理與工程實踐】大語言模型的基礎技術

大語言模型基礎技術21隨著Transformer結構在機器翻譯領域取得巨大成功，研究人員開始探索其在其他自然語言處理任務中的潛力。很快，Transformer 結構被證明不僅適用于序列到序列的轉換任務

發表于 05-05 12:17

AI快訊：華為助力金融行業加速擁抱AI 馬斯克xAI 展示首個多模態模型

數據基礎設施峰會上華為正式發布四大AI創新解決方案，包括中心AI、邊緣AI、AI數據保護、AI數據湖四大解決方案，助力金融行業

發表于 04-15 12:32 ?163次閱讀

真實用戶體驗，終端大模型能為信息無障礙做些什么

終端大模型

腦極體

發布于 :2024年03月20日 17:04:44

防止AI大模型被黑客病毒入侵控制（原創）聆思大模型AI開發套件評測4

，應用場景和安全需求會有所不同。我會幫助客戶構建安全的 AI 大模型。上面的只是一些基本的安全措施，在實際中我可以利用eFPGA芯片對上述的功能進行加速，下面我編寫一個

發表于 03-19 11:18

cubemx ai導入onnx模型后壓縮失敗了怎么解決？

cubemx ai導入onnx模型后壓縮失敗。請問我怎么解決

發表于 03-19 07:58

使用cube-AI分析模型時報錯的原因有哪些？

使用cube-AI分析模型時報錯，該模型是pytorch的cnn轉化成onnx ``` Neural Network Tools for STM32AI v1.7.0 (STM.

發表于 03-14 07:09

AI大模型可以取代大學教育嗎？

AI大模型

電子發燒友網官方

發布于 :2024年01月02日 16:27:52

AI大模型怎么解決芯片過剩?

AI大模型

電子發燒友網官方

發布于 :2024年01月02日 15:42:05

AI大模型可以設計電路嗎?

AI大模型

電子發燒友網官方

發布于 :2024年01月02日 15:09:29

驍龍平臺靠大模型出圈了

通用、專業的 AI 大模型層出不窮，噴涌之勢已經不可阻擋。隨著量化、網絡剪枝和知識蒸餾等模型壓縮技術進步，手機等

的頭像

發表于 11-16 16:51 ?257次閱讀

驍龍平臺靠大<b class='flag-5'>模型</b>出圈了

【KV260視覺入門套件試用體驗】Vitis AI 構建開發環境，并使用inspector檢查模型

FFT運算（Vivado）四、硬件加速之—使用PL加速矩陣乘法運算（Vitis HLS）五、Vitis AI 構建開發環境，并使用inspector檢查模型六、Vitis

發表于 10-14 15:34

MediaTek 聯合百度發起飛槳和文心大模型硬件生態共創計劃，以 AI 大模型賦能終端設備

，將實現大模型在終端和云端的協同工作，為用戶帶來突破性的生成式 AI 應用體驗。作為推動 AI 進一步發展的先進技術，與單純在云端部署生成

的頭像

發表于 08-16 17:40 ?396次閱讀

MediaTek 聯合百度發起飛槳和文心大<b class='flag-5'>模型</b>硬件生態共創計劃，以 <b class='flag-5'>AI</b> 大<b class='flag-5'>模型</b>賦能<b class='flag-5'>終端</b>設備

AI大模型和小模型是什么？AI大模型和小模型的區別

　　隨著人工智能的不斷發展和應用，機器學習模型的大小越來越成為一個重要的問題。在機器學習中，我們通常將模型分為兩類：大模型和小模型。本文將介紹AI

發表于 08-08 16:55 ?6681次閱讀

訓練好的ai模型導入cubemx不成功怎么解決？

訓練好的ai模型導入cubemx不成功咋辦，試了好幾個模型壓縮了也不行，ram占用過大，有無解決方案？

發表于 08-04 09:16

Carol Li
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 國內最值得關注的10家人工智能語音識別公司
Hot 國內外 18 家藍牙芯片廠商及產品型號集合

New 邊緣AI網關，將具備更強大的計算和學習能力
New 邊緣AI硬件技術、算法、平臺正在不斷創新/升級優化

精選推薦
更多

文章

資料

帖子

采用144核，能效提升66%！英特爾至強6處理器震撼上市，加速數據中心升級

章鷹觀察
14小時前

753 閱讀

如何移植FFmpeg

ElfBoard
2天前

553 閱讀

基于Arm Cortex-CM85內核的RA8D1作為控制器通過MIPI DSI實現LVGL顯示

瑞薩MCU小百科
2天前

775 閱讀

便攜式直流接地故障查找儀如何使用——每日了解電力知識

武漢摩恩
2天前

798 閱讀

重磅！英特爾發布intel3制程至強6能效核處理器，賦能數據中心能效升級

章鷹觀察
2天前

813 閱讀

生產工藝過程的可靠性控制和改進

劉潤生
322

免費

33下載

采用SG3525的半橋變換器

nana
1.65 MB

免費

517下載

以太網控制器驅動免費下載

yezi888
19.6 MB

免費

245下載

Fkreport數據報表可視化

賈飛小
0.74 MB

免費

0下載

DIY Tim的PTC熱板控制器

tr12345
1.10 MB

免費

3下載

I.MX6ULL-飛凌 ElfBoard ELF1板卡 - 如何在Ubuntu中編譯OpenCV庫(X86架構）

jf_25331175
3天前

711 閱讀

鴻蒙原生應用元服務開發-設備管理USB服務開發場景與接口

李洋水蛟龍
3天前

299 閱讀

嵌入式學習-飛凌ElfBoard ELF 1板卡 - 如何在Ubuntu中編譯OpenCV庫

jf_25331175
3天前

895 閱讀

【留言有禮】佳節至，分享“粽”要記憶，傳遞溫馨祝福，贏取精美禮品！

ElecFans小喇叭
4天前

973 閱讀

無刷電機用的單電阻采樣的FOC，拿天線貼著電機線或者貼近采樣芯片，電機就會停轉

剛剛回國弄
4天前

1474 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看