電子發燒友網報道(文/李彎彎)前不久,在2022驍龍技術峰會上,高通正式發布了全新一代旗艦移動平臺驍龍 8 Gen 2。驍龍 8 Gen 2搭載一顆專門面向AI計算的Hexagon處理器,在手機AI加速計算、計算式攝影、手游光線追蹤、5G雙卡雙通方面均較上一代有較大突破。
高通高級副總裁兼手機業務總經理Christopher Patrick在峰會上表示,“我們把人工智能作為設計第二代驍龍8的關鍵技術?!?br />
驍龍 8 Gen 2的AI技術體現在哪些方面
驍龍8 Gen 2搭載的Hexagon處理器,之前是用來命名驍龍芯片內部DSP的,它在此之前更像是協處理器。如今Hexagon已經進化為專用的AI加速計算芯片,具有專門為其供電的系統,內置Tensor、Scalar加速器、HVX矢量擴展處理器,支持Micro Tile Inferencing等技術。
據介紹,驍龍8 Gen 2這次的Hexagon處理器具備INT4精度AI計算的能力。這讓驍龍8 Gen 2成為世界上第一顆,也是目前已知的唯一一顆支持INT4精度AI計算的移動平臺處理器。
INT4是一種更新、近年來多受關注的AI計算精度模式,和之前經常被提起的浮點計算精度模式相比起來,INT4能夠讓模型占用空間顯著縮小,從而可以在計算/能耗資源更為有限的移動平臺上,保存和運行更多和更大的預訓練神經網絡模型。
根據高通的表述,支持了INT4之后,開發者可以讓驍龍8 Gen 2來跑超大規模的神經網絡,比如Transformer。在此之前沒有已知的移動平臺具有本地運行Transformer類預訓練模型的能力,而驍龍8 Gen 2也成為了第一顆支持Transformer大模型的移動處理器。
通過支持INT4精度計算,Hexagon處理器還可以更加有效地替代GPU和CPU,在運行各種AI計算任務時顯著降低能耗。在持續AI推理計算任務上,驍龍8 Gen 2相比8 Gen 1的性能提升最高可達4.35倍,每瓦性能提升程度高達60%。
Christopher Patrick在講解中表示,在Hexagon處理器和Qualcomm Spectra ISP之間,還增加了一個名為“Hexagon直連”的物理連接,以此打造了移動行業首創的“認知ISP”。
“認知ISP”應用在影像處理過程中,通過實時語義分割實現照片和視頻的自動增強,利用AI神經網絡讓攝像頭在情境中感知人臉、面部特征、頭發、衣服和天空等,進行獨立優化,從而讓每個細節獲得定制的專業圖像調優。而之前由于AI性能較弱,用戶在拍攝完照片之后通常需要一段處理時間,手機才會顯示成片。
在AI性能提升的情況下,驍龍8 Gen 2也帶來了實時硬件加速光線追蹤。高通技術人士表示,硬件光追可以做到每秒數百億次光線相交,對光線、反射、照明等處理會更加真實。在網絡連接方面,5G芯片中植入了AI功能,可以改善網絡中的時延、網速、覆蓋不到位等問題。
高通軟硬件布局,應對終端AI落地挑戰
如今AI幾乎滲透進各行各業,終端應用場景豐富,這也造成終端AI在落地上面臨挑戰。包括:不同終端產品對性能和功耗需求不同;各類終端產品所需的深度學習架構和算子也差異巨大,比如智能手機需要使用生成模型、計算領域要用到Transformer模型,汽車ADAS則需要激光雷達模型;各類終端產品對AI特性的需求也不盡相同,比如汽車和XR需要支持更多的并發場景。
為了應對這些挑戰,從硬件層面,高通推出的AI解決方案已經實現從500毫瓦到15瓦的性能水平擴展,甚至可以滿足200瓦的性能水平。
另外為了解決不同場景對AI能力需求的差異,高通在Hexagon處理器中打造了高度可配置的硬件解決方案,使高通能夠將AI解決方案從智能手機擴展到更多業務線。比如面向汽車、云端等高性能場景,高通可以調整Hexagon處理器內的加速器和內存組件,還可以拼接多個Hexagon處理器,通過更多Hexagon處理器協同工作實現性能的拓展提升。
在AI軟件層面,高通也做了深入布局。今年6月,高通宣布推出AI軟件棧產品組合,以提升高通在AI和智能網聯邊緣領域的領先優勢。高通AI軟件棧是面向OEM廠商和開發者的一套完整的AI解決方案,集合了高通各種AI軟件產品并進行了升級,通過豐富的AI軟件權限和兼容性能夠支持各種智能終端。
高通AI軟件棧支持包括TensorFlow、PyTorch和ONNX在內的不同AI框架與主流runtimes,以及開發者庫與服務、系統軟件、工具和編譯器,從而使任何面向單一終端開發的AI特性都可在其他終端上輕松部署。高通AI軟件棧產品組合還支持一系列工具套件,包括高通AI模型增效工具包(AIMET)、AI開發圖形用戶界面(GUI)、用于增強量化與優化的模型分析器以及神經網絡架構搜索(NAS)。
小結
如今AI的發展勢頭迅猛,各家芯片廠商都布局其中,包括英偉達、英特爾等。高通在該領域也已經布局許久,近些年更是加大了在該領域的投入。因為本身應用場景多樣的特性,終端AI在落地應用上一直存在挑戰,可以看到高通正在從軟硬件各方面解決這些業界難題。
高通高級副總裁兼手機業務總經理Christopher Patrick在峰會上表示,“我們把人工智能作為設計第二代驍龍8的關鍵技術?!?br />
驍龍 8 Gen 2的AI技術體現在哪些方面
驍龍8 Gen 2搭載的Hexagon處理器,之前是用來命名驍龍芯片內部DSP的,它在此之前更像是協處理器。如今Hexagon已經進化為專用的AI加速計算芯片,具有專門為其供電的系統,內置Tensor、Scalar加速器、HVX矢量擴展處理器,支持Micro Tile Inferencing等技術。
據介紹,驍龍8 Gen 2這次的Hexagon處理器具備INT4精度AI計算的能力。這讓驍龍8 Gen 2成為世界上第一顆,也是目前已知的唯一一顆支持INT4精度AI計算的移動平臺處理器。
INT4是一種更新、近年來多受關注的AI計算精度模式,和之前經常被提起的浮點計算精度模式相比起來,INT4能夠讓模型占用空間顯著縮小,從而可以在計算/能耗資源更為有限的移動平臺上,保存和運行更多和更大的預訓練神經網絡模型。
根據高通的表述,支持了INT4之后,開發者可以讓驍龍8 Gen 2來跑超大規模的神經網絡,比如Transformer。在此之前沒有已知的移動平臺具有本地運行Transformer類預訓練模型的能力,而驍龍8 Gen 2也成為了第一顆支持Transformer大模型的移動處理器。
通過支持INT4精度計算,Hexagon處理器還可以更加有效地替代GPU和CPU,在運行各種AI計算任務時顯著降低能耗。在持續AI推理計算任務上,驍龍8 Gen 2相比8 Gen 1的性能提升最高可達4.35倍,每瓦性能提升程度高達60%。
Christopher Patrick在講解中表示,在Hexagon處理器和Qualcomm Spectra ISP之間,還增加了一個名為“Hexagon直連”的物理連接,以此打造了移動行業首創的“認知ISP”。
“認知ISP”應用在影像處理過程中,通過實時語義分割實現照片和視頻的自動增強,利用AI神經網絡讓攝像頭在情境中感知人臉、面部特征、頭發、衣服和天空等,進行獨立優化,從而讓每個細節獲得定制的專業圖像調優。而之前由于AI性能較弱,用戶在拍攝完照片之后通常需要一段處理時間,手機才會顯示成片。
在AI性能提升的情況下,驍龍8 Gen 2也帶來了實時硬件加速光線追蹤。高通技術人士表示,硬件光追可以做到每秒數百億次光線相交,對光線、反射、照明等處理會更加真實。在網絡連接方面,5G芯片中植入了AI功能,可以改善網絡中的時延、網速、覆蓋不到位等問題。
高通軟硬件布局,應對終端AI落地挑戰
如今AI幾乎滲透進各行各業,終端應用場景豐富,這也造成終端AI在落地上面臨挑戰。包括:不同終端產品對性能和功耗需求不同;各類終端產品所需的深度學習架構和算子也差異巨大,比如智能手機需要使用生成模型、計算領域要用到Transformer模型,汽車ADAS則需要激光雷達模型;各類終端產品對AI特性的需求也不盡相同,比如汽車和XR需要支持更多的并發場景。
為了應對這些挑戰,從硬件層面,高通推出的AI解決方案已經實現從500毫瓦到15瓦的性能水平擴展,甚至可以滿足200瓦的性能水平。
另外為了解決不同場景對AI能力需求的差異,高通在Hexagon處理器中打造了高度可配置的硬件解決方案,使高通能夠將AI解決方案從智能手機擴展到更多業務線。比如面向汽車、云端等高性能場景,高通可以調整Hexagon處理器內的加速器和內存組件,還可以拼接多個Hexagon處理器,通過更多Hexagon處理器協同工作實現性能的拓展提升。
在AI軟件層面,高通也做了深入布局。今年6月,高通宣布推出AI軟件棧產品組合,以提升高通在AI和智能網聯邊緣領域的領先優勢。高通AI軟件棧是面向OEM廠商和開發者的一套完整的AI解決方案,集合了高通各種AI軟件產品并進行了升級,通過豐富的AI軟件權限和兼容性能夠支持各種智能終端。
高通AI軟件棧支持包括TensorFlow、PyTorch和ONNX在內的不同AI框架與主流runtimes,以及開發者庫與服務、系統軟件、工具和編譯器,從而使任何面向單一終端開發的AI特性都可在其他終端上輕松部署。高通AI軟件棧產品組合還支持一系列工具套件,包括高通AI模型增效工具包(AIMET)、AI開發圖形用戶界面(GUI)、用于增強量化與優化的模型分析器以及神經網絡架構搜索(NAS)。
小結
如今AI的發展勢頭迅猛,各家芯片廠商都布局其中,包括英偉達、英特爾等。高通在該領域也已經布局許久,近些年更是加大了在該領域的投入。因為本身應用場景多樣的特性,終端AI在落地應用上一直存在挑戰,可以看到高通正在從軟硬件各方面解決這些業界難題。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
高通
+關注
關注
76文章
7187瀏覽量
188106 -
AI
+關注
關注
87文章
26669瀏覽量
264330 -
大模型
+關注
關注
2文章
1632瀏覽量
1245
發布評論請先 登錄
相關推薦
請問stm32 foc5.0支持哪些MCU?
stm32 foc5.0支持哪些MCU, 怎么FOC5.0以上的庫,MCU只是固定的幾個,不是全系列的,比如stm103 MD系列,只能選stm32f103VB這個。。其他也是。是不是只支持固定的一些MCU。求高手講解一下。
發表于 04-26 07:36
STM32L476支持高速USB通信嗎?
我的板子是STM32L476的,現在要做一個usb通信,如果只是做全速USB的話不如直接用串口,所以想做高速USB,這就出現我現在的問題:
1.STM32L476支持高速USB通信嗎?
2.如果支持,應該如何切換
3.PC端如果
發表于 04-12 07:52
請問CYBLE-214009-00支持支持改uuid嗎?
如題所述:
CYBLE-214009-00支持支持改uuid嗎?
另外我可以在哪里找到CYBLE-214009-00的指令集
Does CYBLE-214009-00 support uuid?
發表于 02-21 06:18
請問AD5522支持多個通道同時輸出不一樣的脈沖信號嗎?
比如通道1輸出脈寬為5的脈沖, 同時通道2輸出脈寬為8的脈沖,AD5522支持這種輸出嗎?怎么控制實現這種輸出?
發表于 12-01 07:41
請問adau1452支持浮點運算嗎?
你好,
我想在dsp里做一個音頻降噪處理的算法,剛查看了一下adau1452的性能是極好的,我想進一步了解一下這款芯片。
請問adau1452支持浮點運算嗎?你們提供的例程有沒有關于降噪的?我自己寫的算法代碼是c語言的就可以了吧?
或者說只做降噪處理的(算法有點復雜)有沒有什么更好的dsp推薦?
謝謝
發表于 11-29 07:58
汽車領域擁抱Transformer需要多少AI算力?
Transformer在汽車領域應用自然是針對視覺的,ChatGPT3這種至少需要八張英偉達A100顯卡的大模型是絕對無法出現在汽車上的。
發表于 08-17 14:57
?596次閱讀
高通驍龍8 Gen4放棄公版:升級自研架構Oryon CPU
ARM正醞釀對其IP授權模式進行大刀闊斧地改革。
對此,數碼閑聊站分享稱,ARM授權收緊,高通最快在SM8750也就是驍龍8
發表于 05-28 08:49
評論