資料介紹
軟件簡(jiǎn)介
EMLL(Edge ML Library)為加速終端側設備上機器學(xué)習的推理而設計,提供基于端側處理器的高性能機器學(xué)習計算函數庫。EMLL支持fp32、fp16、int8等數據類(lèi)型,已在有道詞典筆、翻譯王和超級詞典等硬件產(chǎn)品的機器翻譯和語(yǔ)音識別引擎中應用,大幅降低了推理延遲。
特點(diǎn)
高性能
EMLL實(shí)現的矩陣乘法函數,為端側人工智能中常見(jiàn)的扁平矩陣作了專(zhuān)門(mén)的優(yōu)化,為各常見(jiàn)ARM處理器作了特定的優(yōu)化。對于cortex-A35/A53/A55處理器,本庫針對它們的流水線(xiàn)特點(diǎn),使用了匯編級別的優(yōu)化。
下面是單精度矩陣乘法的測試結果:
矩陣乘法的通式為 C[MxN] = A[MxK] B[KxN];所列數據為全行主序和全列主序的最好性能。
易用性
EMLL使用的函數接口在參數設計上力求簡(jiǎn)潔直接,矩陣乘法去掉了不常用的LD*參數,矩陣和向量的傳遞通過(guò)指針和整數維度分別傳遞。本庫的構建和運行不依賴(lài)第三方計算庫。
擴展性
對于矩陣乘法和量化函數,EMLL 庫提取了它們和架構無(wú)關(guān)的代碼作為通用的宏,這些宏可以在支持新的CPU架構時(shí)大大節省所需的代碼量。
EMLL 應用接口
EMLL提供基于 C 的接口,詳情請見(jiàn)?Usage_ZH.md。
函數類(lèi)型 | 函數名稱(chēng) | 函數參數 |
---|---|---|
矩陣乘法 | data_type + "gemm" | 源矩陣排列順序,各矩陣地址,M,N,K,beta,并行線(xiàn)程數 |
全連接層(單精度) | "fc" | src/weight/bias/output的地址,M,K,N,源矩陣排列順序,(并行線(xiàn)程數) |
量化 | "quantize_" + "symmetric"/"asymmetric" + input_type + output_type | 輸入數組,輸出數組,(輸出零點(diǎn)值),縮放值,數組大小,輸入范圍 |
重量化 | "requantize_" + "symmetric/asymmetric" + "_XtoY" | 輸入數組,輸出數組,(輸出零點(diǎn)值),輸出縮放值,數組大小,輸入范圍 |
偏置 | "bias" + data_type | 被偏置的矩陣,標量偏置,平行于主方向的向量偏置,平行于次方向的向量偏置,矩陣大小 |
各函數支持的數據類(lèi)型
處理器 | 矩陣乘法 | 偏置 | 量化 | 重量化 |
---|---|---|---|---|
ARMv7a 32-bit | fp32,(u)int8 | fp32,int32 | fp32 -> (u)int16/(u)int8 | int32 -> (u)int16/(u)int8,int16 -> (u)int8 |
ARMv8a 64-bit | fp32,fp16,(u)int8 | fp32,int32 | fp32 -> (u)int16/(u)int8 | int32 -> (u)int16/(u)int8,int16 -> (u)int8 |
EMLL 支持在 Linux 和安卓系統上運行。
EMLL 支持用 GCC 和 Clang 編譯。
- 5G和高性能計算驅動(dòng)增長(cháng).zip
- 機器學(xué)習必學(xué)的Python代碼示例集 10次下載
- Python機器學(xué)習應用 19次下載
- 高性能單片機器件在高校中的應用及選型 10次下載
- 高效高性能LED恒流驅動(dòng)電源芯片AX2028 24次下載
- 一種可分享數據和機器學(xué)習模型的區塊鏈 15次下載
- 高性能低成本的藍牙模塊CSR6576原理圖 13次下載
- 機器學(xué)習的個(gè)人學(xué)習筆記 16次下載
- 高性能計算到底是什么?使用了哪些技術(shù)和知識 0次下載
- 機器學(xué)習教程之機器學(xué)習的十三個(gè)經(jīng)典課件資料免費下載 34次下載
- 機器學(xué)習教程之使用matlab研究機器學(xué)習的資料概述 31次下載
- 機器學(xué)習入門(mén)資料之機器學(xué)習的詳細資料介紹 5次下載
- 機器學(xué)習入門(mén)教程之機器學(xué)習資料合集免費下載包括了資料和復習題 22次下載
- python機器學(xué)習和深度學(xué)習的學(xué)習書(shū)籍資料免費下載 89次下載
- 高性能計算發(fā)展與應用 0次下載
- 高性能芯片有哪些特征? 353次閱讀
- 關(guān)于HPC的高性能計算測試方法 1477次閱讀
- 機器學(xué)習基本過(guò)程 5305次閱讀
- 一個(gè)高性能異步計算框架介紹 523次閱讀
- 在云計算成功使用AI所需的五種機器學(xué)習技能 1311次閱讀
- 機器學(xué)習適合云計算運維嗎 468次閱讀
- 對機器學(xué)習算法公平性的研究 2868次閱讀
- 機器學(xué)習教程之機器學(xué)習概念的深度解析 3601次閱讀
- 開(kāi)發(fā)者應該學(xué)習哪種編程語(yǔ)言才能獲得機器學(xué)習或數據科學(xué)這類(lèi)工作呢? 2551次閱讀
- 什么是機器學(xué)習?機器學(xué)習能解決什么問(wèn)題?(案例分析) 1.5w次閱讀
- 深度學(xué)習的概念、發(fā)展狀況以及和機器學(xué)習的區別和應用 7553次閱讀
- 量子計算與量子機器學(xué)習的解析 5563次閱讀
- 基于邊界攻擊以及決策的類(lèi)攻擊 提出了部署機器學(xué)習系統安全性的新問(wèn)題 3925次閱讀
- 機器學(xué)習綜述——機器學(xué)習理論基礎與發(fā)展脈絡(luò ) 7616次閱讀
- 如何區分深度學(xué)習與機器學(xué)習 1720次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數據手冊
- 1.06 MB | 532次下載 | 免費
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費
- 3TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費
- 5元宇宙深度解析—未來(lái)的未來(lái)-風(fēng)口還是泡沫
- 6.40 MB | 227次下載 | 免費
- 6迪文DGUS開(kāi)發(fā)指南
- 31.67 MB | 194次下載 | 免費
- 7元宇宙底層硬件系列報告
- 13.42 MB | 182次下載 | 免費
- 8FP5207XR-G1中文應用手冊
- 1.09 MB | 178次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 2555集成電路應用800例(新編版)
- 0.00 MB | 33566次下載 | 免費
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費
- 4開(kāi)關(guān)電源設計實(shí)例指南
- 未知 | 21549次下載 | 免費
- 5電氣工程師手冊免費下載(新編第二版pdf電子書(shū))
- 0.00 MB | 15349次下載 | 免費
- 6數字電路基礎pdf(下載)
- 未知 | 13750次下載 | 免費
- 7電子制作實(shí)例集錦 下載
- 未知 | 8113次下載 | 免費
- 8《LED驅動(dòng)電路設計》 溫德?tīng)栔?zhù)
- 0.00 MB | 6656次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537798次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191187次下載 | 免費
- 7十天學(xué)會(huì )AVR單片機與C語(yǔ)言視頻教程 下載
- 158M | 183279次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138040次下載 | 免費
評論
查看更多