<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于北京迅為iTOP-RK3588大語言模型部署測試

迅為電子 ? 來源:迅為電子 ? 2024-04-07 16:01 ? 次閱讀

人工智能AI)領域中的大模型(Large Model)逐漸成為研究的熱點。大模型,顧名思義,是指擁有海量參數和高度復雜結構的深度學習模型。它的出現,不僅推動了AI技術的突破,更為各行各業帶來了革命性的變化。

RK3588是瑞芯微推出的新一代旗艦級高端處理器,采用8nm工藝設計,搭載四核A76+四核A55的八核CPUArm高性能GPU,內置6T算力的NPU。能夠高效地處理AI算法和模型,為大模型的運行提供了強大的硬件支持。

在北京迅為推出的搭載了RK3588處理器的iTOP-RK3588開發板上,使用RKLLM 工具套件支持在iTOP-RK3588平臺上進行LLM(大型語言模型)模型的轉換和部署。它與Hugging Face模型架構兼容(Hugging Face是廣泛用于自然語言處理任務的模型架構。

目前,該系統支持以下模型:LLaMA、Qwen、Qwen2和Phi-2。支持量化技術,即使用w8a8(8位權重,8位激活)和w4a16(4位權重,16位激活)精度進行模型量化。這可以在目標平臺上更高效地存儲和計算模型,減小內存占用。

b85f52ba-f4b4-11ee-a297-92fbcf53809c.png

iTOP-RK3588開發板體驗大模型

為了讓用戶更快速的體驗RKLLM ,北京迅為已經對Linux內核源碼中的NPU版本進行了升級,升級到了最新的0.9.6版本,具體如下所示:

b8777426-f4b4-11ee-a297-92fbcf53809c.jpg

默認以將RKLLM動態庫集成在了Ubuntu和Debian系統中,用戶可以直接拷貝轉換完成的RKLLM大預言模型和推理程序進行測試。



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    18304

    瀏覽量

    222375
  • 人工智能
    +關注

    關注

    1777

    文章

    43920

    瀏覽量

    230846
  • GPU芯片
    +關注

    關注

    1

    文章

    292

    瀏覽量

    5692
  • RK3588
    +關注

    關注

    6

    文章

    237

    瀏覽量

    3479
  • 大模型
    +關注

    關注

    2

    文章

    1555

    瀏覽量

    1153

原文標題:更新 | 基于北京迅為iTOP-RK3588大語言模型部署測試

文章出處:【微信號:迅為電子,微信公眾號:迅為電子】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于北京迅為iTOP-RK3588語言模型部署測試

    基于北京迅為iTOP-RK3588語言模型部署測試
    的頭像 發表于 04-25 14:35 ?334次閱讀
    基于<b class='flag-5'>北京</b>迅為<b class='flag-5'>iTOP-RK3588</b>大<b class='flag-5'>語言</b><b class='flag-5'>模型</b><b class='flag-5'>部署</b><b class='flag-5'>測試</b>

    迅為iTOP-RK3588開發板Buildroot系統功能測試

    迅為iTOP-RK3588開發板Buildroot系統功能測試
    的頭像 發表于 03-14 15:42 ?235次閱讀
    迅為<b class='flag-5'>iTOP-RK3588</b>開發板Buildroot系統功能<b class='flag-5'>測試</b>

    itop-RK3588開發板機器視覺開發OpenCV-Python的安裝

    itop-RK3588開發板機器視覺開發OpenCV-Python的安裝
    的頭像 發表于 01-26 15:18 ?1361次閱讀
    <b class='flag-5'>itop-RK3588</b>開發板機器視覺開發OpenCV-Python的安裝

    迅為iTOP-RK3588開發板多屏同顯多屏異顯異觸

    迅為iTOP-RK3588開發板多屏同顯多屏異顯異觸
    的頭像 發表于 11-10 14:46 ?524次閱讀
    迅為<b class='flag-5'>iTOP-RK3588</b>開發板多屏同顯多屏異顯異觸

    【手冊上新】RK3588開發板多屏顯示手冊

    顯、異顯和異觸,可有效提高行業定制的拓展性。 iTOP-RK3588開發板支持以下屏幕: LVDS 7 寸屏幕 MIPI 7 寸
    發表于 11-07 10:37

    RK3588開發板使用RKNN-Toolkit-lite2運行測試程序

    1 首先也需要部署運行環境,將庫文件放入 RK3588 開發板上,我們將網盤資料“iTOP-3588 開發 板 \\\\02_ 【 iTOP-RK3588 開 發 板 】 開 發 資
    發表于 10-16 11:12

    RK3588開發板修改編譯工具路徑

    : NDK 在 ubuntu 上的路徑/opt/tool_chain/android-ndk-r17c/,如下圖所示。注意?。?!ANDROID_NDK_PATH 修改的路徑要和實際的路徑一致。 更多文檔可以查看 B站搜索-北京
    發表于 10-11 16:11

    RK3588開發板使用 tflite 框架

    。TOP5 記錄了推理結果,其中概率最高也就是 0.935,對應第 156 個標簽的物體 更多文檔可以查看 B站搜索-北京RK3588開發板, 公眾Hao關注:
    發表于 10-10 15:39

    iTOP-RK3588開發板使用 tensorflow框架

    ,Score 反映的是得分,得分越高說明和被認為的標簽相似度越高,圓括號則是對應識別出的物體的坐標。命令行中出現了八行被識別物體的坐標和置信度,和 out.jpg 可以對應。out.jpg 如下圖所示: 更多文檔可以查看 B站搜索-北京
    發表于 10-08 10:04

    iTOP-RK3588開發板rknn_multiple_input_demo 體驗

    /model /input2.bin 推理運行結果,見“Top5”。 更多內容可以B站搜索:北京RK3588開發板
    發表于 09-28 10:33

    iTOP-RK3588開發板更新RKNN模型

    章節。 在得到 RKNN 模型之后,demo 程序使用 C 接口在 RK3588 平臺開發應用,如下圖所示, 更多內容:可以B站搜索RK35
    發表于 09-21 11:39

    讓NPU跑起來RK3588開發板設置交叉編譯器

    讓NPU跑起來RK3588開發板設置交叉編譯器編譯器下載地址是網盤資料“iTOP-3588 開發板\\\\02_【iTOP-RK3588
    發表于 09-14 09:42

    讓NPU跑起來iTOP_RK3588開發板在Linux系統中使用NPU

    , 無需進行模型轉換) 2 部署iTOP-RK3588 開發板 3 在開發板上運行 demo 更多內容可以B站搜索
    發表于 09-12 10:05

    iTOP-RK3588開發板單獨編譯Android固件-打包update.img

    rockdev/Image-rk3588_s 目錄下生成 update.img 鏡像。 更多內容:B站搜索RK3588開發板
    發表于 08-15 11:00

    iTOP-RK3588 | Linux系統和應用開發手冊

    iTOP -RK3588開發板使用手冊上新,后續資料會不斷更新,不斷完善,幫助用戶快速入門,大大提升研發速度。 RK3588開發板已經對
    發表于 06-16 14:39
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>