<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

100%在樹莓派上執行的LLM項目

ChatGPT的人性口語化回復相信許多人已體驗過，也因此掀起一波大型語言模型（Large Language Model, LLM）熱潮，LLM即ChatGPT背后的主運作技術，但LLM運作需要龐大運算力，因此目前多是在云端（Cloud）上執行。

然而在云端執行也有若干缺點，一是Internet斷線時無法使用；二是或多或少會泄漏個資隱私；三是上傳的話語內容會被審查，但審查標準難以捉摸，且已有諸多矯枉過正的案例；四是因為模型已放在云端與人共享，也可能已被他人誤導，俗稱模型被教壞了。

所以有些人也希望LLM能在本地端（Local）、本機端執行，如此就不怕斷線、泄漏隱私、內容審查、誤導等缺點。但要能在本地端執行，其LLM就不能太大，目前已經有諸多信息技術專家提出各種嘗試，期望能將云端的LLM輕量化、減肥減肥，以便能在運算力有限的本機端執行。

全世界最簡單的類GPT語音助理

對此已有創客發起項目，項目名就叫World’s Easiest GPT-like Voice Assistant，即世界上最簡單的類GPT語音助理，以此實現完全在本機端執行的GPT語音服務，不需要任何Internet聯機。

至于具體技術作法，首先是找一片樹莓派單板計算機，例如RPi 4，然后裝上麥克風與喇叭，成為語音互動對話的輸入輸出，而后安裝Whisper這套軟件，可以將麥克風接收到的語音轉成文字，文字喂給LLM。

LLM接收輸入后進行推論處理，處理后的結果以文字輸出，輸出的文字則透過另一個安裝軟件進行轉化，即eSpeak，把文字轉成語音后，再透過喇叭發聲回復。

用TinyLlama-1.1B模型來實現類GPT語音助理項目

麥克風與喇叭只是末梢，重點是在LLM，哪來的輕量型、本機端執行的LLM？答案是llamafile項目，這個項目將LLM打包成單一個檔案，如此可方便地分發（分發distribute，通俗而言指可以輕易地下載文件、傳遞分享檔案）與執行，項目發起者運用llamafile項目中的TinyLlama-1.1B模型來實現類GPT語音助理。

圖3 llamafile項目官網畫面（圖片來源：GitHub）

TinyLlama-1.1B確實是一個嬌小的LLM，以GPT-3而言就有175B，B即Billion指的是10億，LLM的大小通常以參數數目為準，1,750億個參數的LLM已相當龐大，需要對應強大的運算力才能順暢執行。

其他龐大的LLM還有MT-NLG，有5,300億個參數，或5,400億個的PaLM等，都難以下放到本機端執行，本機端很難有對應強大的運算力來跑模型。而TinyLlama-1.1B顧名思義只有11億個參數，參數大大減少下，本機端是有足夠運算力執行該模型。

圖4 llamafile項目提供多種預訓練模型，目前以TinyLlama-1.1B最小，僅760MB（圖片來源：GitHub）

當然，上述所言均是預訓練模型（Pre-Train Model），或近期常稱為基礎模型（Foundation Model, FM），后續還是可以依據個人需要再行訓練與調整，以便有更精準、更切合需求的推論結果。

這個類GPT語音助理項目完成上述后，實際測試的結果是，多數的發話詢問后需要15秒左右的時間才能回復，復雜的詢問則要更久的時間。有人可以等或覺得這時間還可以，若覺得太慢或許可以改用運算力更強的RPi 5單板計算機，可能可以快一點。

值得注意的是，這個項目不是用語音關鍵詞（如Hey! Siri或OK! Google）來喚醒助理，而是設置一個按鈕，按下去后才讓樹莓派開始接收語音詢問。

另外，這整個項目用的都是開放源代碼及免授權費的軟件與模型，所以實現成本大概只有單板計算機、喇叭、麥克風、按鈕等硬件而已。

其他技術細節包含llamafile與Raspberry Pi OS不兼容，所以在樹莓派上是改安裝Ubuntu Linux，更具體而言是64位的Ubuntu Server 22.04.3 LTS。另外，當然也要安裝Python才能操控樹莓派的GPIO接腳，從而能讀取按鈕狀態（是否被按下）。

小結

最后，這肯定不是第一個也不是最后一個LLM本地端化的嘗試，各種嘗試正前仆后繼地進行著，有的是提供壓縮工具將原本肥大的LLM加以縮小，有的干脆是原生訓練出輕量的LLM，現階段可謂是百家爭鳴。

而筆者個人的看法，1.1B的LLM已經很小，或許未來可以更小，但現階段可能改用更強的硬件會更務實，例如使用有GPU的桌面計算機，或給樹莓派加裝AI硬件加速器等，以便讓類GPT語音助理更快速響應。

審核編輯：劉清

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

GPIO

GPIO

+關注

關注
16

文章
1149

瀏覽量
50744
硬件加速器

硬件加速器

+關注

關注
0

文章
40

瀏覽量
12655
樹莓派

樹莓派

+關注

關注
114

文章
1654

瀏覽量
104875
LLM

LLM

+關注

關注
0

文章
217

瀏覽量
246

原文標題：不怕脫機！100%在樹莓派上執行的LLM項目

文章出處：【微信號：易心Microbit編程，微信公眾號：易心Microbit編程】歡迎添加關注！文章轉載請注明出處。

評論

相關推薦

IPO在即，你的樹莓派也要變為上市公司產品了

社區提供可玩性極高的產品。就在近日，樹莓派基金會發布了尋求在倫敦證交所上市的消息。 ? 樹莓派上市背后的原因 ? 5月22日，在外媒已經提前爆料樹莓派計劃IPO的消息后，

的頭像

發表于 06-07 00:04 ?1997次閱讀

IPO在即，你的<b class='flag-5'>樹莓</b>派也要變為上市公司產品了

精選推薦！看大佬用樹莓派4做個迷你版PS5

作者在樹莓派4上設置了RetroPie，并制作了一個3D打印的定制外殼，靈感來自PlayStation 5的設計。就像是PlayStation 5的迷你版，雖然它無法運行現代游戲，不過，這仍然是

發表于 05-13 10:24

解鎖LLM新高度—OpenVINO? 2024.1賦能生成式AI高效運行

LLM 的發展仍保持著驚人的速度。盡管現有的 LLM 已經具備強大的功能，但通過 OpenVINO? 的優化和推理加速，可以對這些復雜模型的執行進行精煉，實現更快、更高效的處理，減少計算開銷并最大限度發揮硬件潛力，這將直接導致

的頭像

發表于 05-10 10:36 ?219次閱讀

SBCFormer首次在樹莓派4B上以1fps處理取得80.0%精度

計算機視覺在不同領域解決已成為解決實際問題的常用方法，如智慧農牧管理。這類場景并不需要每秒處理許多幀，此時樹莓派這類單板主機就派上了用場。

的頭像

發表于 11-09 12:32 ?614次閱讀

SBCFormer首次在<b class='flag-5'>樹莓</b>派4B上以1fps處理取得80.0%精度

樹莓派5到底值不值得買？

2022年底，樹莓派首席執行官埃本·厄普頓（Eben Upton）還表示，我們在2023年不會見到樹莓派5，而且在全球芯片短缺之后，需要一年時間來改善樹莓派的庫存。但他似乎還是想給眾多

的頭像

發表于 10-20 15:33 ?1282次閱讀

<b class='flag-5'>樹莓</b>派5到底值不值得買？

基于樹莓派的機器人設計方案

以非常低的外形安裝在樹莓派的頂部。注意：如果你打算在樹莓派上安裝散熱器，請使用非常低調的散熱器以避免 CRICKIT 帽子短路。

發表于 10-19 12:31 ?407次閱讀

基于<b class='flag-5'>樹莓</b>派的機器人設計方案

對比解碼在LLM上的應用

為了改進LLM的推理能力，University of California聯合Meta AI實驗室提出將Contrastive Decoding應用于多種任務的LLM方法。實驗表明，所提方法能有效改進LLM的推理能力。讓我們走進

發表于 09-21 11:37 ?414次閱讀

對比解碼在<b class='flag-5'>LLM</b>上的應用

如何在樹莓派上面安裝Windows

早期，想要在樹莓派上面安裝Windows一直是個比較麻煩的事情，下載系統鏡像，燒錄、還有一系列復雜的配置。

的頭像

發表于 09-12 09:54 ?1141次閱讀

如何在<b class='flag-5'>樹莓</b><b class='flag-5'>派上</b>面安裝Windows

MLC-LLM的編譯部署流程

MLC-LLM部署在各種硬件平臺的需求，然后我就開始了解MLC-LLM的編譯部署流程和RWKV World模型相比于MLC-LLM已經支持的Raven系列模型的特殊之處。 MLC-LLM

發表于 09-04 09:22 ?1979次閱讀

有移植樹莓派到飛騰派的教程嗎

公司基于樹莓派開發板做的產品希望移植到飛騰派上，請大佬指導

發表于 08-28 10:24

如何用PyArmNN加速樹莓派上的ML推理

NN推理引擎構建一個示例應用程序，將圖像分類為火或非火。本指南使用Raspberry Pi 3或4設備。樹莓派設備是由Arm CPU驅動的霓虹燈的架構。Neon是針對Arm處理器的優化架構擴展

發表于 08-02 15:40

樹莓派上新，福利來襲!

工程師專區上新啦！ ? 直擊底價！樹莓派4B ，新客包郵！工程師發燒友的福音，新用戶專享優惠價，還免費送電子發燒友VIP月卡。 ▼樹莓派4B 4G開發板，領滿1 00減20優惠券券后價格

發表于 08-02 08:41 ?383次閱讀

LLM的長度外推淺談

蘇神最早提出的擴展LLM的context方法，基于bayes啟發得到的公式

發表于 07-28 17:37 ?1642次閱讀

最新綜述！當大型語言模型（LLM）遇上知識圖譜：兩大技術優勢互補

LLM 是黑箱模型，缺乏可解釋性，因此備受批評。LLM 通過參數隱含地表示知識。因此，我們難以解釋和驗證 LLM 獲得的知識。此外，LLM 是通過概率模型

發表于 07-10 11:35 ?1565次閱讀

樹莓派監視器開源項目

電子發燒友網站提供《樹莓派監視器開源項目.zip》資料免費下載

發表于 06-14 11:33 ?6次下載

精選推薦
更多

文章

資料

帖子

Open AI和蘋果合作，將AI大模型植入手機/土耳其對中國進口汽車加征40%關稅熱點科技新聞點評

章鷹觀察
13分鐘前

37 閱讀

三分鐘帶你了解熱電阻參數選型

ZLG致遠電子
3天前

209 閱讀

TSMaster 的 CAN UDS 診斷操作指南（上）

上海同星智能科技有限公司
3天前

185 閱讀

采用144核，能效提升66%！英特爾至強6處理器震撼上市，加速數據中心升級

章鷹觀察
1天前

1208 閱讀

華為用“三個重構”為筆鋒，書寫全球數字金融大文章

腦極體
5小時前

329 閱讀

Qbsolv量子計算開發工具

李玉蘭
19.44 MB

免費

6下載

DuckDuckGo Privacy Essentials保護用戶隱私的瀏覽器擴展

李桂蘭
2.05 MB

免費

0下載

ChmFox Firefox的CHM瀏覽器擴展

王桂英
0.43 MB

免費

8下載

Aseprite創建動畫精靈

王娟
2.43 MB

免費

1下載

HP經典計算器LiPo電池組

張麗
0.02 MB

免費

2下載

我用香橙派做了一個Klipper 3D打印控制器

corkia
14小時前

73 閱讀

功放自激問題如何解決？

jf_51831565
1天前

194 閱讀

labview datasocket綁定點擊瀏覽選擇dstp服務器然后一直轉圈圈選不了怎么回事啊各位大佬？

jf_20760356
2天前

336 閱讀

在做基于fpga的數字示波器這個項目時，我用的是vivado平臺，遇到了顯示相關的問題。

jf_66683878
2天前

319 閱讀

求教：labview無法連接除本機外的藍牙設備

jf_00903516
1天前

385 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看