<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

100%在樹莓派上執行的LLM項目

jf_cVC5iyAO ? 來源:易心Microbit編程 ? 2024-02-29 16:29 ? 次閱讀

ChatGPT的人性口語化回復相信許多人已體驗過,也因此掀起一波大型語言模型(Large Language Model, LLM)熱潮,LLM即ChatGPT背后的主運作技術,但LLM運作需要龐大運算力,因此目前多是在云端(Cloud)上執行。

然而在云端執行也有若干缺點,一是Internet斷線時無法使用;二是或多或少會泄漏個資隱私;三是上傳的話語內容會被審查,但審查標準難以捉摸,且已有諸多矯枉過正的案例;四是因為模型已放在云端與人共享,也可能已被他人誤導,俗稱模型被教壞了。

所以有些人也希望LLM能在本地端(Local)、本機端執行,如此就不怕斷線、泄漏隱私、內容審查、誤導等缺點。但要能在本地端執行,其LLM就不能太大,目前已經有諸多信息技術專家提出各種嘗試,期望能將云端的LLM輕量化、減肥減肥,以便能在運算力有限的本機端執行。

全世界最簡單的類GPT語音助理

對此已有創客發起項目,項目名就叫World’s Easiest GPT-like Voice Assistant,即世界上最簡單的類GPT語音助理,以此實現完全在本機端執行的GPT語音服務,不需要任何Internet聯機。

至于具體技術作法,首先是找一片樹莓派單板計算機,例如RPi 4,然后裝上麥克風與喇叭,成為語音互動對話的輸入輸出,而后安裝Whisper這套軟件,可以將麥克風接收到的語音轉成文字,文字喂給LLM。

LLM接收輸入后進行推論處理,處理后的結果以文字輸出,輸出的文字則透過另一個安裝軟件進行轉化,即eSpeak,把文字轉成語音后,再透過喇叭發聲回復。

TinyLlama-1.1B模型來實現類GPT語音助理項目

麥克風與喇叭只是末梢,重點是在LLM,哪來的輕量型、本機端執行的LLM?答案是llamafile項目,這個項目將LLM打包成單一個檔案,如此可方便地分發(分發distribute,通俗而言指可以輕易地下載文件、傳遞分享檔案)與執行,項目發起者運用llamafile項目中的TinyLlama-1.1B模型來實現類GPT語音助理。

b27941ae-d6db-11ee-a297-92fbcf53809c.png

圖3 llamafile項目官網畫面(圖片來源:GitHub)

TinyLlama-1.1B確實是一個嬌小的LLM,以GPT-3而言就有175B,B即Billion指的是10億,LLM的大小通常以參數數目為準,1,750億個參數的LLM已相當龐大,需要對應強大的運算力才能順暢執行。

其他龐大的LLM還有MT-NLG,有5,300億個參數,或5,400億個的PaLM等,都難以下放到本機端執行,本機端很難有對應強大的運算力來跑模型。而TinyLlama-1.1B顧名思義只有11億個參數,參數大大減少下,本機端是有足夠運算力執行該模型。

b29b6400-d6db-11ee-a297-92fbcf53809c.png

圖4 llamafile項目提供多種預訓練模型,目前以TinyLlama-1.1B最小,僅760MB(圖片來源:GitHub)

當然,上述所言均是預訓練模型(Pre-Train Model),或近期常稱為基礎模型(Foundation Model, FM),后續還是可以依據個人需要再行訓練與調整,以便有更精準、更切合需求的推論結果。

這個類GPT語音助理項目完成上述后,實際測試的結果是,多數的發話詢問后需要15秒左右的時間才能回復,復雜的詢問則要更久的時間。有人可以等或覺得這時間還可以,若覺得太慢或許可以改用運算力更強的RPi 5單板計算機,可能可以快一點。

值得注意的是,這個項目不是用語音關鍵詞(如Hey! Siri或OK! Google)來喚醒助理,而是設置一個按鈕,按下去后才讓樹莓派開始接收語音詢問。

另外,這整個項目用的都是開放源代碼及免授權費的軟件與模型,所以實現成本大概只有單板計算機、喇叭、麥克風、按鈕等硬件而已。

其他技術細節包含llamafile與Raspberry Pi OS不兼容,所以在樹莓派上是改安裝Ubuntu Linux,更具體而言是64位的Ubuntu Server 22.04.3 LTS。另外,當然也要安裝Python才能操控樹莓派的GPIO接腳,從而能讀取按鈕狀態(是否被按下)。

小結

最后,這肯定不是第一個也不是最后一個LLM本地端化的嘗試,各種嘗試正前仆后繼地進行著,有的是提供壓縮工具將原本肥大的LLM加以縮小,有的干脆是原生訓練出輕量的LLM,現階段可謂是百家爭鳴。

而筆者個人的看法,1.1B的LLM已經很小,或許未來可以更小,但現階段可能改用更強的硬件會更務實,例如使用有GPU的桌面計算機,或給樹莓派加裝AI硬件加速器等,以便讓類GPT語音助理更快速響應。




審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • GPIO
    +關注

    關注

    16

    文章

    1149

    瀏覽量

    50744
  • 硬件加速器
    +關注

    關注

    0

    文章

    40

    瀏覽量

    12655
  • 樹莓派
    +關注

    關注

    114

    文章

    1654

    瀏覽量

    104875
  • LLM
    LLM
    +關注

    關注

    0

    文章

    217

    瀏覽量

    246

原文標題:不怕脫機!100%在樹莓派上執行的LLM項目

文章出處:【微信號:易心Microbit編程,微信公眾號:易心Microbit編程】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    IPO在即,你的樹莓派也要變為上市公司產品了

    社區提供可玩性極高的產品。就在近日,樹莓派基金會發布了尋求在倫敦證交所上市的消息。 ? 樹莓派上市背后的原因 ? 5月22日,在外媒已經提前爆料樹莓派計劃IPO的消息后,
    的頭像 發表于 06-07 00:04 ?1997次閱讀
    IPO在即,你的<b class='flag-5'>樹莓</b>派也要變為上市公司產品了

    精選推薦!看大佬用樹莓派4做個迷你版PS5

    作者樹莓派4上設置了RetroPie,并制作了一個3D打印的定制外殼,靈感來自PlayStation 5的設計。就像是PlayStation 5的迷你版,雖然它無法運行現代游戲,不過,這仍然是
    發表于 05-13 10:24

    解鎖LLM新高度—OpenVINO? 2024.1賦能生成式AI高效運行

    LLM 的發展仍保持著驚人的速度。盡管現有的 LLM 已經具備強大的功能,但通過 OpenVINO? 的優化和推理加速,可以對這些復雜模型的執行進行精煉,實現更快、更高效的處理,減少計算開銷并最大限度發揮硬件潛力,這將直接導致
    的頭像 發表于 05-10 10:36 ?219次閱讀

    SBCFormer首次在樹莓派4B上以1fps處理取得80.0%精度

    計算機視覺在不同領域解決已成為解決實際問題的常用方法,如智慧農牧管理。這類場景并不需要每秒處理許多幀,此時樹莓派這類單板主機就派上了用場。
    的頭像 發表于 11-09 12:32 ?614次閱讀
    SBCFormer首次在<b class='flag-5'>樹莓</b>派4B上以1fps處理取得80.0%精度

    樹莓派5到底值不值得買?

    2022年底,樹莓派首席執行官埃本·厄普頓(Eben Upton)還表示,我們在2023年不會見到樹莓派5,而且在全球芯片短缺之后,需要一年時間來改善樹莓派的庫存。但他似乎還是想給眾多
    的頭像 發表于 10-20 15:33 ?1282次閱讀
    <b class='flag-5'>樹莓</b>派5到底值不值得買?

    基于樹莓派的機器人設計方案

    以非常低的外形安裝在樹莓派的頂部。 注意:如果你打算在樹莓派上安裝散熱器,請使用非常低調的散熱器以避免 CRICKIT 帽子短路。
    發表于 10-19 12:31 ?407次閱讀
    基于<b class='flag-5'>樹莓</b>派的機器人設計方案

    對比解碼在LLM上的應用

    為了改進LLM的推理能力,University of California聯合Meta AI實驗室提出將Contrastive Decoding應用于多種任務的LLM方法。實驗表明,所提方法能有效改進LLM的推理能力。讓我們走進
    發表于 09-21 11:37 ?414次閱讀
    對比解碼在<b class='flag-5'>LLM</b>上的應用

    如何在樹莓派上面安裝Windows

    早期,想要在樹莓派上面安裝Windows一直是個比較麻煩的事情,下載系統鏡像,燒錄、還有一系列復雜的配置。
    的頭像 發表于 09-12 09:54 ?1141次閱讀
    如何在<b class='flag-5'>樹莓</b><b class='flag-5'>派上</b>面安裝Windows

    MLC-LLM的編譯部署流程

    MLC-LLM部署在各種硬件平臺的需求,然后我就開始了解MLC-LLM的編譯部署流程和RWKV World模型相比于MLC-LLM已經支持的Raven系列模型的特殊之處。 MLC-LLM
    的頭像 發表于 09-04 09:22 ?1979次閱讀
    MLC-<b class='flag-5'>LLM</b>的編譯部署流程

    有移植樹莓派到飛騰派的教程嗎

    公司基于樹莓派開發板做的產品 希望移植到飛騰派上,請大佬指導
    發表于 08-28 10:24

    如何用PyArmNN加速樹莓派上的ML推理

    NN推理引擎構建一個示例應用程序,將圖像分類為火或非火。 本指南使用Raspberry Pi 3或4設備。樹莓派設備是由Arm CPU驅動的 霓虹燈的架構。Neon是針對Arm處理器的優化架構擴展
    發表于 08-02 15:40

    樹莓派上新,福利來襲!

    工程師專區上新啦! ? 直擊底價! 樹莓派4B ,新客包郵! 工程師發燒友的福音, 新用戶專享優惠價,還免費送電子發燒友VIP月卡。 ▼樹莓派4B 4G開發板, 領滿1 00減20優惠券 券后價格
    的頭像 發表于 08-02 08:41 ?383次閱讀
    <b class='flag-5'>樹莓</b><b class='flag-5'>派上</b>新,福利來襲!

    LLM的長度外推淺談

    蘇神最早提出的擴展LLM的context方法,基于bayes啟發得到的公式
    的頭像 發表于 07-28 17:37 ?1642次閱讀
    <b class='flag-5'>LLM</b>的長度外推淺談

    最新綜述!當大型語言模型(LLM)遇上知識圖譜:兩大技術優勢互補

    LLM 是黑箱模型,缺乏可解釋性,因此備受批評。LLM 通過參數隱含地表示知識。因此,我們難以解釋和驗證 LLM 獲得的知識。此外,LLM 是通過概率模型
    的頭像 發表于 07-10 11:35 ?1565次閱讀
    最新綜述!當大型語言模型(<b class='flag-5'>LLM</b>)遇上知識圖譜:兩大技術優勢互補

    樹莓派監視器開源項目

    電子發燒友網站提供《樹莓派監視器開源項目.zip》資料免費下載
    發表于 06-14 11:33 ?6次下載
    <b class='flag-5'>樹莓</b>派監視器開源<b class='flag-5'>項目</b>
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>