<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

RISC -V跑大模型(一)

澎峰科技PerfXLab ? 來源:澎峰科技PerfXLab ? 作者:澎峰科技PerfXLab ? 2023-07-17 15:13 ? 次閱讀
wKgaomS041GAH9vRAAgQZut24SQ065.png

在我寫本文時,剛好是WAIC 2023舉行的時候,感覺無處不是大模型。所以,RISC-V怎么能不刷刷大模型呢?廢話不多說,先上圖:

wKgZomS046iAU-yFAALX_-aQHQs247.png

去年,ChatGPT的出現震驚了全世界,在短短幾個月的時間內,ChatGPT的月活躍用戶達到了1億。ChatGPT的成功讓許多人第一次知道了大語言模型(Large Language Model)的概念,而今年Meta發布的LLaMA則在ChatGPT的基礎上又往前跨了一大步,它大大降低了LLM的使用難度,讓LLM真正“走進基層”。那LLaMA是什么呢?

1. LLaMA介紹

在介紹LLaMA之前,首先要介紹一下LLM(Large Language Model)。我們可以將LLM看成一位知識淵博的老師,在經過大量的知識學習(大量文本數據的訓練)后,LLM會基于它的知識庫,給出問題的最佳答案,我們可以使用LLM來完成文本總結、翻譯、情感分析等工作。最近幾年,是LLM的高速發展期,很多科技巨頭都在LLM投入大量的資金。下面是這幾年LLM的成果圖:

wKgZomS049eAONycAAJfJvdD89c245.png近年來現有大型語言模型(大小大于10B)的時間表

但對于個人研究者而言,LLM的使用是有一定的門檻,一般的LLM模型對硬件的要求比較高,而一些開發公司出于商業的目的,并不打算將項目的源碼進行開源,這都限制了個人研究者從更深的層次去了解LLM,在一定程度上這影響了LLM的發展(Android能有今天地位,離不開開源和方便使用,這為它后來的迅速發展打下了良好的基礎)。好在今年Meta發布的LLaMA(Language Learning through Multimodal Autoregressive Models)給了對LLM感興趣的開發者另一個選項,相較于其他的LLM模型而言,LLaMA優勢在于它足夠親民且開源。

從親民的角度來說,LLaMA的規模僅為ChatGPT的“十分之一”,但性能卻優于OpenAI的GPT-3模型,而且LLaMA只是一個基礎模型,它完全可以使用公開的數據模型進行訓練,這都使得LLaMA的使用門檻被大大降低;從開源的角度來說,LLaMA可以說是被迫開源,因為技術方面的問題,Meta暫緩了開源過程,但在發布后的不久,LLaMA的模型文件就被泄露了,那么,問題來了,這究竟是故意的還是不小心的呢?

2. llama.cpp

llama.cpp是由保加利亞索非亞的Georgi Gerganov基于LLaMA模型開發的純C版本。Georgi Gerganov是一位資深的開源社區開發者,曾經還為OpenAI的自動語音識別模型開發了whisper.cpp。llama.cpp可以讓使用者在沒有GPU的情況下也能運行LLaMA模型。所以它一經發布,就吸引了大量對LLaMA感興趣的人下載使用,很快就有人找到了在Windows上運行LLaMA的方法,之后又實現了在手機上的運行。llama.cpp大大降低了LLaMA的使用門檻,通過llama.cpp,LLaMA展現了它無與倫比的語言學習能力,為我們打開了一座探索語言世界的新大門。

值得一提的是,Georgi Gerganov在公布llama.cpp后的幾個月就自主創業,成立了ggml.ai公司,這個公司的合伙人有GitHub前CEO Nat Friedman和Y-Combinator的Daniel Gross。ggml.ai的成立也引起了許多業內大佬的注意,或許它之后會為AI的發展帶來一些不一樣的東西。

3. 硬件平臺簡介

3.1 RISC-V簡介
澎峰科技聯合創始人王軍輝說“2023年是RISC-V高性能計算元年”。因為2023年算能推出了全球第一顆已量產的RISC-V服務器級64核CPU,這意味RISC-V進入高性能計算領域的未來已經不遠了。那么,RISC-V到底是什么?

簡單來說,RISC-V和我們熟悉的X86、ARM一樣,都是指令集架構,但X86屬于復雜指令集(CSIC),RISC-V和ARM屬于精簡指令集(RISC)。雖然CISC指令豐富功能強大,但隨著CISC的逐步發展,過于復雜的指令不僅會導致指令使用率不均衡(效率低),也加大了超大規模集成電路實現的難度。相對的,RISC的優勢在于指令簡單,使用率均衡,執行效率高。同時,通?;赗ISC的芯片易于實現電路設計和大規模集成。

正如文章開篇所展示的,我在基于SG2042的RISC-V平臺上完成了LLaMA的移植。LLM和RISC-V都是近兩年比較熱門的東西,同時又有很大的空白供開發者們探索和建設,所以我覺得把兩者結合這是一件很有意思也很有意義的事情。下面簡單介紹一下我使用的開發平臺。

3.2 平臺

RISC-V服務器主板(搭載全球第一顆量產的服務器級64核RISC-V芯片SG2042)

wKgZomS05eiAdJpRAA1z6rBqDng539.png

3.3 基本配置

硬件平臺配置
CPU SG2042(64 Core@2.0GHz)
DDR 32GB 3200MHz
Local Storage 1T M.2 NVMe SSD
操作系統配置
OS Ubuntu
Kernel Linux 5.19.17

4. 結束語

本系列文章估計會分為四期:

第一期:RISC -V跑大模型(引言)。

第二期:LLaMA零基礎移植教程。

第三期:軟件優化進行LLaMA加速

第四期:更多性能優化策略。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • RISC-V
    +關注

    關注

    41

    文章

    1935

    瀏覽量

    45181
  • RISC-V處理器
    +關注

    關注

    0

    文章

    75

    瀏覽量

    9907
  • ChatGPT
    +關注

    關注

    27

    文章

    1453

    瀏覽量

    5146
  • 大模型
    +關注

    關注

    2

    文章

    1653

    瀏覽量

    1278
  • LLM
    LLM
    +關注

    關注

    0

    文章

    209

    瀏覽量

    241
收藏 人收藏

    評論

    相關推薦

    RISC-V 跑大模型(二):LLaMA零基礎移植教程

    這是RISC-V跑大模型系列的第二篇文章,主要教大家如何將LLaMA移植到RISC-V環境里。
    的頭像 發表于 07-17 16:16 ?1028次閱讀
    <b class='flag-5'>RISC</b>-V 跑大<b class='flag-5'>模型</b>(二):LLaMA零基礎移植教程

    RISC-V 跑大模型(三):LLaMA中文擴展

    這是RISC-V跑大模型系列的第三篇文章,前面我們為大家介紹了如何在RISC-V下運行LLaMA,本篇我們將會介紹如何為LLaMA提供中文支持。
    的頭像 發表于 07-17 17:15 ?552次閱讀
    <b class='flag-5'>RISC</b>-V 跑大<b class='flag-5'>模型</b>(三):LLaMA中文擴展

    有用risc-v芯片系統的嗎?

    risc-v芯片系統有什么需要注意的呢?
    發表于 03-29 21:52

    RISC-V中***會子活動之:基于RISC-V的鴻蒙開發板設計

    `、Workshop介紹 首屆RISC-V中***會(RISC-V World Conference China)將于6月21日在上??萍即髮W盛大開幕。 本次峰會預計線下超過1000人、線上
    發表于 06-03 16:26

    RISC-V是什么

    (剛剛投入芯片行業學習的新人,存在理解錯誤的地方歡迎指出,并探討,還請多多包涵,謝謝?。?RISC-V是區別于 INTEL x86架構、arm架構的另種芯片內核架構。 RISC-V,主要區別于當代
    發表于 07-23 06:06

    如何設計個好的RISC-V

    文章目錄寫在前面什么是RISC-VRISC-V誕生的背景ISA霸權摩爾定律的窮途末路窮困潦倒的學者不斷增長的指令數量RISC-V架構設計思想如何設計個好的ISARISC-V之RV32
    發表于 07-26 06:42

    什么是RISC-V? RISC-V指令具有哪些特點應用?

    什么是RISC-V?RISC-V指令具有哪些特點應用?自己怎么才能設計出設計套指令集?
    發表于 10-14 09:05

    請問如何判斷MCU可以多大的模型?

    如何判斷我的MCU可以多大的模型?靠看ram占用?實際測試執行效率?
    發表于 04-26 09:26

    全志V853常用模型分數據

    V853常用模型分數據序號算法模型FPSBW(MB/s)1inception_v1(224x224)57.371443.312incept
    發表于 12-23 09:28

    risc-v是什么意思

      risc-v是什么意思  RISC-V種指令集  RISC-V,般被念做:risk five。
    發表于 03-30 16:40

    RISC-VuCLinux或者NO MMU的Linux的項目嗎?

    RISC-VuCLinux或者NO MMU的Linux的項目嗎?
    發表于 04-03 17:54

    RISC-V 發展

    是必選的,擴展指令集是可選的。意思就是可以根據你的實際需求,選擇需要使用的指令。例如在個項目中,如果不需要用到壓縮指令,那么就不需要把壓縮指令添加進來,從而做到定制化,這也是RISC-V大特點
    發表于 04-14 10:18

    RISC-V,正在擺脫低端

    控制、即時通信、車載娛樂等方面。 芯來科技有限公司CEO彭劍英曾在接受采訪時表示, RISC-V架構是智能汽車“大腦”的最優解之。 當前,國內外企業在推動RISC-V上車方面基本上處在同一起
    發表于 05-30 14:11

    RISC-V跑大模型(一)

    在我寫本文時,剛好是WAIC 2023舉行的時候,感覺無處不是大模型。
    的頭像 發表于 07-10 10:07 ?309次閱讀
    <b class='flag-5'>RISC</b>-V跑大<b class='flag-5'>模型</b>(一)

    RISC-V跑大模型(二):LLaMA零基礎移植教程

    這是RISC-V跑大模型系列的第二篇文章,主要教大家如何將LLaMA移植到RISC-V環境里。
    的頭像 發表于 07-10 10:10 ?797次閱讀
    <b class='flag-5'>RISC</b>-V跑大<b class='flag-5'>模型</b>(二):LLaMA零基礎移植教程
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>