<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

LLaMA 2是什么？LLaMA 2背后的研究工作

關于 LLaMA 2 的全部資源，如何去測試、訓練并部署它。

LLaMA 2 是一個由 Meta 開發的大型語言模型，是 LLaMA 1 的繼任者。LLaMA 2 可通過 AWS、Hugging Face 等提供商獲取，并免費用于研究和商業用途。LLaMA 2 預訓練模型在 2 萬億個標記上進行訓練，相比 LLaMA 1 的上下文長度增加了一倍。它的微調模型則在超過 100 萬個人工標注數據下完成。

這篇博客包含了所有的相關資源，以幫助您快速入門。包括以下跳轉:

LLaMA 2 是什么？

在 LLaMA 游樂場試玩

模型背后的研究工作

模型的性能有多好，基準測試

如何正確地去提示聊天模型

如何使用 PEFT 訓練模型

如何部署模型進行推理

和其他資源

來自 Meta 官方的公告可以在這里找到: https://ai.meta.com/llama/

LLaMA 2 是什么？

Meta 發布的 LLaMA 2，是新的 sota 開源大型語言模型 (LLM)。LLaMA 2 代表著 LLaMA 的下一代版本，并且具有商業許可證。LLaMA 2 有 3 種不同的大小——7B、13B 和 70B 個可訓練參數。與原版 LLaMA 相比，新的改進包括:

在 2 萬億個標記的文本數據上進行訓練

允許商業使用

默認使用 4096 個前后文本視野 (可以被擴展)

70B 模型采用了分組查詢注意力 (GQA)

可由此獲取 Hugging Face Hub

在 LLaMA 游樂場試玩

有幾個不同的游樂場供與 LLaMA 2 來測試聊天:

HuggingChat 允許你通過 Hugging Face 的對話界面與 LLaMA 2 70B 模型聊天。這提供了一個簡潔的方法來了解聊天機器人的工作原理。

Hugging Face Spaces 有三種大小的 LLaMA 2 模型 7B、13B 和 70B 可供測試。交互式演示可以讓您比較不同的大小模型的區別。

Perplexity 他們的對話 AI 演示提供 7B 和 13B 的 LLaMA 2 模型。你可以與模型聊天并且反饋模型響應的不足。

LLaMA 2 背后的研究工作

LLaMA 2 是一個基礎大語言模型，它由網絡上公開可獲取到的數據訓練完成。另外 Meta 同時發布了它的 CHAT 版本。CHAT 模型的第一個版本是 SFT (有監督調優) 模型。在這之后，LLaMA-2-chat 逐步地經過人類反饋強化學習 (RLHF) 來進化。RLHF 的過程使用了拒絕采樣與近端策略優化 (PPO) 的技術來進一步調優聊天機器人。Meta 目前僅公布了模型最新的 RLHF(v5) 版本。若你對此過程背后的過程感興趣則請查看:

Llama 2: 開源并已微調的聊天模型

Llama 2: 一個超贊的開源大語言模型

Llama 2: 全面拆解

LLaMA 2 的性能有多好，基準測試？

Meta 聲稱 “Llama 2 在眾多外部基準測試中都優于其他開源的語言模型，包括推理、編程、熟練程度與知識測驗” 關于其性能你可以在這里找到更多信息:

Hugging Face 開源大語言模型排行榜

Meta 官方公告

如何提示 LLaMA 2 Chat

LLaMA 2 Chat 是一個開源對話模型。想要與 LLaMA 2 Chat 進行高效地交互則需要你提供合適的提示詞、問題來得到合乎邏輯且有幫助的回復。Meta 并沒有選擇最簡單的提示詞結構。以下是單輪、多輪對話的提示詞模板。這個模板遵循模型的訓練過程，在此詳細描述 LLaMA 2 論文. 你也可以看一看 LLaMA 2 提示詞模板.

單輪對話

[INST]<>
{{system_prompt}}
<>
{{user_message}}[/INST]

多輪對話

~~[INST]<> {{system_prompt}} <> {{user_msg_1}}[/INST]{{model_answer_1}}[INST]{{user_msg_2}}[/INST]{{model_answer_2}}[INST]{{user_msg_3}}[/INST]~~

如何訓練 LLaMA 2

因 LLaMA 2 為開源模型，使得可以輕易的通過微調技術，比如 PEFT，來訓練它。這是一些非日適合于訓練你自己版本 LLaMA 2 的學習資源:

擴展指引: 指令微調 Llama 2

在 Amazon SageMaker 上微調 LLaMA 2 (7-70B)

使用 PEFT 技術微調

Meta 提供的 Llama 模型示例以及方案

在本地機器上微調 LLAMA-v2 最簡單的方法 !

如何部屬 LLaMA 2

LLaMA 2 可以在本地環境中部署 (llama.cpp)，使用這樣已管理好的服務 Hugging Face Inference Endpoints 或通過 AWS, Google Cloud, and Microsoft Azure 這樣的服務器平臺.

使用文本生成接口與推理終端來部署 LLama 2

使用 Amazon SageMaker 部署 LLaMA 2 70B (即將完成)

在你的 M1/M2 Mac 上通過 GPU 接口來本地部署 Llama-2-13B-chat

原文作者: Philschmid

譯者: Xu Haoran

審核編輯：黃飛

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
27061

瀏覽量
264819

聊天機器人

聊天機器人

+關注

關注
0

文章
305

瀏覽量
12210

原文標題：LLaMA 2 - 你所需要的一切資源

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

收藏人收藏

掃一掃，分享給好友

復制鏈接分享

評論

發布評論請先登錄

相關推薦

RISC-V 跑大模型（二）：LLaMA零基礎移植教程

這是RISC-V跑大模型系列的第二篇文章，主要教大家如何將LLaMA移植到RISC-V環境里。

發表于 07-17 16:16 ?1053次閱讀

RISC-V 跑大模型（三）：LLaMA中文擴展

這是RISC-V跑大模型系列的第三篇文章，前面我們為大家介紹了如何在RISC-V下運行LLaMA，本篇我們將會介紹如何為LLaMA提供中文支持。

發表于 07-17 17:15 ?572次閱讀

大模型筆記之gem5運行模型框架LLama介紹

LLama.cpp 支持x86，arm，gpu的編譯。

發表于 01-22 09:10 ?505次閱讀

【飛騰派4G版免費試用】仙女姐姐的嵌入式實驗室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

和語法規則，將這些詞匯串聯起來，形成一個完整的回答關于LLaMA及LLaMA.cpp LLaMA全稱是Large Language Model Meta AI，是由Meta AI研究

發表于 12-22 10:18

基于LLAMA的魔改部署

去訓練），并且和Vision結合的大模型也逐漸多了起來。所以怎么部署大模型是一個超級重要的工程問題，很多公司也在緊鑼密鼓的搞著。目前效果最好討論最多的開源實現就是LLAMA，所以我這里討論的也是基于 LLAMA的魔改部署。基于

發表于 05-23 15:08 ?4709次閱讀

RISC-V跑大模型（二）：LLaMA零基礎移植教程

這是RISC-V跑大模型系列的第二篇文章，主要教大家如何將LLaMA移植到RISC-V環境里。

發表于 07-10 10:10 ?820次閱讀

Llama2的技術細節探討分析

模型結構為Transformer結構，與Llama相同的是采用RMSNorm歸一化、SwiGLU激活函數、RoPE位置嵌入、詞表的構建與大小，與Llama不同的是增加GQA（分組查詢注意力），擴增了模型輸入最大長度，語料庫增加了40%。

發表于 07-23 12:36 ?1219次閱讀

Llama 2性能如何

在幾乎所有基準上，Llama 2 70B 的結果均與谷歌 PaLM (540B) 持平或表現更好，不過與 GPT-4 和 PaLM-2-L 的性能仍存在較大差距。

發表于 07-23 13:00 ?1192次閱讀

關于Llama 2的一切資源，我們都幫你整理好了

Meta 發布的 Llama 2，是新的 SOTA 開源大型語言模型（LLM）。Llama 2 代表著 LLaMA 的下一代版本，可商用。Llama 2 有 3 種不同的大小 —— 7

發表于 08-23 15:40 ?832次閱讀

Meta發布一種Code Llama工具用于生成新代碼和調試人工編寫工作

Meta公司表示，Meta發布了一種名為Code Llama的工具，該工具建立在其Llama 2大型語言模型的基礎上，用于生成新代碼和調試人工編寫的工作。 Code Llama將使用與

發表于 08-28 16:56 ?1047次閱讀

怎樣使用QLoRA對Llama 2進行微調呢？

使用QLoRA對Llama 2進行微調是我們常用的一個方法，但是在微調時會遇到各種各樣的問題

發表于 09-22 14:27 ?1216次閱讀

Meta推出最強開源模型Llama 3 要挑戰GPT

Meta推出最強開源模型Llama 3 要挑戰GPT Facebook母公司Meta Platforms（META.US）推出了開源AI大模型“Llama”的最新升級版本“Llama 3”，Meta

發表于 04-19 17:00 ?556次閱讀

Llama 3 王者歸來，Airbox 率先支持部署

前天，智算領域迎來一則令人振奮的消息：Meta正式發布了備受期待的開源大模型——Llama3。Llama3的卓越性能Meta表示，Llama3在多個關鍵基準測試中展現出卓越性能，超越了業內先進的同類

發表于 04-22 08:33 ?345次閱讀

高通支持Meta Llama 3在驍龍終端上運行

高通與Meta攜手合作，共同推動Meta的Llama 3大語言模型（LLM）在驍龍驅動的各類終端設備上實現高效運行。此次合作致力于優化Llama 3在智能手機、個人電腦、VR/AR頭顯及汽車等領域的執行性能。

發表于 05-09 10:37 ?165次閱讀

【AIBOX上手指南】快速部署Llama3

Firefly開源團隊推出了Llama3部署包，提供簡易且完善的部署教程，過程無需聯網，簡單快捷完成本地化部署。點擊觀看Llama3快速部署教程：Step.1準備部署包進入Firefly下載中心

發表于 06-06 08:02 ?52次閱讀

深度學習自然語言處理
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 一個給NLP領域帶來革新的預訓練語言大模型Bert
Hot 推薦一些翻譯英文文獻比較準確的軟件

New 什么是RAG，RAG學習和實踐經驗
New MOE與MOT：提升LLM效能的關鍵策略比較

精選推薦
更多

文章

資料

帖子

如何移植FFmpeg

ElfBoard
2天前

418 閱讀

基于Arm Cortex-CM85內核的RA8D1作為控制器通過MIPI DSI實現LVGL顯示

瑞薩MCU小百科
2天前

567 閱讀

便攜式直流接地故障查找儀如何使用——每日了解電力知識

武漢摩恩
2天前

604 閱讀

重磅！英特爾發布intel3制程至強6能效核處理器，賦能數據中心能效升級

章鷹觀察
2天前

747 閱讀

Node-RED實現電表數據采集并上云

億佰特物聯網應用專家
2天前

730 閱讀

TI老工程師教你如何馴服精密放大器

黃博
5600KB

5積分

386下載

Nohang高度可配置的Linux內存守護程序

馬祥
0.07 MB

免費

0下載

Biz-SIP金融級云原生中間件

張莉
0.34 MB

免費

4下載

MagicCamera Android相機軟件

李林
17.14 MB

免費

1下載

WHC_DataModelFactory iOS開發高效輔助工具

恐龍之家
3.09 MB

免費

2下載

I.MX6ULL-飛凌 ElfBoard ELF1板卡 - 如何在Ubuntu中編譯OpenCV庫(X86架構）

jf_25331175
2天前

564 閱讀

鴻蒙原生應用元服務開發-設備管理USB服務開發場景與接口

李洋水蛟龍
2天前

275 閱讀

嵌入式學習-飛凌ElfBoard ELF 1板卡 - 如何在Ubuntu中編譯OpenCV庫

jf_25331175
2天前

747 閱讀

【留言有禮】佳節至，分享“粽”要記憶，傳遞溫馨祝福，贏取精美禮品！

ElecFans小喇叭
3天前

782 閱讀

無刷電機用的單電阻采樣的FOC，拿天線貼著電機線或者貼近采樣芯片，電機就會停轉

剛剛回國弄
3天前

1234 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看