<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

關于Llama 2的一切資源，我們都幫你整理好了

Llama 2 是一個由 Meta 開發的大型語言模型，是 LLaMA 1 的繼任者。Llama 2 可通過 AWS、Hugging Face 獲取，并可以自由用于研究和商業用途。Llama 2 預訓練模型在 2 萬億個標記上進行訓練，相比 LLaMA 1 的上下文長度增加了一倍。它的微調模型則在超過 100 萬個人工標注數據下完成。

這篇博客包含了所有的相關資源，以幫助您快速入門。

來自 Meta 官方的公告可以在這里找到：https://ai.meta.com/llama/

LLaMA 2 是什么？

Meta 發布的 Llama 2，是新的 SOTA 開源大型語言模型（LLM）。Llama 2 代表著 LLaMA 的下一代版本，可商用。Llama 2 有 3 種不同的大小 —— 7B、13B 和 70B 個可訓練參數。與原版 LLaMA 相比，新的改進包括：

在 2 萬億個標記的文本數據上進行訓練
允許商業使用
默認使用 4096 個前后文本視野
70B 模型采用了分組查詢注意力（GQA）
可以在 Hugging Face Hub 上直接獲取https://hf.co/models?other=llama-2

即刻解鎖 Llama2

有幾個不同的游樂場供與 Llama 2 來測試：

HuggingChat

在我們推出的 HuggingChat 中使用 Llama 2 70B：https://hf.co/chat

Hugging Face Space 應用

我們在 Space 應用上提供了三個大小的 Llama 2 模型的體驗，分別是:

7Bhttps://hf.co/spaces/huggingface-projects/llama-2-7b-chat
13Bhttps://huggingface.co/spaces/huggingface-projects/llama-2-13b-chat
70Bhttps://huggingface.co/spaces/ysharma/Explore_llamav2_with_TGI

Perplexity

Perplexity 的對話 AI 演示提供 7B 和 13B 的 Llama 2 模型:https://llama.perplexity.ai/

Llama 2 背后的研究工作

Llama 2 是一個基礎大語言模型，它由網絡上公開可獲取到的數據訓練完成。另外 Meta 同時發布了它的 Chat 版本。Chat 模型的第一個版本是 SFT（有監督調優）模型。在這之后，LLaMA-2-chat 逐步地經過人類反饋強化學習（RLHF）來進化。RLHF 的過程使用了拒絕采樣與近端策略優化（PPO）的技術來進一步調優聊天機器人。Meta 目前僅公布了模型最新的 RLHF (v5) 版本。若你對此過程背后的過程感興趣則請查看：

Llama 2: 開源并已微調的聊天模型https://arxiv.org/abs/2307.09288
Llama 2: 一個超贊的開源大語言模型https://www.interconnects.ai/p/llama-2-from-meta
Llama 2 的全面拆解https://www.youtube.com/watch?v=zJBpRn2zTco

Llama 2 的性能有多好，基準測試？

Meta 表示:

Llama 2 在眾多外部基準測試中都優于其他開源的語言模型，包括推理、編程、熟練程度與知識測驗。

關于其性能你可以在這里找到更多信息：

Hugging Face 開源大語言模型排行榜https://hf.co/spaces/HuggingFaceH4/open_llm_leaderboard
Meta 官方公告https://ai.meta.com/llama/

如何為 LLaMA 2 Chat 寫提示詞 (prompts)

Llama 2 Chat 是一個開源對話模型。想要與 Llama 2 Chat 進行高效地交互則需要你提供合適的提示詞，以得到合乎邏輯且有幫助的回復。Meta 并沒有選擇最簡單的提示詞結構。

以下是單輪、多輪對話的提示詞模板。提示詞模板遵循模型訓練過程，你可以在這里查看到詳細描述:

Llama 2 論文https://hf.co/papers/2307.09288
Llama 2 提示詞模板https://gpus.llm-utils.org/llama-2-prompt-template/

單輪對話

[INST]<>
{{system_prompt}}
<>

{{user_message}}[/INST]

多輪對話

[INST]<> {{system_prompt}} <> {{user_msg_1}}[/INST]{{model_answer_1}}[INST]{{user_msg_2}}[/INST]{{model_answer_2}}[INST]{{user_msg_3}}[/INST]

如何訓練 LLaMA 2

因 LLaMA 2 為開源模型，使得可以輕易的通過微調技術，比如 PEFT，來訓練它。這是一些非日適合于訓練你自己版本 LLaMA 2 的學習資源：

擴展指引：指令微調 Llama 2https://www.philschmid.de/instruction-tune-llama-2

在 Amazon SageMaker 上微調 Llama 2 (7-70B)https://www.philschmid.de/sagemaker-llama2-qlora

使用 PEFT 技術微調https://hf.co/blog/zh/llama2#fine-tuning-with-peft

Meta 提供的 Llama 模型示例以及方案https://github.com/facebookresearch/llama-recipes/tree/main

在本地機器上微調 LLAMA-v2 最簡單的方法！https://www.youtube.com/watch?v=3fsn19OI_C8

如何部署 Llama 2?

Llama 2 可以在本地環境部署，使用托管服務如 Hugging Face Inference Endpoints 或通過 AWS、Google Cloud、Microsoft Azure 等。

你可以查閱下述資源:

llama.cpphttps://github.com/ggerganov/llama.cpp

使用文本生成接口與推理終端來部署 LLama 2https://hf.co/blog/llama2#using-text-generation-inference-and-inference-endpoints

使用 Amazon SageMaker 部署 LLaMA 2 70Bhttps://www.philschmid.de/sagemaker-llama-llm

在你的 M1/M2 Mac 上通過 GPU 接口來本地部署 Llama-2-13B-chathttps://gist.github.com/adrienbrault/b76631c56c736def9bc1bc2167b5d129

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
27182

瀏覽量
264953

開源

開源

+關注

關注
3

文章
3029

瀏覽量
41812

語言模型

語言模型

+關注

關注
0

文章
463

瀏覽量
10150

原文標題：關于 Llama 2 的一切資源，我們都幫你整理好了

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

收藏人收藏

掃一掃，分享給好友

復制鏈接分享

評論

發布評論請先登錄

相關推薦

高通支持Meta Llama 3在驍龍終端上運行

高通與Meta攜手合作，共同推動Meta的Llama 3大語言模型（LLM）在驍龍驅動的各類終端設備上實現高效運行。此次合作致力于優化Llama 3在智能手機、個人電腦、VR/AR頭顯及汽車等領域的執行性能。

發表于 05-09 10:37 ?178次閱讀

Llama 3 王者歸來，Airbox 率先支持部署

前天，智算領域迎來一則令人振奮的消息：Meta正式發布了備受期待的開源大模型——Llama3。Llama3的卓越性能Meta表示，Llama3在多個關鍵基準測試中展現出卓越性能，超越了業內先進的同類

發表于 04-22 08:33 ?366次閱讀

Meta推出最強開源模型Llama 3 要挑戰GPT

Meta推出最強開源模型Llama 3 要挑戰GPT Facebook母公司Meta Platforms（META.US）推出了開源AI大模型“Llama”的最新升級版本“Llama 3”，Meta

發表于 04-19 17:00 ?567次閱讀

LLaMA 2是什么？LLaMA 2背后的研究工作

Meta 發布的 LLaMA 2，是新的 sota 開源大型語言模型 (LLM)。LLaMA 2 代表著 LLaMA 的下一代版本，并且具有商業許可證。

發表于 02-21 16:00 ?542次閱讀

【飛騰派4G版免費試用】仙女姐姐的嵌入式實驗室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

和語法規則，將這些詞匯串聯起來，形成一個完整的回答關于LLaMA及LLaMA.cpp LLaMA全稱是Large Language Mo

發表于 12-22 10:18

【LuckFox Pico Plus開發板免費試用】-01-資料收集和分享

很高興有機會試用 LuckFox Pico Plus開發板，在知道自己有這個機會試用的時候，自己就開始在網上收集這個開發板的資料了，自己整理了出來，網上的資料比較全，但是資料比較亂，所以自己整理好了

發表于 10-12 11:15

怎樣使用QLoRA對Llama 2進行微調呢？

使用QLoRA對Llama 2進行微調是我們常用的一個方法，但是在微調時會遇到各種各樣的問題

發表于 09-22 14:27 ?1244次閱讀

寫了一個vi，單獨運行一切正常，一旦加到項目中就報錯

寫了一個vi，單獨運行一切正常，一旦加到項目中就報錯

發表于 08-14 17:14

Llama 2 登陸 Azure 和 Windows，微軟與 Meta 拓展人工智能合作伙伴關系

人”的愿景，對于 Meta 對 Llama 2 的開源路徑我們尤為興奮。在 Meta 首次向商業客戶發布新版 Llama 2 時，微軟

發表于 07-26 10:35 ?357次閱讀

Llama 2性能如何

在幾乎所有基準上，Llama 2 70B 的結果均與谷歌 PaLM (540B) 持平或表現更好，不過與 GPT-4 和 PaLM-2-L 的性能仍存在較大差距。

發表于 07-23 13:00 ?1197次閱讀

Llama2的技術細節探討分析

模型結構為Transformer結構，與Llama相同的是采用RMSNorm歸一化、SwiGLU激活函數、RoPE位置嵌入、詞表的構建與大小，與Llama不同的是增加GQA（分組查詢注意力），擴增了模型輸入最大長度，語料庫增加了40%。

發表于 07-23 12:36 ?1226次閱讀

你們關心的環境傳感器問題，我們替你整理好了！

隨著大家對環境傳感器不斷的深入了解，近期有不少小伙伴在后臺向我們提出各種問題，環境傳感器有哪些用途？尺寸變小后會影響性能嗎？盛思銳是如何解決行業難題的? 盛思銳傳感器壽命如何？ …… 為此

發表于 07-20 17:41 ?331次閱讀

RISC-V 跑大模型（三）：LLaMA中文擴展

這是RISC-V跑大模型系列的第三篇文章，前面我們為大家介紹了如何在RISC-V下運行LLaMA，本篇我們將會介紹如何為LLaMA提供中文支持。

發表于 07-17 17:15 ?586次閱讀

RISC-V 跑大模型（二）：LLaMA零基礎移植教程

這是RISC-V跑大模型系列的第二篇文章，主要教大家如何將LLaMA移植到RISC-V環境里。

發表于 07-17 16:16 ?1058次閱讀

RISC-V跑大模型（二）：LLaMA零基礎移植教程

這是RISC-V跑大模型系列的第二篇文章，主要教大家如何將LLaMA移植到RISC-V環境里。

發表于 07-10 10:10 ?832次閱讀

深度學習自然語言處理
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 一個給NLP領域帶來革新的預訓練語言大模型Bert
Hot 推薦一些翻譯英文文獻比較準確的軟件

New 什么是RAG，RAG學習和實踐經驗
New MOE與MOT：提升LLM效能的關鍵策略比較

精選推薦
更多

文章

資料

帖子

使用理想二極管控制器的汽車應用冗余電源拓撲

德州儀器
11分鐘前

18 閱讀

電力電子中的電大、電小尺寸？

英飛凌工業半導體
2天前

95 閱讀

EMC大揭秘 PCB設計必備指南

凡億PCB
1天前

633 閱讀

華為PCBA檢查規范設計總結

凡億PCB
1天前

728 閱讀

第一批人機戀的“AI前任”已經死了

腦極體
1天前

807 閱讀

用于COB的PCB設計指導書

h1654155805.2348
525 KB

免費

0下載

OpenResty最佳實踐

吳藩
5.20 MB

2積分

2下載

全功能雙插槽AdvancedMC?控制器TPS2359數據表

王秀珍
1.54MB

免費

0下載

用于驅動背對背NFET的3V至65V理想二極管控制器LM7481數據表

YYXIAO
3.27MB

免費

0下載

SmartBond? DA14706 藍牙低功耗子板數據手冊

5.27 MB

免費

0下載

無線鼠標主板，可以自己照著做嗎？

angel725
1天前

297 閱讀

【Vision Board創客營連載體驗】基于Vision Board的垃圾分類

大菠蘿Alpha
1天前

137 閱讀

【Vision Board創客營連載體驗】使用 Vision Board 做一個 UVC Camera

ouxiaolong
2天前

140 閱讀

【Vision Board創客營連載體驗】TinyMaix進行手寫數字識別

ouxiaolong
2天前

452 閱讀

【Vision Board創客營連載體驗】RA8D1-Vision Board使用7寸屏設置為RGB666大端模式模式成功顯示攝像頭圖案

donatello1996
3天前

425 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看