<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

Meta發布一款可以使用文本提示生成代碼的大型語言模型Code Llama

今天，Meta發布了Code Llama，一款可以使用文本提示生成代碼的大型語言模型（LLM）。Code Llama在代碼任務上是公開可用的LLM中最先進的，它有可能讓當前開發者的工作流程更快更高效，也降低了學習編程的門檻。Code Llama有可能被用作一種生產力和教育工具，幫助程序員編寫更健壯、更有文檔的軟件。

Code Llama是一個新的大型語言模型,專門用于生成代碼,它基于Meta的Llama 2基礎模型構建。它可以從自然語言提示生成代碼。

Code Llama是免費的，可用于研究和商業用途。

Code Llama是基于Llama 2構建的，有三種模型：

Code Llama，基礎的代碼模型；

Code Llama - Python，專門針對Python；

以及Code Llama - Instruct，它是為了理解自然語言指令而微調的。

Code Llama在代碼生成基準測試(如HumanEval和MBPP)上優于其他公開可用的模型。它與ChatGPT可媲美。

發布了三種大小的Code Llama模型 - 7B、13B和34B參數。34B模型具有最佳性能,但較小的模型更快。

Code Llama支持許多流行的編程語言,并可以處理長達10萬個標記的輸入上下文。

潛在的應用包括幫助開發人員更有效地編寫、調試和記錄代碼。它還可以幫助降低學習編程的門檻。

Code Llama 工作原理

Code Llama是Llama 2的一個代碼專用版本，它是通過在Llama 2的代碼特定數據集上進一步訓練，從同一數據集中采樣更多的數據進行更長時間的訓練而創建的。本質上，Code Llama具有增強的編碼能力，建立在Llama 2之上。它可以從代碼和自然語言提示（例如，“寫一個輸出斐波那契數列的函數?！保┥纱a，以及關于代碼的自然語言。它也可以用于代碼補全和調試。它支持許多當今最流行的語言，包括Python, C++, Java, PHP, Typescript (Javascript), C#, 和Bash（請參閱下面參考的研究論文以獲得完整的列表）。

我們將發布三種尺寸的 Code Llama，分別具有 7B、13B 和 34B 參數。每個模型都使用 500B 代碼令牌和代碼相關數據進行訓練。7B 和 13B 基礎模型和指令模型也經過了中間填充 (FIM) 功能的訓練，允許它們將代碼插入到現有代碼中，這意味著它們可以支持開箱即用的代碼完成等任務。

這三種模型滿足不同的服務和延遲要求。例如，7B 模型可以在單個 GPU 上運行。34B 模型返回最佳結果并提供更好的編碼輔助，但較小的 7B 和 13B 模型速度更快，更適合需要低延遲的任務，例如實時代碼完成。

Code Llama 模型提供了具有多達 100,000 個上下文標記的穩定生成。所有模型都在 16,000 個標記的序列上進行訓練，并在最多 100,000 個標記的輸入上顯示出改進。

除了是生成更長程序的先決條件之外，擁有更長的輸入序列還可以為代碼LLM解鎖令人興奮的新用例。例如，用戶可以為模型提供來自其代碼庫的更多上下文，以使各代更相關。它還有助于在較大的代碼庫中調試場景，在這種情況下，掌握與具體問題相關的所有代碼對于開發人員來說可能是一項挑戰。當開發人員面臨調試大量代碼時，他們可以將整個代碼長度傳遞到模型中。

此外，我們還進一步微調了 Code Llama 的兩個附加變體：Code Llama - Python 和 Code Llama - Instruct。

Code Llama - Python 是 Code Llama 的語言專用變體，在 Python 代碼的 100B 標記上進一步微調。因為 Python 是代碼生成方面最具基準測試的語言，并且因為 Python 和PyTorch在 AI 社區中發揮著重要作用，所以我們相信專門的模型可以提供額外的實用性。

Code Llama - Instruct 是 Code Llama 的指令微調和對齊變體。指令調整繼續訓練過程，但目標不同。該模型接受“自然語言指令”輸入和預期輸出。這使得它能夠更好地理解人們對提示的期望。我們建議在使用 Code Llama 進行代碼生成時使用 Code Llama - Instruct 變體，因為 Code Llama - Instruct 已經過微調，可以用自然語言生成有用且安全的答案。

我們不建議使用 Code Llama 或 Code Llama - Python 執行一般自然語言任務，因為這兩個模型都不是為遵循自然語言指令而設計的。Code Llama 專門用于特定于代碼的任務，不適合作為其他任務的基礎模型。

使用 Code Llama 模型時，用戶必須遵守我們的許可和可接受的使用政策。

評估 Code Llama 的性能

為了針對現有解決方案測試 Code Llama 的性能，我們使用了兩個流行的編碼基準：HumanEval和 Mostly Basic Python Programming ( MBPP )。HumanEval 測試模型根據文檔字符串完成代碼的能力，MBPP 測試模型根據描述編寫代碼的能力。

我們的基準測試表明，Code Llama 的表現優于開源、特定于代碼的 Llama，并且優于 Llama 2。例如，Code Llama 34B 在 HumanEval 上得分為 53.7%，在 MBPP 上得分為 56.2%，與其他狀態相比最高。最先進的開放解決方案，與 ChatGPT 相當。

與所有尖端技術一樣，Code Llama 也存在風險。負責任地構建人工智能模型至關重要，我們在發布 Code Llama 之前采取了許多安全措施。作為我們紅隊工作的一部分，我們對 Code Llama 生成惡意代碼的風險進行了定量評估。我們創建了試圖以明確意圖征求惡意代碼的提示，并根據 ChatGPT (GPT3.5 Turbo) 對 Code Llama 對這些提示的響應進行了評分。我們的結果發現，Code Llama 的回答更安全。

有關負責任人工智能、進攻性安全工程、惡意軟件開發和軟件工程領域專家的紅隊工作的詳細信息，請參閱研究論文。

發布Code Llama

程序員已經在使用LLM來協助完成各種任務，從編寫新的軟件到調試現有的代碼。我們的目標是讓開發者的工作流程更高效，讓他們能夠專注于他們工作中最具人性化的方面，而不是重復性的任務。

在Meta，我們相信AI模型，特別是編碼用的LLM，從開放的方式中受益最多，無論是在創新還是安全方面。公開可用的、代碼特定的模型可以促進開發新技術，改善人們的生活。通過發布像Code Llama這樣的代碼模型，整個社區可以評估它們的能力，發現問題，并修復漏洞。

Code Llama 的訓練方法可在我們的Github 存儲庫中找到，還提供模型參數。

生成式人工智能編碼的未來

Code Llama 旨在為所有領域的軟件工程師提供支持，包括研究、工業、開源項目、非政府組織和企業。但是，還有更多的用例需要支持，超出了我們的基礎模型和指導模型所能提供的服務范圍。我們希望 Code Llama 能夠激勵其他人利用 Llama 2 為研究和商業產品創建新的創新工具。

審核編輯：劉清

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

PHP

PHP

+關注

關注
0

文章
452

瀏覽量
26499
python

python

+關注

關注
52

文章
4700

瀏覽量
83642
GPU芯片

GPU芯片

+關注

關注
1

文章
303

瀏覽量
5709
ChatGPT

ChatGPT

+關注

關注
28

文章
1485

瀏覽量
5653
LLM

LLM

+關注

關注
0

文章
218

瀏覽量
249

原文標題：Meta發布最先進的代碼生成模型Code Llama

文章出處：【微信號：軟件質量報道，微信公眾號：軟件質量報道】歡迎添加關注！文章轉載請注明出處。

評論

相關推薦

了解大型語言模型 (LLM) 領域中的25個關鍵術語

1.LLM（大語言模型）大型語言模型(LLMs)是先進的人工智能系統，經過大量文本數據集的訓練，

的頭像

發表于 05-10 08:27 ?894次閱讀

了解<b class='flag-5'>大型</b><b class='flag-5'>語言</b><b class='flag-5'>模型</b> (LLM) 領域中的25個關鍵術語

Meta Llama 3基礎模型現已在亞馬遜云科技正式可用

亞馬遜云科技近日宣布，Meta公司最新發布的兩款Llama 3基礎模型——Llama 3 8B和Llam

發表于 05-09 10:39 ?158次閱讀

英特爾AI產品助力其運行Meta新一代大語言模型Meta Llama 3

英特爾豐富的AI產品——面向數據中心的至強處理器，邊緣處理器及AI PC等產品為開發者提供最新的優化，助力其運行Meta新一代大語言模型Meta L

發表于 04-28 11:16 ?325次閱讀

高通支持Meta Llama 3大語言模型在驍龍旗艦平臺上實現終端側執行

高通和Meta合作優化Meta Llama 3大語言模型，支持在未來的驍龍旗艦平臺上實現終端側執行。

發表于 04-20 09:13 ?233次閱讀

Meta推出最強開源模型Llama 3 要挑戰GPT

公司這次開源了Llama 3 8B與70B兩款不同規模的模型，開發者可以免費使用，而Meta公司還將陸續推出一系列具備多模態、多語言對話、更

發表于 04-19 17:00 ?567次閱讀

LLaMA 2是什么？LLaMA 2背后的研究工作

Meta 發布的 LLaMA 2，是新的 sota 開源大型語言模型 (LLM)。

發表于 02-21 16:00 ?542次閱讀

Meta發布CodeLlama70B開源大模型

Meta發布CodeLlama70B開源大模型 Meta發布了開源大模型CodeLlama70B

發表于 01-31 10:30 ?1064次閱讀

Meta發布開源大模型Code Llama 70B

近日，Meta宣布推出了一款新的開源大模型Code Llama 70B，這是其“Code

發表于 01-31 09:24 ?472次閱讀

Meta推出最新版AI代碼生成模型Code Llama70B

Meta近日宣布了其最新版本的AI代碼生成模型Code Llama70B，并稱其為“目前最大、最

發表于 01-30 18:21 ?964次閱讀

【飛騰派4G版免費試用】仙女姐姐的嵌入式實驗室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

和語法規則，將這些詞匯串聯起來，形成一個完整的回答關于LLaMA及LLaMA.cpp LLaMA全稱是Large Language Model

發表于 12-22 10:18

Meta發布一種Code Llama工具用于生成新代碼和調試人工編寫工作

Meta公司表示，Meta發布了一種名為Code Llama的工具，該工具建立在其Llama 2

發表于 08-28 16:56 ?1066次閱讀

Meta將推出編程人工智能工具：Code Llama，免費提供

據路透社報道，meta計劃推出全新編程人工智能模型：Code Llama，可以根據文字提示來編寫

發表于 08-25 11:39 ?565次閱讀

Meta即將推出開源代碼生成平臺Code Llama，劍指OpenAI Codex

Code Llama 的卓越功能源自行業領先的 AI 算法。其核心模型由包含編程語言、編碼模式和最佳實踐的大規模數據集訓練而成。自然語言處理

發表于 08-21 15:15 ?672次閱讀

基于Llama2和OpenVIN打造聊天機器人

Llama 2是 Meta 發布了其最新的大型語言模型，Ll

發表于 08-06 11:06 ?616次閱讀

語音領域的GPT時刻：Meta 發布「突破性」生成式語音系統，一個通用模型解決多項任務

繼開源 LLaMA 之后，Meta 在生成式 AI 方向又公布一項重大研究。我們知道，GPT、DALL-E 等大規模生成模型徹底改變了自然

發表于 06-18 21:30 ?492次閱讀

精選推薦
更多

文章

資料

帖子

EMC大揭秘 PCB設計必備指南

凡億PCB
1天前

584 閱讀

華為PCBA檢查規范設計總結

凡億PCB
1天前

685 閱讀

第一批人機戀的“AI前任”已經死了

腦極體
1天前

763 閱讀

手把手教你在orcad中設置CIS元器件數據庫，提高工作效率

硬件花園
1天前

927 閱讀

鴻蒙ArkTS聲明式開發：跨平臺支持列表【組件內容填充方式】

jf_46214456
2天前

533 閱讀

集成電路參數及應用手冊-劉仁普

yezi888
15.8 MB

免費

371下載

KisPiano鋼琴助手

的撒的
1.83 MB

2積分

3下載

puNES基于Qt的任天堂模擬器

陳文博
49.04 MB

2積分

1下載

Confluo多數據流實時分布式分析系統

h1654155275.5741
1.35 MB

免費

0下載

PoE-PD 轉換器NCP1083REF12VC4GEVB評估板數據手冊

2.15 MB

免費

0下載

無線鼠標主板，可以自己照著做嗎？

angel725
1天前

254 閱讀

【Vision Board創客營連載體驗】基于Vision Board的垃圾分類

大菠蘿Alpha
1天前

109 閱讀

【Vision Board創客營連載體驗】使用 Vision Board 做一個 UVC Camera

ouxiaolong
2天前

108 閱讀

【Vision Board創客營連載體驗】TinyMaix進行手寫數字識別

ouxiaolong
2天前

436 閱讀

【Vision Board創客營連載體驗】RA8D1-Vision Board使用7寸屏設置為RGB666大端模式模式成功顯示攝像頭圖案

donatello1996
3天前

409 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看