<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Meta推出Llama 2 免費開放商業和研究機構使用

IEEE電氣電子工程師 ? 來源:IEEE電氣電子工程師 ? 2023-08-02 16:17 ? 次閱讀

近日,Meta推出了Llama 2,這是一個新的大型語言模型,參數高達700億。新的生成型人工智能系統代表了OpenAI的變化,但是幾乎沒有分享包括GPT-3/3.5和GPT-4在內的大多數人工智能模型的細節。根據維基百科的數據,Llama 2的發布包含了ChatGPT 3.5的40%的參數,其中包括與微軟的重要合作。Redmond也不僅僅是一個名義上的合作伙伴,他最近宣布支持Azure和Windows中的Llama 2。與此同時,高通公司現在表示,它將與Llama 2一起加入LLM競爭,并公布了將Llama 2帶入智能手機中的計劃。

Meta方面在微軟的Inspire合作伙伴大會上宣布,將與包括微軟在內的主要云計算服務提供商合作,推出新一代開源大模型Llama 2,并將該模型免費開放給商業和研究機構使用。

這樣的發展意味著,無論來源如何,開源人工智能模型的能力和覆蓋范圍都將大幅擴大。

Llama 2: Fine-tuned and Ready to Chat

Perplexity.ai提供了一個令人印象深刻的多個Llama 2模型的免費在線演示。它的結果與包括ChatGPT和谷歌Bard在內的當今頂級聊天機器人具有競爭力。Llama 2快速生成干凈、自然的文本,盡管不太可能非常出彩,但易于閱讀和理解。Llama 2還可以生成通常理解的事實、生成代碼和求解數學方程。

與所有LLM一樣,Llama 2偶爾會產生不正確或不可用的答案,但Meta介紹Llama的論文聲稱,它在學術基準方面與OpenAI的GPT 3.5不相上下,如MMLU(衡量LLM在57門STEM科目中的知識)和GSM8K(衡量LLM對數學的理解)。

Meta的研究人員部分是通過純粹的模型大小實現的 —— 但這只是故事的一半。根據Meta的論文,Llama 2使用了有監督的微調、帶有人類反饋的強化學習和一種名為Ghost Attention(GAtt)的新技術,該技術“能夠在多個回合中進行對話控制”。更簡單地說,GAtt幫助Llama在被要求在特定約束下工作時產生所需的結果,就像被要求“扮演”歷史人物時可能發生的那樣,或者在諸如架構之類的特定主題的上下文中產生響應。

25266d8c-3108-11ee-9e74-dac502259ad0.png

META

這些技術有助于Llama 2提供各種型號,相對于其尺寸,具有可靠的基準性能。最大的模型Llama 2 70B(有700億個參數)在所有基準測試中表現最好,但Meta也提供Llama 27 B和Llama 13 B。

參數較少的變體性能不如Llama 2 70B,但它們足夠緊湊,可以在功能較弱的設備(如智能手機)上本地運行。領先的智能手機片上系統(SoC)生產商高通公司宣布與Meta合作,“從2024年開始”讓Llama 2在高通公司支持的智能手機上本地運行”。

高通公司營銷傳播專家Rodrigo Caruso Neves do Amaral表示:“我們能夠使用我們的軟件工具來編譯和優化模型,特別是在我們的Hexagon處理器上運行。無論是對運行這些型號的公司,還是對有時必須為訪問這些應用程序付費的消費者,在設備上運行所節省的能量都會產生巨大影響?!?/p>

Open Source Fits Where Closed Models Can’t

在智能手機上離線運行大型語言模型是封閉的人工智能模型(如OpenAI的GPT 3.5和谷歌的PaLM2)無法處理的。這不一定是由于技術限制(據推測,OpenAI和谷歌可以提供一種適合智能手機的模型),而是哲學上的分歧。OpenAI和谷歌提供LLM作為API。訪問API需要互聯網連接,客戶將根據使用情況收費。

相比之下,Llama 2的發布表示允許無限、免費的商業和學術使用。該許可并不符合開源計劃制定的所有標準,因為該許可包括一項條款,要求允許將Llama 2用于“月活躍用戶超過7億”的“產品或服務”。然而,該條款僅適用于Meta最大的競爭對手,如OpenAI和谷歌。Meta的Llama 2模型已經出現在HuggingFace的Open LLM排行榜上,截至7月24日星期一收盤,“Llama-2-70b-chat-hf”的延遲和吞吐量基準排名第三。(截至發稿時,目前的頂級模型Stability AI的FreeWilly2實際上已經基于Llama 2,但FreeWilly22使用不同的數據集對模型進行了微調。)

Srinivas認為Llama 2的開源許可證是一個力量倍增器,為開發者和研究人員提供了一個根據他們的特定需求調整模型的機會?!耙粋€人可以啟動Llama 2的分支,專注于量化,另一個人可以開啟另一個Llama的分支關注于低階微調,……其他人則可以將更大的模型提煉成更小的模型,從而加速進展?!?/p>

事實證明,這對瞄準邊緣設備(如智能手機)的開發人員來說尤其重要??紤]到型號的大小,Llama 2 70B表現出色并不令人驚訝。但Llama 2的較小型號相對于其型號大小也排名良好。在Open LLM排行榜上,大多數表現優于Llama 2的小型模型本身都是基于Meta之前的模型Llama。這表明,隨著開源社區的開發人員將他們的才能應用到Llama 2中,Llama 2將在排行榜上名列前茅。

Srinivas說:“我認為Llama 2 7B和Llama 2 13B已經很令人興奮了……這只是一個開始。Meta推出了它,現在人們可以改進它??梢詷嫿ㄆ渌蚣芎推渌こ虒?,這賦予了每個人更多的權力?!?/p>

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1781

    文章

    44776

    瀏覽量

    231927
  • 模型
    +關注

    關注

    1

    文章

    2797

    瀏覽量

    47973
  • OpenAI
    +關注

    關注

    9

    文章

    898

    瀏覽量

    6034

原文標題:Meta推出Llama 2 免費開放商業和研究機構使用

文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    高通支持Meta Llama 3在驍龍終端上運行

    高通與Meta攜手合作,共同推動MetaLlama 3大語言模型(LLM)在驍龍驅動的各類終端設備上實現高效運行。此次合作致力于優化Llama 3在智能手機、個人電腦、VR/AR頭顯
    的頭像 發表于 05-09 10:37 ?178次閱讀

    英特爾AI產品助力其運行Meta新一代大語言模型Meta Llama 3

    英特爾豐富的AI產品——面向數據中心的至強處理器,邊緣處理器及AI PC等產品為開發者提供最新的優化,助力其運行Meta新一代大語言模型Meta Llama 3
    的頭像 發表于 04-28 11:16 ?325次閱讀

    高通與Meta合作優化Meta Llama 3,實現終端側運行

    高通技術公司高級副總裁兼技術規劃和邊緣解決方案業務總經理馬德嘉表示:“我們對Meta開放Meta Llama 3的策略表示贊賞,高通與Meta
    的頭像 發表于 04-22 09:51 ?185次閱讀

    高通支持Meta Llama 3大語言模型在驍龍旗艦平臺上實現終端側執行

    高通和Meta合作優化Meta Llama 3大語言模型,支持在未來的驍龍旗艦平臺上實現終端側執行。
    的頭像 發表于 04-20 09:13 ?233次閱讀

    Meta推出最強開源模型Llama 3 要挑戰GPT

    公司這次開源了Llama 3 8B與70B兩款不同規模的模型,開發者可以免費使用,而Meta公司還將陸續推出一系列具備多模態、多語言對話、更長上下文窗口等能力的新模型。 據悉
    的頭像 發表于 04-19 17:00 ?567次閱讀

    LLaMA 2是什么?LLaMA 2背后的研究工作

    Meta 發布的 LLaMA 2,是新的 sota 開源大型語言模型 (LLM)。LLaMA 2 代表著 LLaMA 的下一代版本,并且具有商業
    的頭像 發表于 02-21 16:00 ?542次閱讀

    Meta發布開源大模型Code Llama 70B

    近日,Meta宣布推出了一款新的開源大模型Code Llama 70B,這是其“Code Llama家族中體量最大、性能最好的模型版本”。這款新模型提供三種版本,并
    的頭像 發表于 01-31 09:24 ?472次閱讀

    Meta推出最新版AI代碼生成模型Code Llama70B

    Meta近日宣布了其最新版本的AI代碼生成模型Code Llama70B,并稱其為“目前最大、最優秀的模型”。這一更新標志著Meta在AI代碼生成領域的持續創新和進步。
    的頭像 發表于 01-30 18:21 ?965次閱讀

    【飛騰派4G版免費試用】仙女姐姐的嵌入式實驗室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

    和語法規則,將這些詞匯串聯起來,形成一個完整的回答 關于LLaMALLaMA.cpp LLaMA全稱是Large Language Model Meta AI,是由
    發表于 12-22 10:18

    Meta發布一種Code Llama工具 用于生成新代碼和調試人工編寫工作

    2相同的社區許可證,并可免費用于研究商業用途。Meta說,Code Llama可以根據提示創建代碼串,或者在指向特定代碼串時完成并調試代
    的頭像 發表于 08-28 16:56 ?1067次閱讀

    Meta推出編程人工智能工具:Code Llama,免費提供

    據路透社報道,meta計劃推出全新編程人工智能模型:Code Llama,可以根據文字提示來編寫計算機代碼,或協助開發者編程。這一AI工具將免費提供。
    的頭像 發表于 08-25 11:39 ?565次閱讀

    Llama 2 登陸 Azure 和 Windows,微軟與 Meta 拓展人工智能合作伙伴關系

    人”的愿景, 對于 MetaLlama 2 的開源路徑我們尤為興奮。在 Meta 首次向商業客戶發布新版 Llama 2 時,微軟
    的頭像 發表于 07-26 10:35 ?357次閱讀
    <b class='flag-5'>Llama</b> 2 登陸 Azure 和 Windows,微軟與 <b class='flag-5'>Meta</b> 拓展人工智能合作伙伴關系

    Meta推出免費大模型Llama 2,GPT要有危機感了

    作為Meta首批合作伙伴之一,亞馬遜云科技宣布客戶可以通過Amazon SageMaker JumpStart來使用Meta開發的Llama 2基礎模型。
    的頭像 發表于 07-21 16:10 ?1046次閱讀

    微軟聯合Meta發布免費商業應用的開源AI模型Llama 2

    Meta 看來,「開放的方法是當今人工智能模型開發的正確方法,特別是在技術快速發展的生成領域。通過公開提供人工智能模型,它們可以使每個人受益。為企業、初創企業、企業家和研究人員提供其開發的工具,這些工具的開發規模是他們自己難
    的頭像 發表于 07-19 16:22 ?572次閱讀
    微軟聯合<b class='flag-5'>Meta</b>發布<b class='flag-5'>免費</b><b class='flag-5'>商業</b>應用的開源AI模型<b class='flag-5'>Llama</b> 2

    高通攜手Meta利用Llama 2賦能終端側AI應用

    要點 — ?? 高通 計劃從2024 年起,在旗艦智能手機和PC上支持基于Llama 2的AI部署,賦能開發者使用驍龍平臺的AI能力,推出激動人心的全新生成式AI應用。 ?? 與僅僅使用云端AI部署
    的頭像 發表于 07-19 10:00 ?391次閱讀
    高通攜手<b class='flag-5'>Meta</b>利用<b class='flag-5'>Llama</b> 2賦能終端側AI應用
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>