0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區
會(huì )員中心
創(chuàng )作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內不再提示

解鎖LLM新高度—OpenVINO? 2024.1賦能生成式AI高效運行

英特爾物聯(lián)網(wǎng) ? 來(lái)源:OpenVINO 中文社區 ? 2024-05-10 10:36 ? 次閱讀

大語(yǔ)言模型推理的改進(jìn)

LLM 的發(fā)展仍保持著(zhù)驚人的速度。盡管現有的 LLM 已經(jīng)具備強大的功能,但通過(guò) OpenVINO 的優(yōu)化和推理加速,可以對這些復雜模型的執行進(jìn)行精煉,實(shí)現更快、更高效的處理,減少計算開(kāi)銷(xiāo)并最大限度發(fā)揮硬件潛力,這將直接導致 LLM 實(shí)現更高的吞吐量和更低的延遲。

通過(guò)采用壓縮嵌入實(shí)現額外優(yōu)化,有效地縮減了 LLM 的編譯耗時(shí)與內存占用。與此同時(shí),基于英特爾銳炫GPU,以及英特爾高級矩陣擴展(Intel AMX)的第4代和第5代英特爾至強平臺之上,LLM 的第一個(gè) token 處理性能得到了顯著(zhù)提升。

通過(guò) oneDNN 可實(shí)現更好的 LLM 壓縮與性能提升。如今,經(jīng)過(guò)量化或壓縮后的 INT4 和 INT8 精度的 LLM 可在英特爾銳炫GPU 上得到支持。在搭載集成 GPU 的英特爾酷睿Ultra 處理器上,針對部分小型 GenAI 模型顯著(zhù)減少了內存消耗。

此外,現在可以在 PyTorch 模型進(jìn)行訓練后量化之后,對其進(jìn)行微調,以提高模型精度并簡(jiǎn)化從訓練后量化過(guò)渡到訓練感知量化的過(guò)程。

已添加演示示例:https://github.com/openvinotoolkit/nncf/blob/develop/examples/quantization_aware_training/torch/resnet18/README.md

更多生成式 AI 覆蓋范圍和框架集成

進(jìn)一步深入了解搭載 OpenVINO 的生成式 AI,該新版本拓寬了生成式AI的邊界,使其能夠覆蓋更廣泛的神經(jīng)網(wǎng)絡(luò )架構與應用場(chǎng)景。

針對最新發(fā)布的最先進(jìn)的 Llama 3 和 Phi3 模型, OpenVINO 對其實(shí)現了支持和優(yōu)化。

具備混合專(zhuān)家(MoE)架構的 LLM 模型 Mixtral 以及 URLNet 模型,均針對英特爾至強處理器進(jìn)行了性能提升優(yōu)化。

文生圖模型 Stable Diffusion 1.5,以及 LLMs 模型 ChatGLM3-6b和Qwen-7B,則專(zhuān)為搭載了集成 GPU 的英特爾酷睿Ultra 處理器進(jìn)行了推理速度的改進(jìn)和優(yōu)化。

現在,OpenVINO 已支持 Falcon-7B-Instruct,這是一款即用型、具備優(yōu)秀性能指標的生成式AI大語(yǔ)言模型,適用于聊天與指令場(chǎng)景。

新版本支持的其他模型包括:

Yolo V9、Yolo V8 Oriented Bounding Box Detection (OOB)、Stable Diffusion in Keras、MoblieCLIP、RMBG-v1.4 Background Removal、Magika、TripoSR、AnimateAnyone、LLaVA-Next 以及帶有 OpenVINO 和 LangChain 的 RAG 系統。

我們還在 OpenVINO Notebooks 存儲庫中提供了 Jupyter Notebook 示例。

新平臺的更改和現有平臺的增強

除了 PyPI 上的主 OpenVINO 軟件包外,英特爾酷睿Ultra 處理器的預覽 NPU 插件現在在 OpenVINO 開(kāi)源 GitHub 存儲庫中可用。

現在,可以通過(guò) npm 存儲庫更輕松地訪(fǎng)問(wèn) JavaScript API,使 JavaScript 開(kāi)發(fā)人員能夠無(wú)縫訪(fǎng)問(wèn) OpenVINO API。我們擴展了文檔,可幫助開(kāi)發(fā)人員將他們的 JavaScript 應用程序與 OpenVINO 集成。

現在,默認情況下已在 ARM 處理器上為卷積神經(jīng)網(wǎng)絡(luò )(CNN)啟用 FP16 推理。在多種 ARM 設備上,已顯著(zhù)提升了眾多模型的性能。已實(shí)現與 CPU 架構無(wú)關(guān)的構建,旨在為不同 ARM 設備提供統一的二進(jìn)制分發(fā)。

新增和更新的 Notebook

OpenVINO Notebooks 仍然是非常有價(jià)值的資源,用于展示如何利用 OpenVINO 在人工智能領(lǐng)域實(shí)現重要進(jìn)展。最近,我們對 OpenVINO notebooks 存儲庫做了一些改動(dòng),包括將默認分支從 'main' 更改為 'latest',以及對 "notebooks" 文件夾內 notebook 的命名結構進(jìn)行了改進(jìn)。



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權轉載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習之用,如有內容侵權或者其他違規問(wèn)題,請聯(lián)系本站處理。 舉報投訴
  • GPU芯片
    +關(guān)注

    關(guān)注

    1

    文章

    303

    瀏覽量

    5709
  • 生成式AI
    +關(guān)注

    關(guān)注

    0

    文章

    425

    瀏覽量

    305
  • OpenVINO
    +關(guān)注

    關(guān)注

    0

    文章

    63

    瀏覽量

    103

原文標題:解鎖 LLM 新高度,拓寬模型新邊界 —— OpenVINO? 2024.1 賦能生成式 AI 高效運行 | 開(kāi)發(fā)者實(shí)戰

文章出處:【微信號:英特爾物聯(lián)網(wǎng),微信公眾號:英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    亞馬遜云科技攜手SAP通過(guò)生成AI解鎖創(chuàng )新潛力

    云科技與SAP宣布擴大戰略合作,旨在革新現代化的云ERP體驗,并利用生成AI為企業(yè)帶來(lái)全新功能與效率提升。雙方將共同努力,簡(jiǎn)化客戶(hù)在亞馬遜云科技上采用RISE with SAP解決方案的流程,提高SAP工作負載在云端運行的性能
    的頭像 發(fā)表于 06-07 10:53 ?121次閱讀

    ZR執行器:智能制造的得力干將,提升生產(chǎn)新高度

    ZR執行器:智能制造的得力干將,提升生產(chǎn)新高度 ZR執行器以其精準的控制能力和高效的執行效率,在智能制造領(lǐng)域發(fā)揮了重要作用。傳統的執行器往往存在控制不精確、反應速度慢等問(wèn)題,難以滿(mǎn)足現代生產(chǎn)對于高效
    的頭像 發(fā)表于 05-10 11:15 ?199次閱讀

    Arm平臺賦能移動(dòng)端生成AI

    生成式人工智能 (Generative AI) 涵蓋了當下廣為人知,且備受關(guān)注的大語(yǔ)言模型 (LLM),如今也已落地邊緣側的移動(dòng)設備。
    的頭像 發(fā)表于 04-26 11:09 ?555次閱讀

    NQ8 AI Gen3芯片打造視聽(tīng)新高度,三星Neo QLED 8K QN900D開(kāi)啟AI電視新紀元

    應運而生,強大的神經(jīng)網(wǎng)絡(luò )結合AI深度學(xué)習算法的應用使電視芯片不斷學(xué)習和自我進(jìn)化,驅動(dòng)MIRCO LED、Mini?LED、OLED等多種屏幕顯示技術(shù),打造視聽(tīng)新高度。 經(jīng)過(guò)五年的厚積薄發(fā),2024年三星發(fā)布“AI for All
    的頭像 發(fā)表于 03-15 14:30 ?256次閱讀
    NQ8 <b class='flag-5'>AI</b> Gen3芯片打造視聽(tīng)<b class='flag-5'>新高度</b>,三星Neo QLED 8K QN900D開(kāi)啟<b class='flag-5'>AI</b>電視新紀元

    安霸發(fā)布全新N1系列生成AI芯片

    安霸在CES 2024上發(fā)布了全新的N1系列生成AI芯片,這是一款專(zhuān)門(mén)為前端設備設計的芯片,支持本地運行大型語(yǔ)言模型(LLM)應用。其單顆SoC能夠支持1至340億參數的多模態(tài)大模型
    的頭像 發(fā)表于 01-09 15:32 ?822次閱讀

    安霸發(fā)布N1系列生成AI芯片支持前端設備運行本地LLM應用

    單顆 SoC 支持 1 至 340 億參數的多模態(tài)大模型(Multi-Modal LLM)推理,實(shí)現前端低功耗生成AI。
    的頭像 發(fā)表于 01-09 15:19 ?698次閱讀

    如何快速下載OpenVINO Notebooks中的AI大模型

    OpenVINO Notebooks是Jupyter Notebook形式的OpenVINO范例程序大集合,方便開(kāi)發(fā)者快速學(xué)習并掌握OpenVINO推理程序,并通過(guò)Copy&Paste方式將范例中的關(guān)鍵程序應用到自己的
    的頭像 發(fā)表于 12-12 14:40 ?785次閱讀
    如何快速下載<b class='flag-5'>OpenVINO</b> Notebooks中的<b class='flag-5'>AI</b>大模型

    如何利用OpenVINO加速LangChain中LLM任務(wù)

    LangChain 是一個(gè)高層級的開(kāi)源的框架,從字面意義理解,LangChain 可以被用來(lái)構建 “語(yǔ)言處理任務(wù)的鏈條”,它可以讓AI開(kāi)發(fā)人員把大型語(yǔ)言模型(LLM)的能力和外部數據結合起來(lái),從而
    的頭像 發(fā)表于 12-05 09:58 ?520次閱讀

    利用 NVIDIA Jetson 實(shí)現生成AI

    上以交互速率運行的 Llama-2-70B 模型。 圖 1. 領(lǐng)先的生成AI 模型在? Jetson AGX Orin 上的推理性能 如要在 Jetson 上快速測試最新的模型和應用,請使用 Jetson
    的頭像 發(fā)表于 11-07 21:25 ?573次閱讀
    利用 NVIDIA Jetson 實(shí)現<b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b>

    使用Splashtop解鎖對企業(yè)生成AI的安全訪(fǎng)問(wèn)

    其他可以從私有AI 模型中受益的公司包括因業(yè)務(wù)需求而要從頭開(kāi)始訓練自己的LLM 模型的公司,或者需要保護數據增強和優(yōu)化的LLM 模型的公司,這些模型已經(jīng)針對特定任務(wù)(例如客戶(hù)支持、財務(wù)咨詢(xún)等)進(jìn)行了預訓練。
    的頭像 發(fā)表于 10-22 14:19 ?448次閱讀

    英碼科技精彩亮相火爆的IOTE 2023,多面AIoT產(chǎn)業(yè)發(fā)展!

    產(chǎn)品,包括覆蓋多層次算力的智能工作站(邊緣計算盒子)、AI加速卡等;同時(shí)向大家展示自研的AI技術(shù)服務(wù)——“深元”0代碼移植工具鏈和創(chuàng )新性的行業(yè)解決方案,更多AIoT產(chǎn)業(yè)生態(tài)企業(yè)快速
    發(fā)表于 09-25 10:03

    光纖矩陣,提升視覺(jué)體驗新高度

    隨著(zhù)科技的不斷進(jìn)步,視覺(jué)體驗成為了人們追求的重要方向之一。訊維光纖矩陣技術(shù)作為現代科技的前沿代表,為提升視覺(jué)體驗新高度提供了強有力的支持。 作為一種先進(jìn)的信息傳輸技術(shù),訊維光纖矩陣利用光纖作為傳輸
    的頭像 發(fā)表于 09-01 15:08 ?396次閱讀
    光纖矩陣,提升視覺(jué)體驗<b class='flag-5'>新高度</b>

    Stability AI發(fā)布首個(gè)用于編程的生成LLM AI產(chǎn)品—StableCode

    Stability AI 近日宣布了他們首個(gè)用于編程的生成LLM AI 產(chǎn)品 ——StableCode。該產(chǎn)品旨在幫助程序員完成日常工作,并為新手開(kāi)發(fā)者提供實(shí)用的學(xué)習工具。
    的頭像 發(fā)表于 08-24 11:27 ?669次閱讀
    Stability <b class='flag-5'>AI</b>發(fā)布首個(gè)用于編程的<b class='flag-5'>生成</b>式<b class='flag-5'>LLM</b> <b class='flag-5'>AI</b>產(chǎn)品—StableCode

    如何為PyInstaller命令行添加OpenVINO依賴(lài)性,從OpenVINO python腳本生成功能 .exe文件?

    :\\person-detection-retail-0013.xml;.\" Social_Distancing_MQTT.py 運行生成的 .exe 并接收一個(gè)出現任何情況的空白頁(yè)面。
    發(fā)表于 08-15 07:16

    如何在使用Inspector運行OpenVINO C++樣本時(shí)避免內存泄露?

    運行OpenVINO? 圖像分類(lèi) Async C++示例帶英特爾? Inspector用于檢查內存問(wèn)題。使用命令: $ pwd /home/centos
    發(fā)表于 08-15 06:18
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看