<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

專欄發布 | LLM圈走馬換將?微軟廣告“黑五”來襲 !

微軟科技 ? 來源:未知 ? 2023-11-27 08:15 ? 次閱讀

去一年并不平凡。從去年11月至今,LLM大型語言模型持續破圈、始終盤踞熱點話題之列。根據Adobe Analytics的最新在線購物預測,感恩節本土市場假日季的在線收入,或將有望創達2218億美元。年度機遇近在眼前,跨境出海企業如何抓住機遇、突破銷售記錄?

wKgZomVj4LKAIEdnAAAxBTCakOI998.png

對此,LLM或許能夠給出答案。微軟首席執行官薩提亞·納德拉在剛剛結束的全球Ignite技術大會上曾表示,“生成式AI模型的參數范圍很廣,從需要 Azure 中最強大 GPU 的數萬億參數的 LLM,到數十億參數的特定任務SLM(小語言模型)。我們都提供了最佳的前沿模型選擇,用戶、客戶及合作伙伴可以使用這些模型構建自己的AI應用,并滿足對成本、延遲和性能的特定需求。

wKgZomVj4LKAG_2qAAAZo8Up2kE488.png ?

關于“黑五”的創意圖 Getty

無疑,以LLM為代表的AI新浪潮正在為廣告營銷行業帶來巨大變革與飛躍。本月起,“微軟全球營銷”將通過一系列專欄文章,為讀者進行前沿技術解讀。今天為大家奉上的是對LLM大型語言模型的技術原理詳解及科研視角前瞻。

wKgZomVj4LKATWg_AACcCYaMXxw889.png

專欄導讀

“由大型語言模型驅動的 AI 系統,正加速改變著每個人的工作與生活。作為全球領先的科技企業,微軟始終致力于推動前沿技術創新、應用與普及,為世界賦能。我們以豐富的 AI 經驗和資源,秉承責任、可靠、可信原則,將 AI 融入微軟現有生態,從提供 AI 工具到構筑 AI 平臺,與合作伙伴全方位攜手、擁抱技術潮流,予力用戶、惠及行業、創造社會價值?!?/p>

張祺

微軟全球資深副總裁

wKgZomVj4LKATWg_AACcCYaMXxw889.png

LLM的技術原理

wKgZomVj4LKAG_2qAAAZo8Up2kE488.pngwKgZomVj4LOAbEWNAAIlRkUX7Qg954.png

圖注:LLM訓練全景圖

LLM 作為一種具有強大功能的模型,研究人員通過預訓練、微調、提示工程和插件等技術手段,使其備了理解自然語言并進行推理的能力。

預練習(Pre-training)

談到LLM的預訓練,我們指的是一種訓練方法。預訓練時,LLM學習大規模數據,從中提取出盡可能多的共性特征,從而減輕模型對特定任務的學習負擔。預訓練模型的發展經歷了從BERT雙向變換器模型,到GPT 自回歸變換器模型的轉變。其中的典型代表即 OpenAI 的 GPT 系列。今年11月,OpenAI正式推出最新的GPT-4 Turbo。主要提升包括:上下文對話長度達到128k,采用全新模型控制技術優化輸出,以及GPT-4 Turbo的知識庫更新到2023年4月等。

wKgZomVj4LKAG_2qAAAZo8Up2kE488.png ?

關于 ChatGPT 的創意圖 Getty

此外,Meta 創建的開源模型 LLaMA,也備受外界關注。今年7月,Meta在微軟的Inspire合作伙伴大會上宣布,與微軟合作推出LLaMA2,并獲得Azure 和 Windows的支持。10月,LLaMA2的延伸版本LLaMA Long 上線,上下文長度達到32k。

wKgZomVj4LKAG_2qAAAZo8Up2kE488.png ?

Meta 開源模型 LLaMA 創意圖 Getty

微調(Fine-tuning)

微調,是在已有的預訓練基礎上,通過少量的數據對LLM進行訓練,按要求實現修改和優化,使之在特定任務上表現出更優性能。微調減少了訓練新模型所需的時間和資源,同時減輕了標注數據的壓力,是一種快速遷移學習的方法。

wKgZomVj4LKAG_2qAAAZo8Up2kE488.png ?

關于信息數據的創意圖 Getty

最新的GPT-4 Turbo又一大升級,就是允許開發人員定制化微調,例如修改模型訓練過程,進行額外的特定領域預訓練、運行自定義強化學習后訓練過程等。

提示工程(Prompt Engineering)

提示工程是指設計和構造適合LLM輸入的提示文本,以引導其產生特定類型的輸出。通過設計合適的提示詞,可以引導LLM在特定領域或任務上表現出更好的性能。LLM 在生成文本時具有一定的創造力和自由度。有人也把它稱為思維鏈(Tree-of-Thought),類似人類解決問題的思維方式,通過試錯的方式在解決空間中進行樹狀搜索,并在必要時進行回溯。思維鏈主要包括頭腦風暴(brainstorming)、評估(evaluation)、擴展(expansion)和決策(decision)四個階段構成,形成的一整套鏈路,使得 LLM 能夠生成多個潛在的解決方案,評估并改進它們,最終給出用戶最佳的解決方案。

wKgZomVj4LKAG_2qAAAZo8Up2kE488.png ?

關于 LLM 的創意圖 Getty

wKgZomVj4LKATWg_AACcCYaMXxw889.png

插件和擴展(Plugin & Extension)

研究人員還會通過添加額外模塊或插件,來實現對LLM的功能擴展,增強其在特定任務上的能力。例如,Auto-GPT 和 JARVIS 是LLM功能擴展的典型代表。其中,Auto-GPT 是一種基于GPT 的自動化工具,它可以利用 GPT-4 的強大功能自動完成復雜任務。用戶給定一個目標,它就會將其分解為子任務,并利用互聯網和其他工具自動實現。

wKgZomVj4LKAG_2qAAAZo8Up2kE488.png ?

圖為 Auto-GPT 的官網首頁截圖

JARVIS 是一個框架,它利用ChatGPT 來規劃任務流程,根據 Hugging Face 的功能介紹來選擇適合的模型,執行各個子任務,并根據執行結果生成反饋。JARVIS 可以實現多領域、多模態的復雜AI 任務,在語言、視覺、語音等方面都取得了令人印象深刻的結果。

wKgZomVj4LKATWg_AACcCYaMXxw889.png

LLM如何賦能廣告

在解析了 LLM 的技術原理后,跨境出海企業最想了解的就是究竟如何將LLM應用到廣告之中。對此,今年9月,微軟全球資深副總裁張祺博士在《聚焦AI大航海時代新契機、新模式、新動能》一文中曾給出過答案——搜索引擎的商業模式,如 AdWords和競價排名等,會隨技術的進步、體驗的迭代而不斷推陳出新。

目前,微軟廣告(Microsoft Advertising)正在通過 LLM 賦能實現垂直創新,為出海企業帶來嶄新機遇。

以 LLM 為基礎,以生成式人工智能(AIGC)技術為突破口融入了人工智能副駕 Copilot。Copilot為用戶提供了全新的搜索方式,也為廣告主及合作伙伴創造了接觸消費者的新機會和新可能。借助生成式AI,我們創造出效果出眾體感沉浸 、深度融合的廣告內容,逐步將一眾廣受歡迎的搜索廣告形式(如文字廣告、購物廣告、多媒體廣告等)及類別(如酒店廣告、旅游廣告、郵輪廣告、信用卡廣告、汽車廣告等)引入必應聊天,讓用戶在會話廣告中精準獲取商品信息,在對比廣告中做出智慧決策。

wKgZomVj4LKAG_2qAAAZo8Up2kE488.pngwKgZomVj4LSAFD2bAAWG_9xC9qg032.png

圖注:用戶可以通過Copilot在聊天中進行商品對比。比如用戶想購買一輛新車,就會去對比不同制造商和型號的車輛數據。以此情境為例,對比廣告會將各型號汽車的數據整理到一份統一報告中,便于用戶對比各項指標。隨著搜索+聊天的全新模式日漸風靡,會話廣告將愈發普及、并適用于多個場景——比如定制某個城市之旅,再比如購買特定顏色和風格的家具建議等。

專為廣告主設計的微軟廣告平臺智能副駕(Microsoft Advertising Platform Copilot),貼心的聊天機器人將在線聊天指導您洞悉趨勢、制定策略、完成創建,最終幫您實現廣告目標。您只需描述需求,之后的工作全部交給Copilot, 它將基于流程整體協助交付:從素材提煉產品賣點,到結合微軟搜索趨勢,再到提交完整廣告圖文方案。借助微軟廣告平臺智能副駕,只需依據品牌及營銷目標,即可定制獨一無二的專屬方案,幾分鐘內實現個性化精彩廣告。

wKgZomVj4LKATWg_AACcCYaMXxw889.png

展望未來

在LLM顛覆式技術創新大潮下,微軟廣告致力于為全體消費者提供更便捷、更高效的個性化創意廣告體驗,助力垂直創新。我們期待幫助廣告主及合作伙伴洞察行業先機,通過打造本土創新產品及服務,助力消費增長、推動本地品牌走向全球,在AI的黃金時代實現業務的垂直增長!

wKgZomVj4LSAWZV8AABwHvUH7c8397.jpg

LLM專欄作者:耿秀波

微軟(亞洲)互聯網工程院

首席應用科學家

wKgZomVj4LWASOEvAAAA7s0CTZQ011.svg

關于微軟廣告

wKgZomVj4LWARic4AAAA77bRYwo663.svg

微軟廣告(Microsoft Advertising)致力于為國內廣告主提供動態廣告解決方案,與合作伙伴一道,共同發掘全球商機、開拓多元市場,現已覆蓋187個國家和地區、35種語言,觸達全球超14億受眾,并且擁有持續增長的高價值用戶。

在領先的AI技術、生產力工具和創新模式驅動下,本地行業與市場都將煥發新生。微軟將通過創新產品和服務,助力本土品牌走向全球,實現高速增長。

本文為《技術賦能》專欄系列文章之一

專欄介紹:AI大航海時代,前沿技術無疑為行業革新、企業增長與創意變現提供了新機遇,一場創新模式的革命已如箭在弦,這正是我們策劃此專欄系列文章的初衷。在此,來自微軟(亞洲)互聯網工程院的首席應用科學家以及高級、資深研究員們,將在系列專欄文章中分享他們對人工智能、大語言模型及其應用領域如何實現技術賦能的洞察及前瞻。更多專欄內容,敬請期待!


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6434

    瀏覽量

    103203

原文標題:專欄發布 | LLM圈走馬換將?微軟廣告“黑五”來襲 !

文章出處:【微信號:mstech2014,微信公眾號:微軟科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    大語言模型(LLM)快速理解

    自2022年,ChatGPT發布之后,大語言模型(LargeLanguageModel),簡稱LLM掀起了一波狂潮。作為學習理解LLM的開始,先來整體理解一下大語言模型。一、發展歷史大語言模型的發展
    的頭像 發表于 06-04 08:27 ?300次閱讀
    大語言模型(<b class='flag-5'>LLM</b>)快速理解

    NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫,用于優化從 PC 到云端的 NVIDIA GPU 上運行的大語言模型推理
    的頭像 發表于 04-28 10:36 ?225次閱讀

    100%在樹莓派上執行的LLM項目

    ChatGPT的人性口語化回復相信許多人已體驗過,也因此掀起一波大型語言模型(Large Language Model, LLM)熱潮,LLM即ChatGPT背后的主運作技術,但LLM運作需要龐大運算力,因此目前多是在云端(Cl
    的頭像 發表于 02-29 16:29 ?821次閱讀
    100%在樹莓派上執行的<b class='flag-5'>LLM</b>項目

    優于10倍參數模型!微軟發布Orca 2 LLM

    微軟發布 Orca 2 LLM,這是 Llama 2 的一個調優版本,性能與包含 10 倍參數的模型相當,甚至更好。
    的頭像 發表于 12-26 14:23 ?355次閱讀

    一文詳解LLM模型基本架構

    LLM 中非常重要的一個概念是 Token,我們輸入給 LLM 和它輸出的都是 Token。Token 在這里可以看做語言的基本單位,中文一般是詞或字(其實字也是詞)。比如:”我們喜歡 Rust
    發表于 12-25 10:38 ?1429次閱讀
    一文詳解<b class='flag-5'>LLM</b>模型基本架構

    低比特量化技術如何幫助LLM提升性能

    針對大語言模型 (LLM) 在部署過程中的性能需求,低比特量化技術一直是優化效果最佳的方案之一,本文將探討低比特量化技術如何幫助 LLM 提升性能,以及新版 OpenVINO 對于低比特量化技術的支持。
    的頭像 發表于 12-08 15:26 ?738次閱讀
    低比特量化技術如何幫助<b class='flag-5'>LLM</b>提升性能

    點亮未來:TensorRT-LLM 更新加速 AI 推理性能,支持在 RTX 驅動的 Windows PC 上運行新模型

    微軟 Ignite 2023 技術大會發布的新工具和資源包括 OpenAI?Chat?API 的 TensorRT-LLM 封裝接口、RTX 驅動的性能改進 DirectML?for?Llama
    的頭像 發表于 11-16 21:15 ?502次閱讀
    點亮未來:TensorRT-<b class='flag-5'>LLM</b> 更新加速 AI 推理性能,支持在 RTX 驅動的 Windows PC 上運行新模型

    電梯廣告機的功能?

    智能電梯廣告機支持安全信息發布,物業通知發布信息,和商業廣告發布信息,支持及時發布緊急信息、突發事件,插播媒體文件,插播
    的頭像 發表于 09-25 11:36 ?405次閱讀

    對比解碼在LLM上的應用

    為了改進LLM的推理能力,University of California聯合Meta AI實驗室提出將Contrastive Decoding應用于多種任務的LLM方法。實驗表明,所提方法能有效改進LLM的推理能力。讓我們走進
    發表于 09-21 11:37 ?419次閱讀
    對比解碼在<b class='flag-5'>LLM</b>上的應用

    海思 PQTools 電平矯正方法

    來源:易百納技術社區 一 什么是電平?電平:黑色的最小值,sensor感光全零數據時,對應sensor輸出的最小信號值 形成的原因:1 sensor模擬信號轉換到數字信號時,由于轉換精度限制
    發表于 09-11 15:07

    檢索增強LLM的方案全面的介紹

    OpenAI 研究科學家 Andrej Karpathy 前段時間在微軟 Build 2023 大會上做過一場關于 GPT 模型現狀的分享 State of GPT[3],這場演講前半部
    的頭像 發表于 09-08 16:39 ?955次閱讀
    檢索增強<b class='flag-5'>LLM</b>的方案全面的介紹

    MLC-LLM的編譯部署流程

    MLC-LLM部署在各種硬件平臺的需求,然后我就開始了解MLC-LLM的編譯部署流程和RWKV World模型相比于MLC-LLM已經支持的Raven系列模型的特殊之處。 MLC-LLM
    的頭像 發表于 09-04 09:22 ?2012次閱讀
    MLC-<b class='flag-5'>LLM</b>的編譯部署流程

    LLM的長度外推淺談

    蘇神最早提出的擴展LLM的context方法,基于bayes啟發得到的公式
    的頭像 發表于 07-28 17:37 ?1646次閱讀
    <b class='flag-5'>LLM</b>的長度外推淺談

    LLM對程序員的沖擊和影響

    LLM 對軟件研發的單點提效,我之前錄制過一段視頻,大家可以直接觀看,里面有詳細的演示,我在這里就不再贅述了。
    的頭像 發表于 07-24 15:39 ?873次閱讀

    適用于各種NLP任務的開源LLM的finetune教程~

    ChatGLM2-6b是清華開源的小尺寸LLM,只需要一塊普通的顯卡(32G較穩妥)即可推理和微調,是目前社區非?;钴S的一個開源LLM。
    的頭像 發表于 07-24 09:04 ?1468次閱讀
    適用于各種NLP任務的開源<b class='flag-5'>LLM</b>的finetune教程~
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>