<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

ChatGPT實現原理

汽車電子技術 ? 來源:綜合整理 ? 作者:綜合整理 ? 2023-02-13 17:32 ? 次閱讀

ChatGPT實現原理

用自然語言與計算機進行通信,ChatGPT實現了,那么ChatGPT實現原理是什么?

ChatGPT(Generative Pre-train Transformer)是由OpenAI發明的一種自然語言處理技術。它是一種預訓練的深度學習模型,可以用來生成文本,識別語義,做文本分類等任務。

ChatGPT實現原理

火爆的ChatGPT,得益于AIGC 背后的關鍵技術NLP(Natural LanguageProcessing,自然語言處理)得到突破。自然語言處理應用在過去十年呈爆炸式增長,NLP技術是一種自然語言處理技術,用于計算機中模擬人類的對話和文本理解。主要源于AI大模型化的NLP技術突破是將深度學習技術與傳統的NLP方法結合在一起,從而更好地提高NLP技術的準確性和效率。大模型化的NLP技術能夠更好地支持企業進行大規模的語料內容分析,并為企業更好地進行文本分析提供幫助。

NLP類模型要理解單詞的含義,還要理解如何造句和給出上下文有意義的回答,甚至使用合適的俚語和專業詞匯。

我們看到ChatGPT的回答是這樣的:

pYYBAGPqA6aAWexfAABOwAN7JNs369.png

ChatGPT的原理是基于自回歸語言模型(Auto-Regressive Language Model),它是一種基于深度學習的自然語言處理技術,可以用來生成自然語言文本。它使用一種叫做Transformer的模型,它可以訓練一個模型來預測下一個詞,從而生成文本。

人類反饋強化學習

同時OpenAI采用了 RLHF(Reinforcement Learning from Human Feedbac,人類反饋強化學習) 技術對 ChatGPT 進行了訓練,而加入了更多人工監督進行微調。所以我們可以看到,一些錯誤的信息會逐步被更正。而且在很多用戶的測試中可以發現,若用戶指出其錯誤,模型會聽取意見并優化答案。

InstructGPT/GPT3.5(ChatGPT的前身)與GPT-3的主要區別在于,新加入了被稱為RLHF(Reinforcement Learning from Human Feedback,人類反饋強化學習)。

InstructGPT的目標就是緩解這種生成回復與真實回復之間的偏置產生更加符合人類預期的回復。

chatGPT是一種基于轉移學習的大型語言模型,它使用GPT-2 (Generative PretrainedTransformer2)模型的技術,使用了transformer的架構,并進行了進一步的訓練和優化。

chatGPT是在GPT-2模型的基礎上進一步訓練和優化而得到的。 它使用了更多的語料庫,并且進行了專門的訓練來提高在對話系統中的表現。這使得chatGPT能夠在對話中白然地回應用戶的輸入,并且能夠生成流暢、連貫、通順的文本。

那么接下來我們來看下什么是InstructGPT。從字面上來看,顧名思義,它就是指令式的GPT,“which is trained to follow an instruction in a prompt and provide a detailed response”。接下來我們來看下InstructGPT論文中的主要原理:

pYYBAGPknAmAfqGdAAFfaj7uGl0745.png

InstructGPT整體訓練流程

從該圖可以看出,InstructGPT是基于GPT-3模型訓練出來的,具體步驟如下:

步驟1.)從GPT-3的輸入語句數據集中采樣部分輸入,基于這些輸入,采用人工標注完成希望得到輸出結果與行為,然后利用這些標注數據進行GPT-3有監督的訓練。該模型即作為指令式GPT的冷啟動模型。

步驟2.)在采樣的輸入語句中,進行前向推理獲得多個模型輸出結果,通過人工標注進行這些輸出結果的排序打標。最終這些標注數據用來訓練reward反饋模型。

步驟3.)采樣新的輸入語句,policy策略網絡生成輸出結果,然后通過reward反饋模型計算反饋,該反饋回過頭來作用于policy策略網絡。以此反復,這里就是標準的reinforcement learning強化學習的訓練框架了。

所以總結起來ChatGPT(對話GPT)其實就是InstructGPT(指令式GPT)的同源模型,然后指令式GPT就是基于GPT-3,先通過人工標注方式訓練出強化學習的冷啟動模型與reward反饋模型,最后通過強化學習的方式學習出對話友好型的ChatGPT模型。

InstructGPT的訓練實際上是分為三個階段的,第一階段就是我們上文所述,利用人工標注的數據微調GPT3;第二階段,需要訓練一個評價模型即Reward Model,該模型需學習人類對于模型回復的評價方式,對于給定的上文與生成回復給出分數;第三階段,利用訓練好的Reward Model作為反饋信號,去指導GPT進一步進行微調,將目標設定為Reward分數最大化,從而使模型產生更加符合人類偏好的回復。

自然語言理解的不同發展階段

在20世紀60年代,隨著計算機技術的發展,自然語言處理技術也進一步提升。當時,美國國家科學基金會(NSF)成立了“自然語言處理研究計劃”,專門用于支持自然語言處理技術的研究。同時,英國也成立了“自然語言處理研究室(Natural Language Processing Research Laboratory)”,專門致力于自然語言處理技術的研究與應用。

在20世紀70年代,自然語言處理技術又迎來了一個新的發展階段。這一時期,自然語言處理技術發展到了語言學理論與計算機科學相結合的階段。其中,語義學和句法學等語言學理論成為自然語言處理技術研究的重要基礎。

在20世紀80年代,隨著人工智能技術的進一步發展,自然語言處理技術也進入了一個新的階段。這一時期,自然語言處理技術得到了廣泛應用,并取得了一系列突破性成果。例如,英國語言工程研究所(LEL)在1983年成功開發出了世界上第一個基于人工智能的翻譯系統,該系統能夠將英語翻譯成法語。

在20世紀90年代,自然語言處理技術進一步發展壯大。隨著互聯網的普及,自然語言處理技術在搜索引擎、社交媒體、客服機器人等領域得到廣泛應用。此外,自然語言處理技術還進入了深度學習階段,開始使用深度神經網絡進行語言模型的建立和訓練,從而提升自然語言處理技術的準確性和效率。如今,自然語言處理技術已經成為人工智能領域的重要組成部分,并在多個領域得到廣泛應用。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    27019

    瀏覽量

    264754
  • 深度學習
    +關注

    關注

    73

    文章

    5257

    瀏覽量

    120058
  • 自然語言處理

    關注

    1

    文章

    511

    瀏覽量

    13233
  • OpenAI
    +關注

    關注

    9

    文章

    877

    瀏覽量

    6013
  • ChatGPT
    +關注

    關注

    28

    文章

    1480

    瀏覽量

    5448
收藏 人收藏

    評論

    相關推薦

    GPT生成控制代碼,四足機器人終于迎來智能交互

    電子發燒友網報道(文/周凱揚)早在GPT應用爆火后不久,機器人市場就看中了這個當下的香餑餑,考慮著如何將其集成到機器人應用中。半年過去,幾個應用方向已經確立,比如用ChatGPT實現人機對話,或是
    的頭像 發表于 07-20 01:13 ?1507次閱讀

    【國產FPGA+OMAPL138開發板體驗】(原創)6.FPGA連接ChatGPT 4

    ?!保‵PGA禮貌地表示感謝,并掛斷電話) 接下來我將開始一步一步實現。編寫一個用FPGA訪問ChatGPT4的程序代碼是一個復雜的過程,涉及到硬件描述語言(如VHDL或Verilog)的編程、網絡通信
    發表于 02-14 21:58

    在FPGA設計中是否可以應用ChatGPT生成想要的程序呢

    當下AI人工智能崛起,很多開發領域都可看到ChatGPT的身影,FPGA設計中,是否也可以用ChatGPT輔助設計呢?
    發表于 03-28 23:41

    OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來了

    和情緒的選項 實時視頻捕捉,在與ChatGPT 交互時無需發送照片 有能力在會議和視頻通話中提供協助 發布會為其潛在影響提供了清晰的愿景。隨著企業駕馭不斷變化的技術領域,擁抱ChatGPT-4o對于實現持續增長和創新至關重要。
    發表于 05-27 15:43

    chatGPT幫我寫硬件代碼,是懂行的,好助手!#chatgpt #物聯網開發 #python開發板

    ChatGPT
    蘇州煜瑛微電子科技有限公司
    發布于 :2023年02月17日 15:27:42

    ChatGPT對話語音識別

    ChatGPT
    YS YYDS
    發布于 :2023年05月30日 22:13:10

    科技大廠競逐AIGC,中國的ChatGPT在哪?

    。 圖源:OpenAI官網 中國AI水平與ChatGPT有多大的差距?中國如何訓練出這樣的GPT大模型?難點又在哪里? ChatGPT是AIGC的一種實現。在AIGC的大模型建設和應用層面,國內
    發表于 03-03 14:28

    如何讓ChatGPT實現MIMO波束賦形

    不一定。很多它并不了解的知識,ChatGPT會拼湊出看似合理的答案,對初學者要引起充分的警惕。比如我問它某個西北菜怎么烹飪,它回答的頭頭是道、步驟清晰、邏輯性好,但做的方法并不對
    的頭像 發表于 02-03 16:41 ?692次閱讀

    ChatGPT了的七個開源項目

    就推出了很多。估計,現在還有不少同學苦于不知道該如何體驗chatGPT。   chatGPT火了,圍繞chatGPT盡心二次擴展的開源項目最近也涌現出很多,今天就來給大家介紹幾個最近發現的不錯的開源項目!   這是一
    發表于 02-15 09:26 ?3次下載
    <b class='flag-5'>ChatGPT</b>了的七個開源項目

    如何讓ChatGPT實現MIMO波束賦形和寫一封會議邀請信?

    ChatGPT的對話過程中,必須寫出便于理解、消除歧義的Prompts(提示,即你的指令或問題),它才可以理解你的意思,做出正確的應答。下面我們用兩個例子,向大家展示好的Prompts會讓它變得有多強。
    的頭像 發表于 02-22 09:59 ?479次閱讀

    微軟發布Visual ChatGPT:視覺模型加持ChatGPT實現絲滑聊天

    系統原則的提示符,“Visual ChatGPT是一個可以處理廣泛語言和視覺任務的助手,xxxxxx”。在這個prompt的部分,以下內容被強調:Visual ChatGPT的角色,可以訪問且需要
    的頭像 發表于 03-16 10:35 ?1173次閱讀

    基于ChatGPT實現微信機器人

    掃碼登錄過后,就能像開頭文中截圖那樣跟機器人聊天啦。不過你要注意,我們的賬戶里只有5美元體驗金,而這個API 的調用是要消耗金錢的,所以大家用來自己玩玩,體驗體驗就好,不然一會兒把體驗金耗完就沒得玩了。Wechatbot 的項目地址在這里https://github.com/qingconglaixueit/wechatbot,感興趣的也可以去研究研究。
    的頭像 發表于 03-30 10:34 ?2261次閱讀

    人工智能技術的風險與應對措施

    進入智能化、信息化時代,以人工智能技術為基礎的新一代信息科技不斷向認知智能階段邁進,特別是2022年11月美國人工智能Open AI公司研究發布的聊天機器人程序ChatGPT,實現了人工智能從感知
    發表于 08-04 11:34 ?935次閱讀

    人工智能技術的風險與應對措施

    進入智能化、信息化時代,以人工智能技術為基礎的新一代信息科技不斷向認知智能階段邁進,特別是2022年11月美國人工智能OpenAI公司研究發布的聊天機器人程序ChatGPT,實現了人工智能從感知理解
    的頭像 發表于 08-06 08:09 ?1564次閱讀
    人工智能技術的風險與應對措施

    ChatGPT是怎么實現

    ChatGPT 能夠自動生成類似于人類寫作的文本,這一點非常引人注目,也令人意外。但它是如何實現的?為什么它能夠如此出色地生成我們認為有意義的文本?我的目的是在這里概述ChatGPT內部的運行
    的頭像 發表于 10-16 11:31 ?611次閱讀
    <b class='flag-5'>ChatGPT</b>是怎么<b class='flag-5'>實現</b>的
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>