<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

ChatGPT的潛力和局限

今天為大家分享一篇研究，當ChatGPT穿越到口袋妖怪世界，是否會理解并應用這個虛構世界的知識呢？

熟悉口袋妖怪的朋友們一定知道，這些可愛的生物們有著各種不同的屬性、類別和技能。它們生活的世界也是一個完整的環境：你可以收集口袋妖怪、培養它們的實力，然后讓它們在戰斗中一展身手。每一個系統都有詳細的、明確的規定。

而現在，我們把這個酷炫的口袋妖怪世界作為評估ChatGPT知識和推理能力的環境！我們可以檢查ChatGPT對口袋妖怪世界的了解程度，并向它輸入新的知識，讓它在妖怪們的戰斗中進行推理，預測戰斗結果。

通過在口袋妖怪世界的實驗，我們能更好地評估ChatGPT的潛力和局限，看看它是否能夠學習新知識，基于特定情境的特征組合進行推理，從而做出更準確的判斷。

為了評估ChatGPT，作者引入了一個分階段的對話框架（如下圖），包括三個明確定義的階段：

階段1：Audit knowledge

首先，ChatGPT具有口袋妖怪世界的背景知識嗎？

作者通過詢問一般性問題，如有關口袋妖怪類型和物種的描述，來審核ChatGPT對口袋妖怪世界的先驗知識。這些檢索到的知識被存儲在local memory中，作為對話的上下文，以便在接下來的步驟中構建合理的場景。同時，這些知識還可以提高后續模型的回應準確性，減少虛構情況的發生。

在階段一，作者從一些初步的一般性問題開始。這個階段對于隨后創建有效的溝通至關重要。我們區分global memory和local memory。前者是在訓練期間獲得的，包括ChatGPT的先驗知識。local memory僅限于我們之前的相互作用，并作為后驗相互作用的參考點。ChatGPT對口袋妖怪類型等問題上有很強的抵抗能力。但在Q1.4中的對抗提問中失敗了。

下面是一個例子：注意ChatGPT的答案用顏色標記，如果提供準確的知識，則用綠色，如果提供虛假陳述(幻覺)，則用紅色，如果陳述模糊或不相關，則用黃色。

階段2：Use of knowledge in context

作者呈現了特定的戰斗場景，其中口袋妖怪們的類型、等級、招式和狀態相互作用并導致特定的結果。ChatGPT將用于預測戰斗的結果，并逐步解釋其推理過程。這個階段將評估模型是否能夠基于特定情境（上下文）組合特征（組合性），從而確定戰斗結果。

在階段二，作者呈現了口袋妖怪的簡單戰斗場景，并逐漸增加復雜性(不同級別、天氣和狀態條件)，并要求ChatGPT預測戰斗的結果并解釋其推理。這一階段將幫助我們理解模型是否可以基于決定其結果的特定場景(上下文)組合特征(組合性)。

結果發現，大多數回答都是準確的。ChatGPT了解口袋妖怪的類型、移動(攻擊)和等級如何影響戰斗匹配。ChatGPT能夠預測，也可以全面地解釋其推理。但是，不同類型的問題上，ChatGPT的準確性差異較大。

作者總共測試了24場戰斗：6場涉及不同類型(準確率為83.3%)，6場涉及不同級別(100%)，7場涉及4種天氣條件(85.7%)，6場涉及4種狀態效果(100%)。

作者介紹了具有正式規格（名稱、外觀、類型、招式）的新妖怪。然后，要求ChatGPT驗證對這些新概念的掌握，并將其與其先前知識進行比較。注意，ChatGPT將新引入的知識存儲在local memory中，但它將無法長時間引用它。

下面是一個測試例子：注意ChatGPT的答案用顏色標記，如果提供準確的知識，則用綠色，如果提供虛假陳述(幻覺)，則用紅色，如果陳述模糊或不相關，則用黃色。

盡管在問題4.1中出現了部分幻覺，ChatGPT給出了相當好的類比。作者進一步評估新知識在語境中的整合，測試了新的與已知的口袋妖怪的戰斗。結果表明，ChatGPT能夠重用先驗和新引入的知識來預測結果，即使涉及的兩個口袋妖怪都是新引入的。在這種情況下，模型給出了可靠的預測。

通過與ChatGPT在對話框架下的互動，可以得出以下結論：首先，模型所呈現的事實的準確性取決于之前討論的內容；其次，對抗性攻擊可能是成功的，但并不總是成功的，但一般來說，對話預處理(知識檢索)和協作反饋可以糾正先前模型的錯誤。
責任編輯：彭菁

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

存儲

存儲

+關注

關注
12

文章
3881

瀏覽量
84764
模型

模型

+關注

關注
1

文章
2750

瀏覽量
47809
ChatGPT

ChatGPT

+關注

關注
27

文章
1456

瀏覽量
5206

原文標題：在口袋妖怪世界中理解ChatGPT的思維

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

評論

相關推薦

寫小說、編寫程序！強大的ChatGPT也有它的局限性！

電子發燒友網報道（文/李彎彎）日前，由OpenAI訓練的大規模語言模型 ChatGPT 上線。ChatGPT背后的算法基于Transformer架構，這是一種使用自注意力機制處理輸入數據的深度

的頭像

發表于 12-08 00:59 ?4733次閱讀

【國產FPGA+OMAPL138開發板體驗】（原創）6.FPGA連接ChatGPT 4

OMAP-L138（定點/浮點DSP C674x+ARM9）+ FPGA處理器的開發板。編寫一個用于FPGA訪問ChatGPT 4的程序代碼是一個相當復雜的任務，涉及到硬件設計、網絡通信、數據處理等多個

發表于 02-14 21:58

在FPGA設計中是否可以應用ChatGPT生成想要的程序呢

當下AI人工智能崛起，很多開發領域都可看到ChatGPT的身影，FPGA設計中，是否也可以用ChatGPT輔助設計呢？

發表于 03-28 23:41

讓chatGPT幫我寫硬件代碼，是懂行的，好助手！#chatgpt #物聯網開發 #python開發板

ChatGPT

蘇州煜瑛微電子科技有限公司

發布于 :2023年02月17日 15:27:42

ChatGPT對話語音識別

ChatGPT

YS YYDS

發布于 :2023年05月30日 22:13:10

FreeRTOS使用筆記和局部注釋翻譯

FreeRTOS使用筆記和局部注釋翻譯

發表于 09-18 08:02

柵漏電流噪聲有哪幾種模型？這幾種模型具有什么特性和局限性？

柵漏電流噪聲特性是什么？柵漏電流噪聲有哪幾種模型？這幾種模型具有什么特性和局限性？

發表于 04-14 06:53

科技大廠競逐AIGC，中國的ChatGPT在哪？

最近，AI（人工智能）圈一股以“ChatGPT”為核心的熱潮從美國“硅谷”涌入中國。 2022年11月底，初創公司OpenAI發布了名為ChatGPT的對話式聊天機器人模型，一經推出，便在網絡上

發表于 03-03 14:28

不到1分鐘開發一個GPT應用！各路大神瘋狂整活，網友：ChatGPT就是新iPhone

人類。總之，雖然ChatGPT等語言模型的應用在一定程度上改變了我們的生活和學習方式，但它們并不能完全替代人類進行創造性思考和創造性活動。我們不能將它們簡單地視為新iPhone之類的產品，而是應該理性看待它們的應用價值和技術局限性。

發表于 11-19 12:06

基于微控制器的LED驅動器拓撲、權衡和局限

本文主要探討基于微控制器的LED驅動器。它考察了以微控制器作為系統核心所能采用的各種不同拓撲結構。它還詳細討論了各種拓撲的權衡，著重于它們的主要特性和局限：通訊、電壓

發表于 10-26 14:17 ?752次閱讀

基于微控制器的LED驅動器拓撲、權衡<b class='flag-5'>和局限</b>

寫小說、編寫程序！強大的ChatGPT也有它的局限性！

電子發燒友網報道（文/李彎彎）日前，由OpenAI訓練的大規模語言模型 ChatGPT 上線。ChatGPT背后的算法基于Transformer架構，這是一種使用自注意力機制處理輸入數據的深度

的頭像

發表于 12-08 07:10 ?2678次閱讀

ChatGPT在多域作戰中的應用潛力

快速準確的威脅評估：在高風險情況下，基于ChatGPT的AI可以分析來自多個來源的大量數據，以提供快速準確的威脅評估，幫助軍事領導人快速做出規避風險的決策。

的頭像

發表于 02-11 11:03 ?2635次閱讀

ChatGPT在自然語言處理中的局限性和挑戰

，ChatGPT在自然語言處理中仍然存在著一些局限性和挑戰。本文將探討ChatGPT在自然語言處理中的局限性和挑戰，并分析其背后的原因。

的頭像

發表于 04-18 16:25 ?1030次閱讀

ChatGPT眼中的電子亮燈揀貨系統

在ChatGPT中輸入電子亮燈揀貨系統或智能物料揀貨系統，會發現ChatGPT對電子亮燈揀貨系統WMS的評價非常高，認為智能物料揀貨系統具有非常大的市場潛力。

的頭像

發表于 06-01 11:30 ?541次閱讀

<b class='flag-5'>ChatGPT</b>眼中的電子亮燈揀貨系統

碳化硅二極管的優點和局限性分析

碳化硅二極管的優點和局限性分析碳化硅（SiC）二極管是一種新型半導體材料，在高頻電源電子裝置中得到了廣泛應用。與傳統的硅（Si）材料相比，碳化硅二極管具有許多優點和局限性。下面是對碳化硅二極管

的頭像

發表于 12-21 11:31 ?661次閱讀

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看

<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>