<acronym id="s8ci2"><small id="s8ci2"></small></acronym>
<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
<acronym id="s8ci2"></acronym>
<acronym id="s8ci2"><center id="s8ci2"></center></acronym>
0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

中國研究人員提出StructGPT,提高LLM對結構化數據的零樣本推理能力

Qxwdz168 ? 來源:計算機視覺芯片設計 ? 2023-05-24 16:02 ? 次閱讀

大型語言模型 (LLM) 最近在自然語言處理 (NLP) 方面取得了重大進展?,F有研究表明,LLM) 具有很強的零樣本和少樣本能力,可以借助專門創建的提示完成各種任務,而無需針對特定任務進行微調。盡管它們很有效,但根據目前的研究,LLM 可能會產生與事實知識不符的不真實信息,并且無法掌握特定領域或實時的專業知識。這些問題可以通過在LLM中添加外部知識源來修復錯誤的生成來直接解決。

4fed7bc6-fa05-11ed-90ce-dac502259ad0.jpg

結構化數據,如數據庫和知識圖譜,已被常規用于在各種資源中攜帶 LLM 所需的知識。但是,由于結構化數據使用 LLM 在預訓練期間未接觸過的獨特數據格式或模式,因此他們可能需要幫助才能理解它們。與純文本相反,結構化數據以一致的方式排列并遵循特定的數據模型。數據表按行排列為列索引記錄,而知識圖 (KG) 經常組織為描述頭尾實體之間關系的事實三元組。

盡管結構化數據的體量往往非常巨大,但不可能容納輸入提示中的所有數據記錄(例如,ChatGPT 的最大上下文長度為 4096)。將結構化數據線性化為 LLM 可以輕松掌握的語句是解決此問題的簡單方法。工具操作技術激勵他們增強 LLM 解決上述困難的能力。他們策略背后的基本思想是使用專門的接口來更改結構化數據記錄(例如,通過提取表的列)。在這些接口的幫助下,他們可以更精確地定位完成特定活動所需的證據,并成功地限制數據記錄的搜索范圍。

來自中國人民大學、北京市大數據管理與分析方法重點實驗室和中國電子科技大學的研究人員在這項研究中著重于為某些任務設計合適的接口,并將它們用于 LLM 的推理,這些接口是應用界面增強方法需要解決的兩個主要問題。以這種方式,LLM 可以根據從界面收集的證據做出決定。為此,他們在本研究中提供了一種稱為 StructGPT 的迭代閱讀然后推理 (IRR) 方法,用于解決基于結構化數據的任務。他們的方法考慮了完成各種活動的兩個關鍵職責:收集相關數據(閱讀)和假設正確的反應或為下一步行動制定策略(推理)。

據他們所知,這是第一項著眼于如何使用單一范式幫助 LLM 對各種形式的結構化數據(例如表、KG 和 DB)進行推理的研究。從根本上說,他們將 LLM 的閱讀和推理兩個過程分開:他們使用結構化數據接口來完成精確、有效的數據訪問和過濾,并依靠他們的推理能力來確定下一步的行動或查詢的答案。

對于外部接口,他們特別建議調用線性化生成過程,以幫助 LLM 理解結構化數據并做出決策。通過使用提供的接口重復此過程,他們可能會逐漸接近對查詢的期望響應。

他們對各種任務(例如基于知識圖譜的問答、基于表的問答和基于數據庫的文本到 SQL)進行了全面試驗,以評估其技術的有效性。八個數據集的實驗結果表明,他們建議的方法可能會顯著提高 ChatGPT 在結構化數據上的推理性能,甚至達到與全數據監督調優方法競爭的水平。

? KGQA。他們的方法使 KGQA 挑戰的 WebQSP 上的 Hits@1 增加了 11.4%。借助他們的方法,ChatGPT 在多跳 KGQA 數據集(例如 MetaQA-2hop 和 MetaQA-3hop)中的性能可能分別提高了 62.9% 和 37.0%。

? 質量保證表。在 TableQA 挑戰中,與直接使用 ChatGPT 相比,他們的方法在 WTQ 和 WikiSQL 中將標注準確度提高了大約 3% 到 5%。在 TabFact 中,他們的方法將表格事實驗證的準確性提高了 4.2%。

? 文本到SQL。在 Text-to-SQL 挑戰中,與直接使用 ChatGPT 相比,他們的方法將三個數據集的執行準確性提高了約 4%。

作者已經發布了 Spider 和 TabFact 的代碼,可以幫助理解 StructGPT 的框架,整個代碼庫尚未發布。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據管理
    +關注

    關注

    1

    文章

    265

    瀏覽量

    19480
  • 自然語言處理

    關注

    1

    文章

    510

    瀏覽量

    13211
  • 知識圖譜
    +關注

    關注

    2

    文章

    131

    瀏覽量

    7619
  • LLM
    LLM
    +關注

    關注

    0

    文章

    215

    瀏覽量

    243

原文標題:中國研究人員提出StructGPT,提高LLM對結構化數據的零樣本推理能力

文章出處:【微信號:計算機視覺芯片設計,微信公眾號:計算機視覺芯片設計】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    對比解碼在LLM上的應用

    為了改進LLM推理能力,University of California聯合Meta AI實驗室提出將Contrastive Decoding應用于多種任務的
    發表于 09-21 11:37 ?411次閱讀
    對比解碼在<b class='flag-5'>LLM</b>上的應用

    新技術在生物樣本冷凍中的應用案例分析

    推動生物學研究進展   新技術的應用為生物學研究提供了更加高效和可靠的樣本冷凍處理方法,推動了相關領域的研究進展。冷凍顯微鏡技術的發展使得研究人員
    發表于 12-26 13:30

    結構化布線系統有哪些難題

    在15年建筑物整修周期內限制系統的升級。經過精心設計的結構化布線系統可以承受超過大多數局域網傳輸速率10~15倍的數據流量。這將允許在不改變結構化布線系統的情況下使用新型網絡技術?! ?.通用
    發表于 05-19 13:46

    MaxCompute(ODPS)上處理非結構化數據的Best Practice

    、MaxCompute到OSS的非結構化數據輸出(及圖像處理實例):介紹了非結構化輸出功能,并通過圖像處理等范例,說明怎樣通過MaxCompute的計算能力,打通整個OSS -> Ma
    發表于 05-15 12:21

    泰克儀器助力研究人員首次通過太赫茲復用器實現超高速數據傳輸

    通過使用基于光子的THz電路來橋接光纖和無線電的世界,以實現超高數據速率。但是,不管要實現什么的系統,信號復用和解復用系統(復用器/解復用器)都是基本要求。研究人員使用兩個平行的金屬板的波導系統,把
    發表于 08-31 15:58

    TrustZone結構化消息是什么?

    大家好,我已閱讀任何與TrustZone相關的內容,但我無法弄清楚這兩個世界是如何相互溝通的。我所能找到的只是TrustZone API規范中的內容:客戶端和服務可以通過兩種機制進行通信:結構化
    發表于 03-20 08:58

    Deeplearningai結構化機器學習項目

    Deeplearningai 結構化機器學習項目 Week2 6-10
    發表于 05-18 15:12

    結構化設計分為哪幾部分?結構化設計的要求有哪些

    結構化設計分為哪幾部分?結構化設計的要求有哪些?結構化設計主要包括哪些部分?
    發表于 12-23 06:15

    白光LED結構化涂層制備及其應用研究

      實驗名稱:基于電場誘導的白光LED結構化涂層制備及其應用研究  研究方向:電場誘導結構制備工藝試驗研究  實驗內容:  本文主要圍繞:平
    發表于 03-29 15:44

    一種結構化道路環境中的視覺導航系統詳解

    根據結構化道路環境的特點提出了一種將邊沿檢測和道路環境知識相結合的機器視覺算法 , 并結合基于行為響應的路徑規劃方法和智能預瞄控制方法 , 實現了一套基本的機器人視覺導航系統 . 在自主機器人實驗
    發表于 09-25 07:23

    LabVIEW進行癌癥預測模型研究

    病例和癌癥相關死亡人數有所增加。其中,乳腺癌是女性中最常見的癌癥類型。 研究采用ML技術對乳腺癌進行預測,比較了當前方法和提出的方法。 使用診斷乳腺癌數據集包含699個
    發表于 12-13 19:04

    研究人員提出了一種柔性可拉伸擴展的多功能集成傳感器陣列

    研究人員提出了一種柔性可拉伸擴展的多功能集成傳感器陣列,成功將電子皮膚的探測能力擴展到7種,實現溫度、濕度、紫外光、磁、應變、壓力和接近等多種外界刺激的實時同步監測。
    的頭像 發表于 01-24 15:15 ?6961次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>提出</b>了一種柔性可拉伸擴展的多功能集成傳感器陣列

    Facebook的研究人員提出了Mesh R-CNN模型

    這一研究的目標是通過單張圖像輸入,對圖像中的物體進行檢測、獲取不同物體的類別、掩膜和對應的三維網格,并對真實世界中的復雜模型進行有效處理。在2D深度網絡的基礎上,研究人員改進并提出了新的架構。
    的頭像 發表于 08-02 15:51 ?3657次閱讀
    Facebook的<b class='flag-5'>研究人員</b><b class='flag-5'>提出</b>了Mesh R-CNN模型

    Facebook向研究人員發布友誼數據

    Facebook在一篇博文中表示,卡耐基梅隆大學的研究人員“不會與Facebook分享個人調查反饋,Facebook也不會與研究人員分享關于你是誰的信息?!痹摴具€表示,將通過其疾病預防地圖計劃(Disease Prevention Maps program),為流行病學
    的頭像 發表于 04-22 10:58 ?3181次閱讀

    基準數據集(CORR2CAUSE)如何測試大語言模型(LLM)的純因果推理能力

    ? 因果推理是人類智力的標志之一。因果關系NLP領域近年來引起了人們的極大興趣,但其主要依賴于從常識知識中發現因果關系。本研究提出了一個基準數據集(CORR2CAUSE)來測試大語言模
    的頭像 發表于 06-20 15:39 ?1406次閱讀
    基準<b class='flag-5'>數據</b>集(CORR2CAUSE)如何測試大語言模型(<b class='flag-5'>LLM</b>)的純因果<b class='flag-5'>推理</b><b class='flag-5'>能力</b>
    亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看
    <acronym id="s8ci2"><small id="s8ci2"></small></acronym>
    <rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>
    <acronym id="s8ci2"></acronym>
    <acronym id="s8ci2"><center id="s8ci2"></center></acronym>