電子發(fā)燒友App

硬聲App

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

登錄后你可以

下載海量資料
學(xué)習在線(xiàn)課程
觀(guān)看技術(shù)視頻
寫(xiě)文章/發(fā)帖/加入社區

創(chuàng )作中心

發(fā)布

創(chuàng )作活動(dòng)

完善資料讓更多小伙伴認識你，還能領(lǐng)取20積分哦，立即完善>

3天內不再提示

電子發(fā)燒友網(wǎng)>人工智能>基于歸結反演的大語(yǔ)言模型邏輯推斷系統

基于歸結反演的大語(yǔ)言模型邏輯推斷系統

論文名稱(chēng)：Towards Generalizable and Faithful Logic Reasoning over Natural Language via Resolution Refutation

論文作者：孫洲浩，丁效*，杜理，蔡碧波，高靖龍，劉挺，秦兵 ?

1 引言

基于自然語(yǔ)言的邏輯推理任務(wù)需要模型理解自然語(yǔ)言聲明（statements）之間的抽象邏輯關(guān)系并推理出假設的真值（標簽）。這類(lèi)任務(wù)正在越來(lái)越受到關(guān)注，因為它將自然語(yǔ)言與抽象邏輯思維聯(lián)系起來(lái)，抽象邏輯思維在解決復雜問(wèn)題和認知推理中發(fā)揮著(zhù)關(guān)鍵作用。然而，這類(lèi)任務(wù)對于LLM來(lái)說(shuō)仍然較為困難，這是因為L(cháng)LM存在幻覺(jué)問(wèn)題，其在推理過(guò)程中可能會(huì )產(chǎn)生不正確的中間推理步驟，從而最終導致錯誤的推理結果，因此是不可靠的。同時(shí)，如果將LLM看作一個(gè)推理系統，那么幻覺(jué)會(huì )影響這個(gè)系統的完備性。如果一個(gè)推理系統是完備的，那么我們可以通過(guò)應用推理系統中包含的合法推理規則來(lái)推理出具有確定標簽（True和False）的所有假設。然而，幻覺(jué)會(huì )阻止LLM通過(guò)運用合法的推理規則得出結論，從而導致推理系統不完備。

為了減少幻覺(jué)從而提升忠實(shí)性，前人提出了分步推理方法，這些分步推理方法是基于前向鏈或后向鏈進(jìn)行設計的?；谇跋蜴湹姆椒◤囊阎巹t開(kāi)始，檢查是否存在某一個(gè)規則其所有的前提條件都被給定的事實(shí)所滿(mǎn)足，如果存在，則應用前向鏈的推理規則來(lái)推導出新的結論，這個(gè)過(guò)程一直持續直到不能得出新的結論或假設已經(jīng)被證明?；诤笙蜴湹姆椒◤募僭O開(kāi)始以相反的方向進(jìn)行推理，從而得出一組需要滿(mǎn)足的事實(shí)，然后檢查這些事實(shí)是否已經(jīng)被已知事實(shí)所滿(mǎn)足。通過(guò)引入了中間推理步驟，基于LLM的推理系統的忠實(shí)性得到了提升。

然而這些基于前向鏈或后向鏈的分步推理方法在復雜的邏輯推理場(chǎng)景下依然不盡如人意。在某些場(chǎng)景下，這些方法的性能可能會(huì )低于單獨使用LLMs，甚至低于隨機猜測（random guess）。這是因為基于前向鏈或后向鏈的分步推理方法是不完備的。這意味著(zhù)一些具有確定標簽的假設被模型會(huì )被認為是Unknown。因此，它只能適應于相對簡(jiǎn)單的推理場(chǎng)景。以前向鏈為例，前向鏈是不完備的因為它當且僅當“某個(gè)規則的所有條件都可以被已知事實(shí)證明是真的”（條件1）時(shí)才能夠推理。然而，在推理過(guò)程中也存在一些特殊情況，前向鏈無(wú)法推理。對于圖1中的假設1，前向鏈無(wú)法推理出假設是正確的（True），因為規則中包含的“kind people”這一條件無(wú)法被已知事實(shí)證明是真的。因此，我們無(wú)法得出任何推論，假設1將被視為Unknown。類(lèi)似地，對于后向鏈，假設1“not kind”沒(méi)有出現在規則的右側因此也無(wú)法進(jìn)行推理，該假設也將被視為Unknown。

圖1：基于自然語(yǔ)言的邏輯推理問(wèn)題樣例

受邏輯符號領(lǐng)域的邏輯推理方法的啟發(fā)，我們引入了一個(gè)在一階邏輯下完備的邏輯推理范式歸結反演（其推理過(guò)程不會(huì )受到條件1的約束）來(lái)提高完備性，并提出一個(gè)新的推理框架GFaiR。圖2展示了歸結反演的推理過(guò)程。對于圖1中的問(wèn)題，通過(guò)利用歸結的推理規則，GFaiR可以在自然語(yǔ)言水平上進(jìn)行歸結，從已知信息中逐步推導出“Everyone is not kind”。然后通過(guò)反演，“Bob is kind”出現在了已知信息中，進(jìn)而我們能夠推導出一個(gè)矛盾（Everyone is?not kind 與?Bob is kind兩者互相矛盾），從而證明假設1是真的。因此，歸結反演的結合使LLM能夠處理更復雜的邏輯推理場(chǎng)景，從而增強了泛化能力。

圖2：圖1問(wèn)題樣例的歸結反演推理過(guò)程

實(shí)驗結果表明，我們的方法在復雜的邏輯推理場(chǎng)景下取得了最優(yōu)性能，同時(shí)保持了在簡(jiǎn)單推理場(chǎng)景下的性能。此外，我們觀(guān)察到GFaiR產(chǎn)生的推理過(guò)程更加忠實(shí)。

2 背景

一階邏輯下的自然語(yǔ)言推理: 給定一個(gè)假設H以及一個(gè)包含一系列事實(shí)和規則的自然語(yǔ)言理論，目標是在不利用外部知識和常識知識的條件下僅僅利用給定的自然語(yǔ)言理論來(lái)判斷假設H是正確的（True），錯誤的（False），還是無(wú)法確定的（Unknown）。每條事實(shí)，規則和假設都對應唯一的一階邏輯表示。H的標簽是根據對事實(shí)和規則的一階邏輯表示進(jìn)行推理得到的。一個(gè)簡(jiǎn)單的例子如下圖所示：

歸結反演：在基于邏輯符號的推理場(chǎng)景下，歸結反演是一種在一階邏輯下完備的推理方法，也就是說(shuō)，對于任何一個(gè)在一階邏輯語(yǔ)義下真值為T(mén)rue或者False的假設，應用歸結反演的推理方法我們都能夠推理出假設的真值。假設F為給定前提集對應的一階邏輯公式集合（在基于邏輯符號的推理場(chǎng)景下每一個(gè)前提都是一個(gè)一階邏輯公式），Q為一個(gè)以一階邏輯公式表示的假設且在假設F下Q的真值為T(mén)rue，則證明Q為T(mén)rue的過(guò)程如下所示：

將Q進(jìn)行否定得到?Q，并且將其合并到F中得到{F,?Q}

將{F,?Q}中的每一條進(jìn)行Skolem標準化，從而將其轉換為一個(gè)子句集

應用歸結原理對子句集進(jìn)行歸結，其中每一步都是根據子句集中的兩條子句歸結出一個(gè)新的子句（中間結論），這個(gè)子句會(huì )被合并到子句集中。這個(gè)歸結的過(guò)程是迭代式的，直到歸結出一個(gè)空子句時(shí)停止并說(shuō)明這個(gè)理論集合中存在矛盾，從而進(jìn)一步說(shuō)明Q是正確的。

因此，我們可以首先通過(guò)對Q和?Q進(jìn)行反演從而得到{F,?Q}以及{F,Q}，然后分別對{F,?Q}以及{F,Q}進(jìn)行歸結推理并判斷其中是否存在矛盾來(lái)確定Q的真值。如果{F,?Q}不存在矛盾而{F,Q}存在矛盾，則Q為False，反之Q為T(mén)rue，如果都不存在矛盾，則Q為Unknown。

3 方法

如圖2所示，GFaiR包括5個(gè)模塊：轉換器，前選擇器，后選擇器，知識組裝器，驗證器。

圖2：GFaiR框架圖

3.1 轉換器

在執行推理之前，基于T5的轉換器首先會(huì )將假設轉換為假設的否定用于后續進(jìn)行反演推理。接下來(lái)，轉換器會(huì )將給定的自然語(yǔ)言理論和假設（或假設的否定）轉換成Skolem范式形式對應的自然語(yǔ)言表示用于后續執行歸結推理。為了方便起見(jiàn)，我們將經(jīng)過(guò)轉換器轉換后的自然語(yǔ)言理論和假設（或假設的否定）所組成的整體稱(chēng)為理論集合T，其中的每一條都統一稱(chēng)為理論。

3.2 前選擇器

在每一步推理的過(guò)程中，基于XLNET前選擇器首先根據理論集合T選擇一條理論用于后續執行歸結推理。

3.3 后選擇器

在前選擇器選擇了用于歸結推理的一條理論之后，基于XLNET的后選擇器根據理論集合T以及前選擇器選擇的理論來(lái)選擇另一條用于后續執行歸結推理的理論。我們設計這個(gè)模塊是為了顯式地建模前選擇器選擇的理論與其余理論之間的關(guān)系，并利用這一信息來(lái)指導后選擇器的理論選擇過(guò)程。

3.4 知識組裝器

基于T5的知識組裝器可以從數據中隱式地學(xué)習歸結推理規則，并在自然語(yǔ)言層面對前選擇器和后選擇器選擇的兩條理論應用所學(xué)習的歸結推理規則來(lái)生成新的推論。

3.5 驗證器

由于前人的基于transformers的選擇模塊對于歸結反演來(lái)說(shuō)不夠準確，可能會(huì )導致這兩個(gè)選擇器所選擇的理論不相關(guān)，進(jìn)而導致理論上無(wú)法根據這兩條理論得出一個(gè)符合邏輯的推論（一個(gè)推論是符合邏輯的當且僅當這個(gè)推論可以根據這兩條理論推理出來(lái)）。如果知識組裝器根據這樣的兩條理論進(jìn)行歸結推理，那么其生成的推論一定是不合邏輯的，這會(huì )導致歸結推理的失敗并產(chǎn)生不合邏輯的推論（產(chǎn)生幻覺(jué)）。由于在后續的推理步驟中我們可能會(huì )用到這個(gè)不合邏輯的推論，因此這可能會(huì )最終導致錯誤的推理結果。為此，我們使用基于合法性對比損失的驗證器來(lái)驗證前選擇器和后選擇器選擇的兩個(gè)理論，以確保在理論上可以通過(guò)對這兩條理論執行邏輯推理來(lái)得出符合邏輯的推論，從而為歸結推理提供了保證，并通過(guò)減少幻覺(jué)來(lái)提高模型的忠實(shí)性。

3.6 推理過(guò)程

在推理時(shí)，轉換器首先將給定的自然語(yǔ)言理論和假設（或假設的否定）轉換成兩個(gè)理論集合，其中每條理論的表示都是Skolem范式形式對應的自然語(yǔ)言表示。其中一個(gè)理論集合包括自然語(yǔ)言理論和假設，另一個(gè)包括自然語(yǔ)言理論和假設的否定。接下來(lái)我們對這兩個(gè)理論集合應用圖2中的推理模型（Reasoning model）來(lái)推斷其是否存在矛盾，從而判斷假設的真值。

對于一個(gè)具體的理論集合T，前選擇器首先選擇一條理論，接下來(lái)，在驗證器的指導下，后選擇器選擇一個(gè)能夠與組成一個(gè)合法理論對的理論，如果不存在這樣的理論，則停止并認為T(mén)中不存在矛盾，否則，知識組裝器會(huì )對這兩條理論進(jìn)行自然語(yǔ)言層面的歸結推理并得出一個(gè)新的推論，如果這個(gè)推論是一個(gè)空字符串（對應空子句），則停止并認為這個(gè)理論集合存在矛盾。反之，新生成的推論會(huì )被合并到T中參與接下來(lái)的推理過(guò)程。

4 實(shí)驗

4.1 數據集&評測指標

為了驗證GFaiR，我們采用RuleTaker-3ext-sat數據集進(jìn)行訓練，然后在RuleTaker-3ext-sat，Ruletaker-depth-5，以及更加復雜的Hard RuleTaker數據集上進(jìn)行測試。此外，由于Hard RuleTaker數據集中沒(méi)有標簽為Unknown的數據，我們遵循前人的方法來(lái)采樣標簽為Unknown的數據并將其添加到Hard RuleTaker數據集中以構造一個(gè)標簽平衡的數據集，并將這個(gè)新的數據集稱(chēng)為Hard RuleTaker*。此外，為了比較我們的方法在復雜的邏輯推理場(chǎng)景下的in-domain性能，我們將Hard RuleTaker*數據集按照8.5,0.5,1的比例將其拆分為訓練集，驗證集，測試集。拆分后的數據集我們將其命名為Hard RuleTaker**。

我們的評價(jià)指標包括兩個(gè)方面：（1）Entailment accuracy (EA)：衡量模型預測假設標簽的準確率。（2）Full accuracy (FA): 衡量模型預測假設標簽和推理過(guò)程同時(shí)正確的準確率

4.2 主實(shí)驗

我們將GFaiR與基于預訓練模型的方法以及基于分步推理的方法IBR, FaiRR, NLProofs進(jìn)行對比，主實(shí)驗結果如表1所示：可以看出，我們的方法在簡(jiǎn)單的推理場(chǎng)景下保持了性能，同時(shí)在復雜的推理場(chǎng)景下性能遠遠超過(guò)基于預訓練模型的方法以及基于分步推理的方法，這說(shuō)明通過(guò)結合歸結反演，GFaiR的完備性得到了改善，在復雜推理情境下的zero-shot泛化能力更強。根據EA和FA的差值，我們也可以看出GFaiR產(chǎn)生的推理過(guò)程是忠實(shí)的。雖然NLProofs和FaiRR在Hard RT和Hard RT*數據集上EA和FA之間的差值更小，但是它們的EA較低，在這種情況下單純考慮其忠實(shí)性是沒(méi)有意義的。

表1：主實(shí)驗結果

4.3 推理深度泛化實(shí)驗

我們通過(guò)將不同模型在推理深度小于等于3的RuleTaker-3ext-sat數據集進(jìn)行訓練，然后在推理深度小于等于5的Ruletaker-depth-5數據集上進(jìn)行測試來(lái)評估不同方法在推理深度上的泛化能力，結果如表2所示：可以看出，當推理深度增加時(shí)，GFaiR的性能下降更小，比如當推理深度從3增加到5時(shí)，GFaiR的EA值下降了1.6%，而FaiRR和NLProofs則分別下降了14.4%和24.5%，這說(shuō)明GFaiR對于推理深度的泛化能力更強。

表2：推理深度泛化實(shí)驗

4.4 復雜推理場(chǎng)景下的in-domain實(shí)驗

我們通過(guò)將不同模型在Hard RuleTaker**數據集上進(jìn)行訓練和測試來(lái)評價(jià)不同方法在復雜推理情景下的in-domain性能，實(shí)驗結果如表3所示：可以看出，GFaiR在Hard RuleTaker**數據集上實(shí)現了最佳性能，這說(shuō)明通過(guò)引入歸結反演，GFaiR方法在復雜推理情景下更加有效。

表3：復雜推理場(chǎng)景下的in-domain性能

5 總結

在本文中，通過(guò)引入歸結反演和基于合法性對比損失的驗證器，我們提出了一個(gè)泛化能力強且忠實(shí)的推理方法GFaiR，該方法能夠處理復雜的邏輯推理場(chǎng)景。實(shí)驗結果還表明，在較為復雜的Hard RuleTaker和Hard RuleTaker*數據集上，GFaiR能夠實(shí)現更好的性能。

審核編輯：黃飛

?

閱讀全文

數據集(24356) 數據集(24356)
選擇器(14325) 選擇器(14325)
自然語(yǔ)言(13208) 自然語(yǔ)言(13208)
大模型(1130) 大模型(1130)

評論

查看更多

相關(guān)推薦

如何利用Transformers了解視覺(jué)語(yǔ)言模型

將模型稱(chēng)為 “視覺(jué)語(yǔ)言” 模型是什么意思？一個(gè)結合了視覺(jué)和語(yǔ)言模態(tài)的模型？但這到底是什么意思呢？

2023-03-03 09:49:37

745

大型語(yǔ)言模型的邏輯推理能力探究

最新研究揭示，盡管大語(yǔ)言模型LLMs在語(yǔ)言理解上表現出色，但在邏輯推理方面仍有待提高。為此，研究者們推出了GLoRE，一個(gè)全新的邏輯推理評估基準，包含12個(gè)數據集，覆蓋三大任務(wù)類(lèi)型。

2023-11-23 15:05:16

536

GPT推斷中的批處理（Batching）效應簡(jiǎn)析

機器學(xué)習模型依賴(lài)于批處理（Batching）來(lái)提高推斷吞吐量，尤其是對于 ResNet 和 DenseNet 等較小的計算機視覺(jué)模型。

2023-12-18 15:52:47

380

2023年科技圈熱詞“大語(yǔ)言模型”，與自然語(yǔ)言處理有何關(guān)系

電子發(fā)燒友網(wǎng)報道（文/李彎彎）大語(yǔ)言模型（LLM）是基于海量文本數據訓練的深度學(xué)習模型。它不僅能夠生成自然語(yǔ)言文本，還能夠深入理解文本含義，處理各種自然語(yǔ)言任務(wù)，如文本摘要、問(wèn)答、翻譯

2024-01-02 09:28:33

1397

推斷FP32模型格式的速度比CPU上的FP16模型格式快是為什么？

在 CPU 上推斷出 FP32 模型格式和 FP16 模型格式。 FP32 模型格式的推斷速度比 FP16 模型格式快。無(wú)法確定推斷 FP32 模型格式的原因比 CPU 上的 FP16 模型格式快。

2023-08-15 08:03:04

模型預測控制+邏輯控制

模型預測控制（MPC）+邏輯控制（相平面分區控制）–matlab例程介紹MATLAB-模型模糊神經(jīng)網(wǎng)絡(luò )預測控制demo（訓練數據用）：鏈接：目錄構建思想matlab simulink框圖結果展示模型失配時(shí)框圖及結果擾動(dòng)后框圖及結果s函數代碼注意集成好的文件構建思想代碼原...

2021-08-17 07:09:24

COT控制模型邏輯是怎樣的

COT控制模型邏輯是怎樣的

2021-03-11 06:25:33

GPU上OpenVINO基準測試的推斷模型的默認參數與CPU上的參數不同是為什么？

在 CPU 和 GPU 上推斷出具有 OpenVINO? 基準的相同模型： benchmark_app.exe -m model.xml -d CPU benchmark_app.exe -m

2023-08-15 06:43:46

Verilog HDL語(yǔ)言必須了解的知識有哪些？

VerilogHDL是硬件描述語(yǔ)言的一種，用于數字電子系統設計。它允許設計者用它來(lái)進(jìn)行各種級別的邏輯設計，可以用它進(jìn)行數字邏輯系統的仿真驗證、時(shí)序分析、邏輯綜合。它是目前應用最廣泛的一種硬件描述語(yǔ)言之一。

2019-09-29 08:46:06

pspice 邏輯門(mén)怎么樣修改模型參數？

請問(wèn)大家，pspice的邏輯門(mén)模型，比如說(shuō)與門(mén)7408，該怎樣修改其參數？我想修改7408的延遲時(shí)間，輸出電平等等，怎么弄？關(guān)于右鍵點(diǎn)擊然后edit pspice model的方法，我試過(guò)，只是出來(lái)

2014-06-24 10:09:17

【書(shū)籍評測活動(dòng)NO.31】大語(yǔ)言模型：原理與工程實(shí)踐

整個(gè)領(lǐng)域的持續發(fā)展和創(chuàng )新。本書(shū)特色本書(shū)旨在揭開(kāi)大語(yǔ)言模型的神秘面紗，透徹地解讀其內在機理和應用實(shí)踐。書(shū)中不僅介紹理論知識，更介紹了深入這一技術(shù)領(lǐng)域的具體訓練過(guò)程，目的是為讀者提供一個(gè)全面、深入且系統

2024-03-18 15:49:46

關(guān)于自然語(yǔ)言處理之54 語(yǔ)言模型(自適應)

自然語(yǔ)言處理——54 語(yǔ)言模型(自適應)

2020-04-09 08:20:30

在i.MX93 EVKCM上的EthosU NPU上推斷AI模型時(shí)遇到錯誤怎么解決？

嘗試在 i.MX93 EVKCM 上的 EthosU NPU 上推斷 AI 模型時(shí)遇到錯誤。使用的 BSP：Linux imx93evk 6.1.1+g29549c7073bf 首先，我從

2023-06-05 11:36:22

壇友們有做反演、自適應等控制算法的嗎，有問(wèn)題想請教

最近在學(xué)習非線(xiàn)性控制系統的控制方法。我看了反演(backstepping)控制算法的控制率推導，但是書(shū)上給的例程都是直接給出控制參數，我現在就在這一塊犯迷糊了，具體的控制參數應當怎么求解呢？壇友有做這方面的嗎？望指點(diǎn)一下，或者推薦個(gè)參考書(shū)籍也可以。

2014-05-30 11:11:59

如何使用邏輯分析儀來(lái)探測高速數字系統？

邏輯分析儀探頭的負荷模型請問(wèn)如何使用邏輯分析儀來(lái)探測高速數字系統？

2021-04-13 06:03:19

如何使用開(kāi)放維尼諾TMT工具包進(jìn)行量化覺(jué)培訓和推斷

*、Kubernetes*、Helm* Optim* 　　如何運作　　　　圖1：流程圖圖　　工作流程執行如下：　　管道觸發(fā)器來(lái)自 Hugging Face 的自然語(yǔ)言處理模型（NLP）的量化- 軟件培訓

2023-08-03 06:07:29

如何實(shí)現C語(yǔ)言里的邏輯移位與算術(shù)移位？

如何實(shí)現C語(yǔ)言里的邏輯移位與算術(shù)移位？

2021-10-15 06:27:35

如何將CML邏輯添加到IBIS模型中？

文件中，缺少CML邏輯。任何人都可以建議，我如何將CML邏輯添加到IBIS模型中？或者我如何模擬邏輯。提前致謝。

2020-04-13 09:58:43

如何將Detectron2和Layout-LM模型轉換為OpenVINO中間表示（IR）和使用CPU插件進(jìn)行推斷？

無(wú)法確定如何將 Detectron2* 和 Layout-LM* 模型轉換為OpenVINO?中間表示（IR）和使用 CPU 插件進(jìn)行推斷。

2023-08-15 06:23:58

如何用VHDL語(yǔ)言實(shí)現該電路圖邏輯關(guān)系

關(guān)于用QuartusⅡ軟件實(shí)現編程調試，用VHDL語(yǔ)言描述該邏輯關(guān)系。多次嘗試編寫(xiě)，并不能準確描述邏輯關(guān)系，以及進(jìn)行編程調試，對于vhdl語(yǔ)言不能準確應用，想請教一下結構體的相關(guān)邏輯語(yǔ)言。

2022-05-04 12:21:32

怎樣去設計基于Simulink的混合動(dòng)力電動(dòng)汽車(chē)模型

配置用于系統級測試或電能質(zhì)量分析?？梢允褂貌煌淖?b class="flag-6" style="color: red">系統來(lái)構建電氣、電池和車(chē)輛動(dòng)力學(xué)系統的模型變體。將Simscape語(yǔ)言創(chuàng )建的電池模型引入到設計中。監控邏輯是采用Stateflow實(shí)現的。所有模型可以配...

2021-08-26 11:35:06

無(wú)法推斷具有動(dòng)態(tài)形狀的自定義模型要怎么辦？

推斷了一個(gè)自定義 YOLOv5，但收到錯誤：RuntimeError: Check \'std::get(valid)\' failed at inference/src/ie_core.cpp

2023-08-15 06:49:18

是否可以使用IR實(shí)施OpenVINO運行時(shí)推斷管道？

將 TensorFlow* 模型轉換為 IR。無(wú)法確定使用 IR 實(shí)現OpenVINO?運行時(shí)推斷管道的步驟。

2023-08-15 06:23:04

來(lái)幫幫孩子吧，關(guān)于磁傳感器測電流反演得出幅值和電位。

問(wèn)題：針對磁傳感器檢測電纜電流的特點(diǎn)，設計電纜電流信息反演的模型。包括模型的原理（可以手畫(huà)）和每個(gè)模塊的功能。解釋:磁傳感器的輸出信號是電壓或者電流，反演要得到的是電纜電流的幅值和相位.個(gè)人疑問(wèn)

2022-12-04 09:45:09

自然語(yǔ)言處理的語(yǔ)言模型

自然語(yǔ)言處理——53 語(yǔ)言模型（數據平滑）

2020-04-16 11:11:25

請問(wèn)在新CPU上推斷INT8模型的速度是否比舊CPU快？

與采用舊 CPU 的推理相比，在新 CPU 上推斷的 INT8 模型的推理速度更快。

2023-08-15 08:28:42

運行多個(gè)進(jìn)程時(shí)，OpenVINO trade推斷時(shí)間會(huì )增加是為什么？如何解決？

通過(guò)運行兩個(gè)進(jìn)程來(lái)推斷同一個(gè)模型，推斷時(shí)間翻倍。使用OpenVINO?推斷模型。運行單個(gè)過(guò)程時(shí)，推斷時(shí)間約為 300ms。使用兩個(gè)進(jìn)程時(shí)，兩個(gè)進(jìn)程的推理時(shí)間將變?yōu)?600ms。

2023-08-15 07:04:47

通過(guò)Cortex來(lái)非常方便的部署PyTorch模型

到軟件中。如何從“跨語(yǔ)言語(yǔ)言模型”轉換為谷歌翻譯？在這篇博客文章中，我們將了解在生產(chǎn)環(huán)境中使用 PyTorch 模型意味著(zhù)什么，然后介紹一種允許部署任何 PyTorch 模型以便在軟件中使用的方法。在生

2022-11-01 15:25:02

基于動(dòng)態(tài)描述邏輯的UCON授權模型

使用控制(UCON)是下一代訪(fǎng)問(wèn)控制模型，其核心模型包括授權模型、義務(wù)模型和條件模型。該文的目的是使用動(dòng)態(tài)描述邏輯DDL對UCON授權模型進(jìn)行邏輯表述，對授權過(guò)程中的各個(gè)決定要

2009-04-14 09:58:38

11

基于歸一化相關(guān)矩的多分辨率遙感圖象融合

多傳感器數據融合技術(shù)已廣泛應用于遙感圖象處理方面. 針對遙感多光譜圖象空間分辨率較低的問(wèn)題,提出了一種基于歸一化相關(guān)矩的多分辨率圖象融合方法. 該方法首先對圖象進(jìn)行二

2009-07-16 09:29:06

17

不確定非線(xiàn)性系統的弱抖振滑模反演控制

針對一類(lèi)匹配不確定非線(xiàn)性系統，提出一種弱抖振滑模反演控制策略。系統中的干擾部分用滑模方法去抑制，使系統具有良好的魯棒性。由于滑?？刂频氖褂脮?huì )引起抖振，采用一

2009-08-10 08:52:37

14

基于線(xiàn)性時(shí)態(tài)邏輯的Petri網(wǎng)模型檢測研究

線(xiàn)性時(shí)態(tài)邏輯Petri 網(wǎng)結合了Petri 網(wǎng)和時(shí)序邏輯的優(yōu)點(diǎn)，清晰簡(jiǎn)潔的描述并發(fā)系統事件間的時(shí)序和因果關(guān)系，包括系統的活性和安全性。其中自動(dòng)機的體積是模型檢驗的一個(gè)關(guān)鍵性

2009-08-31 16:14:50

22

角色反演算法

角色反演算法給出了面向上下文無(wú)關(guān)語(yǔ)言的句法分析的一種計算機制：角色反演算法．這種機制通過(guò)引入句法范疇的“角色”這一概念以及相應的角色反演操作，用較小的空間代價(jià)

2009-10-11 11:18:45

5

岷江上游典型流域林冠截持降雨遙感模型與反演

岷江上游典型流域林冠截持降雨遙感模型與反演:在對岷江上游典型流域研究區實(shí)地踏勘和定位觀(guān)測的基礎上，綜合利用ETM和ASTER遙感數據、地面實(shí)測數據和常規觀(guān)測數據等資料，結

2009-10-21 08:22:19

10

基于橢球體模型的彈道中段目標特性反演

針對彈道中段目標RCS 序列識別問(wèn)題，在分析其運動(dòng)特性與電磁散射特性的基礎上，結合傳統的基于橢球體的目標形狀反演模型，提出了一種新的利用RCS 幅度相對于目標姿態(tài)角變化率

2009-11-13 12:00:28

10

一種裸露土壤參數反演結果的驗證方法

該文分析了Oh(1992)以及Dubois(1995)等人提出的兩種裸露土壤地表的經(jīng)驗模型和反演算法，提出了在缺少地表實(shí)測數據的條件下，這兩種經(jīng)驗模型均適用的參數反演結果的驗證方法。由于

2009-11-21 14:00:17

7

時(shí)滯系統的模糊反饋推斷控制器設計

針對主要輸出可直接測量的時(shí)滯系統，提出一種模糊反饋推斷控制器。該控制器是在典型推斷控制的基礎上進(jìn)行簡(jiǎn)化和改進(jìn)，并用模糊邏輯和推理來(lái)自適應地調節控制器的濾波器時(shí)

2010-01-16 17:11:28

8

VHDL硬件描述語(yǔ)言與數字邏輯電路設計

VHDL硬件描述語(yǔ)言與數字邏輯電路設計:本書(shū)系統地介紹了一種硬件描述語(yǔ)言，即VHDL語(yǔ)言設計數字邏輯電路和數字系統的新方法。這是電子電路設計方法上一次革命性的變化，也是邁

2010-02-06 16:55:22

361

密煉機的推斷控制系統

提出橡膠密煉機的一種基于神經(jīng)網(wǎng)絡(luò )軟測量的推斷控制系統，針對橡膠密煉機混煉膠的質(zhì)量指標需要比較精確估計的一類(lèi)軟測量建模問(wèn)題，研究了適用于%&’( 軟測量模型的一種

2010-10-07 15:30:08

44

RLC層邏輯架構,RLC子層模型

RLC層邏輯架構 RLC子層模型

2009-09-18 15:23:21

1099

數字邏輯電路教學(xué)中的C語(yǔ)言描述和應用

數字邏輯電路教學(xué)中的C語(yǔ)言描述和應用摘要：為了改進(jìn)數字邏輯電路教學(xué)方法以適應電子技術(shù)迅猛發(fā)展的需要，我們探索和實(shí)踐了數字邏輯電路教

2010-05-24 15:40:52

1851

大氣氣溶膠光學(xué)厚度反演軟件系統設計和實(shí)現

為了實(shí)現大氣氣溶膠光學(xué)厚度反演的要求，提出一種基于傳統暗像元算法為基礎的一體化軟件系統設計方案，并完成系統的設計和氣溶膠光學(xué)厚度反演實(shí)驗。該系統的軟件設計主要利用

2013-04-16 10:51:40

0

基于反演滑模的二元機翼顫振控制

針對帶后緣面的二元機翼的顫振問(wèn)題，設計一種反演滑?？刂品椒▽C翼的浮沉和俯仰運動(dòng)進(jìn)行控制。首先，基于準定常氣動(dòng)理論建立二元機翼的氣動(dòng)彈性系統模型，然后設計一種反演滑?？刂破鲗C翼顫振進(jìn)行抑制，并利用

2016-01-04 17:13:49

18

一類(lèi)模型不確定非線(xiàn)性系統的反演預測控制_周衛東

一類(lèi)模型不確定非線(xiàn)性系統的反演預測控制_周衛東

2017-01-08 13:15:48

0

唇語(yǔ)識別中的話(huà)題相關(guān)語(yǔ)言模型研究_王淵

唇語(yǔ)識別中的話(huà)題相關(guān)語(yǔ)言模型研究_王淵

2017-03-19 11:28:16

0

基于邏輯語(yǔ)言計算機軟件設計（JAVA語(yǔ)言）

研究基于邏輯語(yǔ)言的計算機軟件開(kāi)放設計問(wèn)題。應用對比法分析在計算機軟件開(kāi)放設計之中，當前應用不同計算機邏輯語(yǔ)言的優(yōu)勢，并可應用最優(yōu)的計算機邏輯語(yǔ)言設計開(kāi)放式物業(yè)管理計算機軟件。對幾種邏輯語(yǔ)言對比證實(shí)

2017-11-01 15:19:23

0

verilog語(yǔ)言與c語(yǔ)言的區別

Verilog HDL是一種硬件描述語(yǔ)言，以文本形式來(lái)描述數字系統硬件的結構和行為的語(yǔ)言，用它可以表示邏輯電路圖、邏輯表達式，還可以表示數字邏輯系統所完成的邏輯功能。而C語(yǔ)言是一門(mén)通用計算機編程語(yǔ)言，應用廣泛。

2017-12-08 16:43:30

11903

基于謂詞邏輯的歸結原理分析

謂詞邏輯是在命題邏輯的基礎上發(fā)展而來(lái)的，通過(guò)引入量詞，它比命題邏輯能更有效地表示和求證復雜問(wèn)題。謂詞邏輯采用形式化語(yǔ)言系統，通過(guò)一定的推理規則和控制策略，研究前提和結論之間的蘊涵關(guān)系。謂詞邏輯具有

2017-12-20 16:04:23

1

自然語(yǔ)言處理常用模型解析

自然語(yǔ)言處理常用模型使用方法一、N元模型二、馬爾可夫模型以及隱馬爾可夫模型及目前常用的自然語(yǔ)言處理開(kāi)源項目/開(kāi)發(fā)包有哪些？

2017-12-28 15:42:30

5461

基于加性噪聲的缺失數據因果推斷

推斷數據間存在的因果關(guān)系是很多科學(xué)領(lǐng)域中的一個(gè)基礎問(wèn)題，然而現在暫時(shí)還沒(méi)有快速有效的方法對缺失數據進(jìn)行因果推斷。為此，提出一種基于加性噪聲模型下適應缺失數據的因果推斷算法。該算法是基于加性噪聲模型

2018-01-14 16:06:38

0

時(shí)序邏輯符號模型檢測器

現有模型檢測工具的形式化規范語(yǔ)言。如計算樹(shù)邏輯（computation tree logic，簡(jiǎn)稱(chēng)CTL）和線(xiàn)性時(shí)序邏輯（Linear temporal logic，簡(jiǎn)稱(chēng)LTL）等的描述能力不足

2018-01-26 14:48:35

1

機場(chǎng)場(chǎng)道道面結構層電磁特性反演的辨識方法

研究了基于系統辨識方法的機場(chǎng)場(chǎng)道道面介質(zhì)層電磁特性的反演問(wèn)題。在傳統系統辨識法反演層狀介質(zhì)電磁特性的基礎上，對電磁波在地下介質(zhì)層中傳輸時(shí)傳輸模型的建立及回波時(shí)延的估計方法作了改進(jìn)。新方法傳輸模型中考

2018-03-12 15:34:16

0

了解這5種開(kāi)發(fā)AI的最佳語(yǔ)言

編程語(yǔ)言不同，Lisp在解決特定問(wèn)題方面效率更高，因為它能夠適應開(kāi)發(fā)人員編寫(xiě)解決方案的需求。Lisp非常適合于歸納邏輯項目和機器學(xué)習。

2018-03-31 11:07:41

6772

組合邏輯的類(lèi)型及Verilog實(shí)現

Verilog HDL是一種硬件描述語(yǔ)言，以文本形式來(lái)描述數字系統硬件的結構和行為的語(yǔ)言，用它可以表示邏輯電路圖、邏輯表達式，還可以表示數字邏輯系統所完成的邏輯功能。

2019-11-28 07:02:00

2683

C語(yǔ)言中的邏輯運算符是怎么樣的

C語(yǔ)言提供了一組邏輯運算符：或（||）、且（&&）、非（!），分別對應于命題邏輯中的 OR、AND、NOT運算。

2020-02-20 16:25:23

3721

Vitis AI：從邊緣到云的最佳人工智能推斷

有了世界領(lǐng)先的模型壓縮技術(shù)，我們可以在對精度影響極小的情況下，將模型的復雜性降低 5 至 50 倍。深度壓縮可將您的 AI 推斷性能提升到一個(gè)新的層次。

2020-08-03 16:40:35

2602

邏輯架構模型開(kāi)發(fā)概念原則詳解

邏輯架構模型開(kāi)發(fā)可以用作“開(kāi)發(fā)候選架構模型和視圖”活動(dòng)的一項任務(wù)，或者系統架構定義過(guò)程的一個(gè)子過(guò)程(參見(jiàn)系統架構)。它的目的是詳細描述未來(lái)工程系統的功能和行為的模型和視圖，因為它應該在服務(wù)中運行

2021-02-17 09:59:00

4352

關(guān)于邏輯和物理架構模型開(kāi)發(fā)之間的迭代

方法，架構活動(dòng)都需要在邏輯架構模型開(kāi)發(fā)和物理架構模型開(kāi)發(fā)之間花費幾次迭代，直到邏輯和物理架構模型一致并提供必要的詳細級別。最初的架構活動(dòng)之一是基于標稱(chēng)場(chǎng)景(功能)創(chuàng )建邏輯架構模型。物理架構模型用于確定能夠執行系統功能的

2021-01-11 11:20:22

1665

運用SAR交叉極化數據反演海面風(fēng)速

單極化合成孔徑雷達（SAR）圖像在海面風(fēng)場(chǎng)反演應用中具有復雜的業(yè)務(wù)化模型，運用SAR交叉極化數據反演海面風(fēng)速成為當前研究熱點(diǎn)。采用我國自主發(fā)射的C波段SAR衛星高分三號全極化SAR圖像數據，以太

2021-03-17 17:13:53

15

廣義可能性模糊時(shí)態(tài)計算樹(shù)邏輯的模型檢測

為了增強計算樹(shù)邏輯在時(shí)序上的表達能力，以廣義可能性測度、決策過(guò)程和計算樹(shù)邏輯為基礎，硏究了具有決策過(guò)程的廣義可能性模糊時(shí)態(tài)計算樹(shù)邏輯的模型檢測。首先采用廣乂可能性決策過(guò)程作為系統模型;然后引λ模糊

2021-05-12 15:26:44

4

基于拆棍變分貝葉斯推斷的圖像分割算法

為提高圖像分割的抗噪魯棒性并解決分割數目的自適應確定問(wèn)題，通過(guò)在聚類(lèi)標簽先驗概率的折棍構造過(guò)程中建立 Markov隨機場(chǎng)，將空間相關(guān)性約束引λ Dirichlet過(guò)程混合模型的概率建模，使聚類(lèi)的空間

2021-06-04 15:27:33

3

基于高分一號影像的土壤濕度反演

基于高分一號影像的土壤濕度反演

2021-06-18 10:46:53

17

詳解剖析Go語(yǔ)言調度模型的設計

golang的MPG調度模型是保障Go語(yǔ)言效率高的一個(gè)重要特性，本文詳細介紹了Go語(yǔ)言調度模型的設計。前言 Please remember that at the end of the day

2021-07-26 10:12:43

1761

一種基于亂序語(yǔ)言模型的預訓練模型-PERT

由于亂序語(yǔ)言模型不使用[MASK]標記，減輕了預訓練任務(wù)與微調任務(wù)之間的gap，并由于預測空間大小為輸入序列長(cháng)度，使得計算效率高于掩碼語(yǔ)言模型。PERT模型結構與BERT模型一致，因此在下游預訓練時(shí)，不需要修改原始BERT模型的任何代碼與腳本。

2022-05-10 15:01:27

1231

時(shí)序邏輯程序中推斷組合邏輯？

使用always_ff和在靈敏度列表中指定一個(gè)時(shí)鐘邊沿并不意味著(zhù)過(guò)程中的所有邏輯都是時(shí)序邏輯。綜合編譯器將推斷出每個(gè)被非阻塞賦值的變量的觸發(fā)器。阻塞賦值也可能推斷出觸發(fā)器，這取決于賦值語(yǔ)句相對于程序中其他賦值和操作的順序和上下文。

2023-02-20 10:38:06

483

大型語(yǔ)言模型有哪些用途？

大型語(yǔ)言模型能識別、總結、翻譯、預測和生成文本及其他內容。 AI 應用在大型語(yǔ)言模型的幫助下，可用于解決總結文章、編寫(xiě)故事和參與長(cháng)對話(huà)等多種繁重工作。大型語(yǔ)言模型（LLM）是一種深度學(xué)習算法，可以

2023-02-23 19:50:04

4308

大型語(yǔ)言模型有哪些用途？大型語(yǔ)言模型如何運作呢？

大型語(yǔ)言模型能識別、總結、翻譯、預測和生成文本及其他內容。

2023-03-08 13:57:00

7174

C語(yǔ)言邏輯運算符優(yōu)先次序

有3種邏輯運算符：與（AND），或（OR），非（NOT）。在basic和Pascal等語(yǔ)言可以在程序中直接用and，or，not作為邏輯運算符。在C語(yǔ)言中不能再程序中直接使用，而是用其他符號代替。

2023-03-09 10:49:08

2047

各種大語(yǔ)言模型是徹底被解封了

基礎 LLM 基本信息表，GPT-style 表示 decoder-only 的自回歸語(yǔ)言模型，T5-style 表示 encoder-decoder 的語(yǔ)言模型，GLM-style 表示 GLM 特殊的模型結構，Multi-task 是指 ERNIE 3.0 的模型結構

2023-04-20 11:25:44

1146

AI大語(yǔ)言模型的原理、演進(jìn)及算力測算專(zhuān)題報告

GPT是基于Transformer架構的大語(yǔ)言模型，近年迭代演進(jìn)迅速。構建語(yǔ)言模型是自然語(yǔ)言處理中最基本和最重要的任務(wù)之一。GPT是基于Transformer架構衍生出的生成式預訓練的單向語(yǔ)言模型，通過(guò)對大量語(yǔ)料數據進(jìn)行無(wú)監督學(xué)習

2023-04-28 10:01:59

647

利用大語(yǔ)言模型做多模態(tài)任務(wù)

大型語(yǔ)言模型LLM（Large Language Model）具有很強的通用知識理解以及較強的邏輯推理能力，但其只能處理文本數據。

2023-05-10 16:53:15

748

PyTorch教程9.3.之語(yǔ)言模型

電子發(fā)燒友網(wǎng)站提供《PyTorch教程9.3.之語(yǔ)言模型.pdf》資料免費下載

2023-06-05 09:59:00

0

PyTorch教程-9.3. 語(yǔ)言模型

9.3. 語(yǔ)言模型? Colab [火炬]在 Colab 中打開(kāi)筆記本 Colab [mxnet] Open the notebook in Colab Colab [jax

2023-06-05 15:44:24

300

大型語(yǔ)言模型的應用

?? 大型語(yǔ)言模型（LLM）是一種深度學(xué)習算法，可以通過(guò)大規模數據集訓練來(lái)學(xué)習識別、總結、翻譯、預測和生成文本及其他內容。大語(yǔ)言模型（LLM）代表著(zhù) AI 領(lǐng)域的重大進(jìn)步，并有望通過(guò)習得的知識改變

2023-07-05 10:27:35

1629

語(yǔ)言模型的發(fā)展歷程基于神經(jīng)網(wǎng)絡(luò )的語(yǔ)言模型解析

簡(jiǎn)單來(lái)說(shuō)，語(yǔ)言模型能夠以某種方式生成文本。它的應用十分廣泛，例如，可以用語(yǔ)言模型進(jìn)行情感分析、標記有害內容、回答問(wèn)題、概述文檔等等。但理論上，語(yǔ)言模型的潛力遠超以上常見(jiàn)任務(wù)。

2023-07-14 11:45:40

514

Python的C外部函數的靜態(tài)類(lèi)型推斷

靜態(tài)類(lèi)型推斷是維護動(dòng)態(tài)類(lèi)型語(yǔ)言程序安全的重要手段之一。然而，另一種編程語(yǔ)言實(shí)現的外部函數往往不在宿主語(yǔ)言的類(lèi)型推斷范圍內。

2023-07-14 17:42:08

538

檢索增強的語(yǔ)言模型方法的詳細剖析

? 本篇內容是對于A(yíng)CL‘23會(huì )議上陳丹琦團隊帶來(lái)的Tutorial所進(jìn)行的學(xué)習記錄，以此從問(wèn)題設置、架構、應用、挑戰等角度全面了解檢索增強的語(yǔ)言模型，作為對后續工作的準備與入門(mén)，也希望能給大家帶來(lái)

2023-08-21 09:58:01

1324

訓練大語(yǔ)言模型帶來(lái)的硬件挑戰

生成式AI和大語(yǔ)言模型（LLM）正在以難以置信的方式吸引全世界的目光，本文簡(jiǎn)要介紹了大語(yǔ)言模型，訓練這些模型帶來(lái)的硬件挑戰，以及GPU和網(wǎng)絡(luò )行業(yè)如何針對訓練的工作負載不斷優(yōu)化硬件。

2023-09-01 17:14:56

1118

騰訊發(fā)布混元大語(yǔ)言模型

能力和復雜語(yǔ)境下的邏輯推理能力；而且在時(shí)效性上比較強。目前混元大語(yǔ)言模型已經(jīng)在小程序、騰訊云、騰訊廣告、騰訊游戲等開(kāi)啟內測。

2023-09-07 10:23:54

852

模型機控制信號產(chǎn)生邏輯VHDL

模型機控制信號產(chǎn)生邏輯VHDL 引言：隨著(zhù)科技的發(fā)展，數字系統的設計越來(lái)越重要。在數字系統設計的過(guò)程中，模型機控制信號的產(chǎn)生邏輯是一個(gè)非常重要的方面。本文將介紹VHDL語(yǔ)言在模型機控制信號產(chǎn)生邏輯

2023-09-19 17:16:08

376

揭秘編碼器與解碼器語(yǔ)言模型

Transformer 架構的問(wèn)世標志著(zhù)現代語(yǔ)言大模型時(shí)代的開(kāi)啟。自 2018 年以來(lái)，各類(lèi)語(yǔ)言大模型層出不窮。

2023-10-24 11:42:05

399

基于檢索的大語(yǔ)言模型簡(jiǎn)介

簡(jiǎn)介章節講的是比較基礎的，主要介紹了本次要介紹的概念，即檢索（Retrieval）和大語(yǔ)言模型（LLM）

2023-11-15 14:50:36

355

c語(yǔ)言中邏輯真等價(jià)于什么

在C語(yǔ)言中，邏輯真等價(jià)于1。邏輯真可以理解為一個(gè)表達式、語(yǔ)句或條件的結果為真，即滿(mǎn)足條件。在計算機科學(xué)和編程中，邏輯真在控制流語(yǔ)句、循環(huán)和條件語(yǔ)句中具有重要的作用。邏輯真等價(jià)于條件為真的情況

2023-11-30 14:10:23

799

大語(yǔ)言模型簡(jiǎn)介：基于大語(yǔ)言模型模型全家桶Amazon Bedrock

本文基于亞馬遜云科技推出的大語(yǔ)言模型與生成式AI的全家桶：Bedrock對大語(yǔ)言模型進(jìn)行介紹。大語(yǔ)言模型指的是具有數十億參數（B+）的預訓練語(yǔ)言模型（例如：GPT-3, Bloom, LLaMA)。這種模型可以用于各種自然語(yǔ)言處理任務(wù)，如文本生成、機器翻譯和自然語(yǔ)言理解等。

2023-12-04 15:51:46

411

大規模語(yǔ)言模型的基本概念、發(fā)展歷程和構建流程

使用自然語(yǔ)言與系統交互，從而實(shí)現包括問(wèn)答、分類(lèi)、摘要、翻譯、聊天等從理解到生成的各種任務(wù)。大型語(yǔ)言模型展現出了強大的對世界知識掌握和對語(yǔ)言的理解。

2023-12-07 11:40:43

1629

大語(yǔ)言模型概述

在科技飛速發(fā)展的當今時(shí)代，人工智能技術(shù)成為社會(huì )進(jìn)步的關(guān)鍵推動(dòng)力之一。在廣泛關(guān)注的人工智能領(lǐng)域中，大語(yǔ)言模型以其引人注目的特性備受矚目。大語(yǔ)言模型的定義及發(fā)展歷史大語(yǔ)言模型是一類(lèi)基于深度學(xué)習技術(shù)

2023-12-21 17:53:59

745

大語(yǔ)言模型使用指南

在信息爆炸的時(shí)代，我們渴望更智能、更高效的語(yǔ)言處理工具。GPT-3.5等大語(yǔ)言模型的崛起為我們提供了前所未有的機會(huì )。這不僅是技術(shù)的進(jìn)步，更是人與機器共舞的一幕。本篇文章將帶你走進(jìn)這個(gè)奇妙的語(yǔ)言王國

2023-12-29 14:18:59

354

大語(yǔ)言模型推斷中的批處理效應

隨著(zhù)開(kāi)源預訓練大型語(yǔ)言模型（Large Language Model, LLM ）變得更加強大和開(kāi)放，越來(lái)越多的開(kāi)發(fā)者將大語(yǔ)言模型納入到他們的項目中。其中一個(gè)關(guān)鍵的適應步驟是將領(lǐng)域特定的文檔集成到預訓練模型中，這被稱(chēng)為微調。

2024-01-04 12:32:39

282

大語(yǔ)言模型中的語(yǔ)言與知識：一種神秘的分離現象

自然語(yǔ)言處理領(lǐng)域存在著(zhù)一個(gè)非常有趣的現象：在多語(yǔ)言模型中，不同的語(yǔ)言之間似乎存在著(zhù)一種隱含的對齊關(guān)系。

2024-02-20 14:53:06

153

已全部加載完成

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看