<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

如何最好地使用所有可用的 LLM 工具

許多企業（OpenAI、AI21、CoHere 等）正在提供 LLM 作為服務，因為它們在商業、科學和金融環境中具有誘人的潛力。雖然 GPT-4 和其他 LLM 在諸如問答等任務上展示了破紀錄的性能，但它們在高吞吐量應用程序中的使用可能會非常昂貴。例如，使用 GPT-4 協助客戶服務可能會使小型企業每月花費超過 21,000 美元，而 ChatGPT 預計每天花費超過 700,000 美元。使用最大的 LLM 需要付出高昂的貨幣代價，并對環境和社會產生嚴重的負面影響。

研究表明，許多 LLM 可以通過 API 以各種定價獲得。使用 LLM API 的成本通常分為三個部分：

提示成本（與提示的持續時間成比例）
生成成本（與生成長度成比例）
每個問題的固定費用。
鑒于價格和質量的廣泛差異，從業者可能很難決定如何最好地使用所有可用的 LLM 工具。此外，如果服務中斷，則依賴單個 API 提供者是不可靠的，這可能發生在意外高需求的情況下。

上傳失敗，網絡異常。

重試

當前模型級聯和 FrugalML 等模型集成范例未考慮 LLM 的局限性，這些范例是為具有固定標簽集的預測任務開發的。

斯坦福大學最近的研究提出了一個名為 FrugalGPT 的預算友好型框架的概念，它利用 LLM API 來處理自然語言查詢。

及時適應、LLM 近似和 LLM 級聯是降低成本的三種主要方法。為了節省開支，提示適應調查了確定哪些提示最有效的方法。通過近似復雜且昂貴的 LLM，可以開發更簡單且更具成本效益的替代方案，其性能與原始方案一樣好。 LLM 級聯的關鍵思想是為各種查詢動態選擇合適的 LLM API。

實施并評估了基于 LLM 級聯構建的 FrugalGPT 基本版本，以展示這些想法的潛力。對于每個數據集和任務，FrugalGPT 學習如何自適應地將數據集中的問題分類到 LLM 的各種組合，例如 ChatGPT、GPT-3 和 GPT-4。與最好的單個 LLM API 相比，FrugalGPT 節省了高達 98% 的推理成本，同時在下游任務上保持相同的性能。另一方面，FrugalGPT 可以以相同的價格實現高達 4% 的性能提升。

FrugalGPT 的 LLM 級聯技術需要對標記示例進行訓練。此外，為了使級聯有效，訓練和測試示例應該具有相同或相似的分布。此外，掌握LLM級聯也需要時間和精力。

FrugalGPT 尋求性能和成本之間的平衡，但其他因素，包括延遲、公平性、隱私和環境影響，在實踐中更為重要。該團隊認為，未來的研究應側重于在不犧牲性能或成本效益的情況下將這些功能納入優化方法。 LLM 生成的結果的不確定性也需要仔細量化以用于風險關鍵型應用。

審核編輯：彭靜

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

API

API

+關注

關注
2

文章
1420

瀏覽量
61163
數據集

數據集

+關注

關注
4

文章
1182

瀏覽量
24461
自然語言

自然語言

+關注

關注
1

文章
271

瀏覽量
13236
LLM

LLM

+關注

關注
0

文章
219

瀏覽量
249

原文標題：斯坦福研究人員介紹 FrugalGPT：一種新的 AI 框架，用于 LLM API 處理自然語言查詢

文章出處：【微信號：計算機視覺芯片設計，微信公眾號：計算機視覺芯片設計】歡迎添加關注！文章轉載請注明出處。

評論

相關推薦

對比解碼在LLM上的應用

為了改進LLM的推理能力，University of California聯合Meta AI實驗室提出將Contrastive Decoding應用于多種任務的LLM方法。實驗表明，所提方法能有效改進LLM的推理能力。讓我們走進

發表于 09-21 11:37 ?424次閱讀

對比解碼在<b class='flag-5'>LLM</b>上的應用

使用基于Transformers的API在CPU上實現LLM高效推理

英特爾 Extension for Transformers是英特爾推出的一個創新工具包，可基于英特爾架構平臺，尤其是第四代英特爾至強可擴展處理器（代號 SapphireRapids，SPR）顯著加速基于Transformers的大語言模型( LargeLanguageModel,

的頭像

發表于 01-22 11:11 ?2065次閱讀

使用基于Transformers的API在CPU上實現<b class='flag-5'>LLM</b>高效推理

有什么好用的verilog HDL編輯工具可用？

有什么好用的verilog HDL編輯工具可用？最好能集成實時的verilog HDL語法檢測、自定義模塊識別觸發等功能，最好能夠免費；

發表于 04-28 11:00

部落沖突輔助工具終極推薦：免root離線掛機【本人用過所有輔助中最好的】

部落沖突輔助工具終極推薦：免root離線掛機【本人用過所有輔助中最好的】相信很多小伙伴都玩部落沖突好久了，偶也是，為了節省時間、精力升本，有時候會借助下工具，哈哈！部落沖突輔助

發表于 02-24 11:56

哪個工具可用于從命令行從elf文件生成srec文件？

再次生成 srec 并比較獲得的兩個 srec 文件（構建鏈與替代工具）。我已經下載了 S32K1 Design Studio (v3.5)，希望從那里獲得所需的工具，但我正在尋找有關如何通過 IDE 進行操作的所有文檔。哪個

發表于 03-22 07:50

請問哪些工具可用于QoriQ PA？

我正在使用 QoriQ T 系列 PowerPC 處理器進行開發。有哪些工具可用？Code Warrior 似乎不再可用。CW4NET 不包含 PowerPC 支持。QCVS 似乎只是 ARM Layerscape。PowerP

發表于 04-07 06:44

最好的殺木馬清除工具

推薦最強最好的殺木馬清除工具AVGAnti-Spyware--極致安全完美防護.針對因特網上傳播的新一代安全威脅的有效解決方案.確保您的數據安全,保護您的隱私,抵御間諜軟件,廣告軟件,木馬

發表于 01-17 13:19 ?47次下載

最好的最強的殺木馬工具

最好的最強的殺木馬工具,AVG Anti-Spyware -- 極致安全完美防護.針對因特網上傳播的新一代安全威脅的有效解決方案.確保您的數據安全,保護您的隱私,抵御間諜軟件,廣告軟件,

發表于 07-17 10:39 ?15次下載

如何用旁路工具提升網絡可用性？

在將內聯安全工具構建到您的網絡中時，結合網絡旁路技術是避免代價高昂的網絡停機時間的基本最佳實踐。簡而言之，旁路 TAP，也稱為“旁路交換機”，能夠隨時管理內聯工具的可用性，而無需中斷網絡或影響業務

的頭像

發表于 06-25 14:41 ?1211次閱讀

LLM性能的主要因素

現在是2023年5月，截止目前，網絡上已經開源了眾多的LLM，如何用較低的成本，判斷LLM的基礎性能，選到適合自己任務的LLM，成為一個關鍵。本文會涉及以下幾個問題：影響LLM性能

的頭像

發表于 05-22 15:26 ?1323次閱讀

<b class='flag-5'>LLM</b>性能的主要因素

中國研究人員提出StructGPT，提高LLM對結構化數據的零樣本推理能力

盡管結構化數據的體量往往非常巨大，但不可能容納輸入提示中的所有數據記錄（例如，ChatGPT 的最大上下文長度為 4096）。將結構化數據線性化為 LLM 可以輕松掌握的語句是解決此問題的簡單方法。工具操作技術激勵他們增強

的頭像

發表于 05-24 16:02 ?2521次閱讀

中國研究人員提出StructGPT，提高<b class='flag-5'>LLM</b>對結構化數據的零樣本推理能力

LLM在各種情感分析任務中的表現如何

? 最近幾年，GPT-3、PaLM和GPT-4等LLM刷爆了各種NLP任務，特別是在zero-shot和few-shot方面表現出它們強大的性能。因此，情感分析(SA)領域也必然少不了LLM的影子

的頭像

發表于 05-29 17:24 ?1693次閱讀

<b class='flag-5'>LLM</b>在各種情感分析任務中的表現如何

LLM的長度外推淺談

蘇神最早提出的擴展LLM的context方法，基于bayes啟發得到的公式

的頭像

發表于 07-28 17:37 ?1652次閱讀

<b class='flag-5'>LLM</b>的長度外推淺談

NVIDIA AI Foundation Models：使用生產就緒型 LLM 構建自定義企業聊天機器人和智能副駕

? 系列基礎模型是一套功能強大的全新工具，可用于為企業構建生產就緒生成式 AI 應用，從而推動從客服 AI 聊天機器人到尖端 AI 產品的各種創新。這些新的基礎模型現已加入? NVIDIA NeMo 。這個端到端框架用于構建、自定義和部署專為企業定制的

的頭像

發表于 11-17 21:35 ?602次閱讀

NVIDIA AI Foundation Models：使用生產就緒型 <b class='flag-5'>LLM</b> 構建自定義企業聊天機器人和智能副駕

100%在樹莓派上執行的LLM項目

ChatGPT的人性口語化回復相信許多人已體驗過，也因此掀起一波大型語言模型（Large Language Model, LLM）熱潮，LLM即ChatGPT背后的主運作技術，但LLM運作需要龐大運算力，因此目前多是在云端（Cl

的頭像

發表于 02-29 16:29 ?840次閱讀

100%在樹莓派上執行的<b class='flag-5'>LLM</b>項目

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看

<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>