<acronym id="s8ci2"><small id="s8ci2"></small></acronym>

<rt id="s8ci2"></rt><rt id="s8ci2"><optgroup id="s8ci2"></optgroup></rt>

<acronym id="s8ci2"></acronym>

<acronym id="s8ci2"><center id="s8ci2"></center></acronym>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發帖/加入社區

會員中心

創作中心

發布

創作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

基于OpenVINO和LangChain構建RAG問答系統

作者：楊亦誠英特爾 AI 軟件工程師

背景

隨著生成式 AI 的興起，和大語言模型對話聊天的應用變得非常熱門，但這類應用往往只能簡單地和你“聊聊家?！?，并不能針對某些特定的行業，給出非常專業和精準的答案。這也是由于大語言模型（以下簡稱 LLM）在時效性和專業性上的局限所導致，現在市面上大部分開源的 LLM 幾乎都只是使用某一個時間點前的公開數據進行訓練，因此它無法學習到這個時間點之后的知識，并且也無法保證在專業領域上知識的準確性。那有沒有辦法讓你的模型學習到新的知識呢？

當然有，這里一般有 2 種方案：

Fine-tuning 微調

微調通過對特定領域數據庫進行廣泛的訓練來調整整個模型。這樣可以內化專業技能和知識。然后，微調也需要大量的數據、大量的計算資源和定期的重新訓練以保持時效性。

RAG 檢索增強生成

RAG的全稱是 Retrieval-Augmented Generation，它的原理是通過檢索外部知識來給出上下文響應，在無需對模型進行重新訓練的情況，保持模型對于特定領域的專業性，同時通過更新數據查詢庫，可以實現快速地知識更新。但 RAG 在構建以及檢索知識庫時，會占用更多額外的內存資源，其回答響應延時也取決于知識庫的大小。

從以上比較可以看出，在沒有足夠 GPU 計算資源對模型進行重新訓練的情況下，RAG 方式對普通用戶來說更為友好。因此本文也將探討如何利用 OpenVINO 以及 LangChain 工具來構建屬于你的 RAG 問答系統。

RAG 流程

雖然 RAG 可以幫助 LLM “學習”到新的知識，并給出更可靠的答案，但它的實現流程并不復雜，主要可以分為以下兩個部分：

01構建知識庫檢索

圖：構建知識庫流程

Load 載入：

讀取并解析用戶提供的非結構化信息，這里的非結構化信息可以是例如 PDF 或者 Markdown 這樣的文檔形式。

Split 分割：

將文檔中段落按標點符號或是特殊格式進行拆分，輸出若干詞組或句子，如果拆分后的單句太長，將不便于后期 LLM 理解以及抽取答案，如果太短又無法保證語義的連貫性，因此我們需要限制拆分長度（chunk size），此外，為了保證 chunk 之間文本語義的連貫性，相鄰 chunk 會有一定的重疊，在 LangChain 中我可以通過定義 Chunk overlap 來控制這個重疊區域的大小。

圖：Chunk size 和 Chunk overlap 示例

Embedding 向量化：

使用深度學習模型將拆分后的句子向量化，把一段文本根據語義在一個多維空間的坐標系里面表示出來，以便知識庫存儲以及檢索，語義將近的兩句話，他們所對應的向量相似度會相對較大，反之則較小，以此方式我們可以在檢索時，判斷知識庫里句子是否可能為問題的答案。

Store 存儲：

構建知識庫，將文本以向量的形式存儲，用于后期檢索。

02檢索和答案生成

圖：答案生成流程

Retrieve 檢索：

當用戶問題輸入后，首先會利用 embedding 模型將其向量化，然后在知識庫中檢索與之相似度較高的若干段落，并對這些段落的相關性進行排序。

Generate 生成：

將這個可能包含答案，且相關性最高的 Top K 個檢索結果，包裝為 Prompt 輸入，喂入 LLM 中，據此來生成問題所對應的的答案。

關鍵步驟

在利用 OpenVINO構建 RAG 系統過程中有以下一些關鍵步驟：

01封裝 Embedding 模型類

由于在 LangChain 的 chain pipeline 會調用 embedding 模型類中的embed_documents和 embed_query 來分別對知識庫文檔和問題進行向量化，而他們最終都會調用 encode 函數來實現每個 chunk 具體的向量化實現，因此在自定義的 embedding 模型類中也需要實現這樣幾個關鍵方法，并通過 OpenVINO進行推理任務的加速。

圖：embedding 模型推理示意

由于在 RAG 系統中的各個 chunk 之間的向量化任務往往沒有依賴關系，因此我們可以通過 OpenVINO 的 AsyncInferQueue 接口，將這部分任務并行化，以提升整個 embedding 任務的吞吐量。

for i, sentence in enumerate(sentences_sorted):
      inputs = {}
      features = self.tokenizer(
        sentence, padding=True, truncation=True, return_tensors='np')
      for key in features:
        inputs[key] = features[key]
      infer_queue.start_async(inputs, i)
    infer_queue.wait_all()
    all_embeddings = np.asarray(all_embeddings)

左滑查看更多

此外，從 HuggingFace Transfomers 庫中（https://hf-mirror.com/sentence-transformers/all-mpnet-base-v2#usage-huggingface-transformers）導出的 embedding 模型是不包含 mean_pooling 和歸一化操作的，因此我們需要在獲取模型推理結果后，再實現這部分后處理任務。并將其作為 callback function 與 AsyncInferQueue 進行綁定。

def postprocess(request, userdata):
      embeddings = request.get_output_tensor(0).data
      embeddings = np.mean(embeddings, axis=1)
      if self.do_norm:
        embeddings = normalize(embeddings, 'l2')
      all_embeddings.extend(embeddings)


    infer_queue.set_callback(postprocess)

左滑查看更多

02封裝 LLM 模型類

由于 LangChain 已經可以支持 HuggingFace 的 pipeline 作為其 LLM 對象，因此這里我們只要將 OpenVINO 的 LLM 推理任務封裝成一個 HF 的 text generation pipeline 即可（詳細方法可以參考我的上一篇文章）。此外為了流式輸出答案（逐字打?。?，需要通過 TextIteratorStreamer 對象定義一個流式生成器。

streamer = TextIteratorStreamer(
  tok, timeout=30.0, skip_prompt=True, skip_special_tokens=True
)
generate_kwargs = dict(
  model=ov_model,
  tokenizer=tok,
  max_new_tokens=256,
  streamer=streamer,
  # temperature=1,
  # do_sample=True,
  # top_p=0.8,
  # top_k=20,
  # repetition_penalty=1.1,
)
if stop_tokens is not None:
  generate_kwargs["stopping_criteria"] = StoppingCriteriaList(stop_tokens)
  
pipe = pipeline("text-generation", **generate_kwargs)
llm = HuggingFacePipeline(pipeline=pipe)

左滑查看更多

03設計 RAG prompt template

當完成檢索后，RAG 會將相似度最高的檢索結果包裝為 Prompt，讓 LLM 進行篩選與重構，因此我們需要為每個 LLM 設計一個 RAG prompt template，用于在 Prompt 中區分這些檢索結果，而這部分的提示信息我們又可以稱之為 context 上下文，以供 LLM 在生成答案時進行參考。以 ChatGLM3 為例，它的 RAG prompt template 可以是這樣的：

 "prompt_template": f"""<|system|>
    {DEFAULT_RAG_PROMPT_CHINESE }"""
    + """
    <|user|>
    問題: {question} 
    已知內容: {context} 
    回答: 
    <|assistant|>""",

左滑查看更多

其中：

● {DEFAULT_RAG_PROMPT_CHINESE}為我們事先根據任務要求定義的系統提示詞。

●{question}為用戶問題。

●{context} 為 Retriever 檢索到的，可能包含問題答案的段落。

例如，假設我們的問題是“飛槳的四大優勢是什么？”，對應從飛槳文檔中獲取的 Prompt 輸入就是：

“<|system|>
基于以下已知信息，請簡潔并專業地回答用戶的問題。如果無法從中得到答案，請說 "根據已知信息無法回答該問題" 或 "沒有提供足夠的相關信息"。不允許在答案中添加編造成分。另外，答案請使用中文。
<|user|>
問題: 飛槳的四大領先技術是什么？
已知內容: ## 安裝


PaddlePaddle最新版本: v2.5
跟進PaddlePaddle最新特性請參考我們的版本說明


四大領先技術
開發便捷的產業級深度學習框架


飛槳深度學習框架采用基于編程邏輯的組網范式，對于普通開發者而言更容易上手，符合他們的開發習慣。同時支持聲明式和命令式編程，兼具開發的靈活性和高性能。網絡結構自動設計，模型效果超越人類專家。


支持超大規模深度學習模型的訓練


飛槳突破了超大規模深度學習模型訓練技術，實現了支持千億特征、萬億參數、數百節點的開源大規模訓練平臺，攻克了超大規模深度學習模型的在線學習難題，實現了萬億規模參數模型的實時更新。
查看詳情


支持多端多平臺的高性能推理部署工具
…
<|assistant|>“

左滑查看更多

04創建 RetrievalQA 檢索

在文本分割這個任務中，LangChain 支持了多種分割方式，例如按字符數的 CharacterTextSplitter，針對 Markdown 文檔的 MarkdownTextSplitter，以及利用遞歸方法的 RecursiveCharacterTextSplitter，當然你也可以通過繼成 TextSplitter 父類來實現自定義的 split_text 方法，例如在中文文檔中，我們可以采用按每句話中的標點符號進行分割。

class ChineseTextSplitter(CharacterTextSplitter):
  def __init__(self, pdf: bool = False, **kwargs):
    super().__init__(**kwargs)
    self.pdf = pdf


  def split_text(self, text: str) -> List[str]:
    if self.pdf:
      text = re.sub(r"
{3,}", "
", text)
      text = text.replace("

", "")
    sent_sep_pattern = re.compile(
      '([﹒﹔﹖﹗．。??？]["’”」』]{0,2}|(?=["‘“「『]{1,2}|$))') # del ：；
    sent_list = []
    for ele in sent_sep_pattern.split(text):
      if sent_sep_pattern.match(ele) and sent_list:
        sent_list[-1] += ele
      elif ele:
        sent_list.append(ele)
    return sent_list

左滑查看更多

接下來我們需要載入預先設定的好的 prompt template，創建 rag_chain。

圖：Chroma 引擎檢索流程

這里我們使用 Chroma 作為檢索引擎，在 LangChain 中，Chroma 默認使用 cosine distance 作為向量相似度的評估方法，同時可以通過調整 db.as_retriever（search_type= "similarity_score_threshold"），或是 db.as_retriever（search_type= "mmr"）來更改默認搜索策略，前者為帶閾值的相似度搜索，后者為 max_marginal_relevance 算法。當然 Chroma 也可以被替換為 FAISS 檢索引擎，使用方式也是相似的。

此外通過定義 as_retriever函數中的 {"k": vector_search_top_k}，我們還可以改變檢索結果的返回數量，有助于幫助 LLM 獲取更多有效信息，但也為增加 Prompt 的長度，提高推理延時，因此不建議將該數值設定太高。創建 rag_chain 的完整代碼如下：

 documents = load_single_document(doc.name)


  text_splitter = TEXT_SPLITERS[spliter_name](
    chunk_size=chunk_size, chunk_overlap=chunk_overlap
  )


  texts = text_splitter.split_documents(documents)


  db = Chroma.from_documents(texts, embedding)
  retriever = db.as_retriever(search_kwargs={"k": vector_search_top_k})


  global rag_chain
  prompt = PromptTemplate.from_template(
    llm_model_configuration["prompt_template"])
  chain_type_kwargs = {"prompt": prompt}
  rag_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=retriever,
    chain_type_kwargs=chain_type_kwargs,
  )

左滑查看更多

05答案生成

創建以后的 rag_chain 對象可以通過 rag_chain.run(question) 來響應用戶的問題。將它和線程函數綁定后，就可以從 LLM 對象的 streamer 中獲取流式的文本輸出。

def infer(question):
    rag_chain.run(question)
    stream_complete.set()


  t1 = Thread(target=infer, args=(history[-1][0],))
  t1.start()
  partial_text = ""
  for new_text in streamer:
    partial_text = text_processor(partial_text, new_text)
    history[-1][1] = partial_text
    yield history

左滑查看更多

最終效果

最終效果如下圖所示，當用戶上傳了自己的文檔文件后，點擊 Build Retriever 便可以創建知識檢索庫，同時也可以根據自己文檔的特性，通過調整檢索庫的配置參數來實現更高效的搜索。當完成檢索庫創建后就可以在對話框中與 LLM 進行問答交互了。

圖：基于 RAG 的問答系統效果

總結

在醫療、工業等領域，行業知識庫的構建已經成為了一個普遍需求，通過 LLM 與 OpenVINO 的加持，我們可以讓用戶對于知識庫的查詢變得更加精準與高效，帶來更加友好的交互體驗。

審核編輯：湯梓紅

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

英特爾

英特爾

+關注

關注
60

文章
9576

瀏覽量
169682
AI

AI

+關注

關注
87

文章
27183

瀏覽量
264957
數據庫

數據庫

+關注

關注
7

文章
3627

瀏覽量
63689
OpenVINO

OpenVINO

+關注

關注
0

文章
63

瀏覽量
103

原文標題：基于 OpenVINO? 和 LangChain 構建 RAG 問答系統 | 開發者實戰

文章出處：【微信號：英特爾物聯網，微信公眾號：英特爾物聯網】歡迎添加關注！文章轉載請注明出處。

評論

相關推薦

從源代碼構建OpenVINO工具套件時報錯怎么解決？

從源退貨開始構建OpenVINO?工具套件錯誤： Could not find a package configuration file provided by \"ade\"

發表于 08-15 06:45

在Raspberry Pi上從源代碼構建OpenVINO 2021.3收到錯誤怎么解決？

在 Raspberry Pi 上從源代碼構建 OpenVINO?2021.3。運行OpenVINO?推理，并收到錯誤消息： ModuleNotFoundError：沒有

發表于 08-15 08:24

如何使用交叉編譯方法為Raspbian 32位操作系統構建OpenVINO工具套件的開源分發

提供如何使用交叉編譯方法為 Raspbian* 32 位操作系統構建 OpenVINO? 工具套件的開源分發。單擊主題上的了解詳細信息：系統要求注意本指南假定您的 Raspber

發表于 08-15 06:28

如何使用Python包裝器正確構建OpenVINO工具套件

來構建該工具套件。如果您未明確指定 Python 版本，CMake 會選擇系統級 Python 版本（2.7），而且您的 Python 腳本將不起作用。注意以下說明假定您已安裝了 Python

發表于 08-15 07:13

永久設置OpenVINO trade Windows reg10的工具套件環境變量

]%INTEL_OPENVINO_DIR%\\\\extras\\opencv\\\\bin可選，僅在根據下載其他組件安裝 OpenCV* 的情況下。調整自定義 OpenCV 構建的條目。注意這適用于 2022.1 版Ope

發表于 08-15 07:18

無法使用Microsoft Visual Studio 2017為Windows 10構建開源OpenVINO怎么解決？

無法使用 Microsoft Visual Studio 2017 為 Windows 10 構建開源OpenVINO?。

發表于 08-15 06:43

LangChain簡介

對 ChatGPT 等應用著迷？想試驗他們背后的模型嗎？甚至開源/免費模型？不要再觀望……LangChain 是必經之路……

發表于 05-22 09:14 ?8092次閱讀

使用MoonBot構建您自己的問答機器人

電子發燒友網站提供《使用MoonBot構建您自己的問答機器人.zip》資料免費下載

發表于 07-06 10:50 ?0次下載

基于Redis Enterprise，LangChain，OpenAI 構建一個電子商務聊天機器人

鑒于最近人工智能支持的API和網絡開發工具的激增，許多科技公司都在將聊天機器人集成到他們的應用程序中。LangChain是一種備受歡迎的新框架，近期引起了廣泛關注。該框架旨在簡化開發人員與語言模型

發表于 11-25 08:04 ?263次閱讀

如何利用OpenVINO加速LangChain中LLM任務

LangChain 是一個高層級的開源的框架，從字面意義理解，LangChain 可以被用來構建 “語言處理任務的鏈條”，它可以讓AI開發人員把大型語言模型（LLM）的能力和外部數據結合起來，從而

發表于 12-05 09:58 ?520次閱讀

LangChain 0.1版本正式發布

LangChain 由 Harrison Chase 于 2022 年 10 月推出，是一個開源編排框架，用于使用 LLM 開發應用程序，推出后迅速脫穎而出，截至 2023 年 6 月，它是 GitHub 上增長最快的開源項目。

發表于 01-10 10:28 ?600次閱讀

用Redis為LangChain定制AI代理——OpenGPTs

OpenAI最近推出了OpenAIGPTs——一個構建定制化AI代理的無代碼“應用商店”，隨后LangChain開發了類似的開源工具OpenGPTs。OpenGPTs是一款低代碼的開源框架，專用

發表于 01-13 08:03 ?624次閱讀

虹科分享 | 用Redis為LangChain定制AI代理——OpenGPTs

OpenAI最近推出了OpenAI GPTs——一個構建定制化AI代理的無代碼“應用商店”，隨后LangChain開發了類似的開源工具OpenGPTs。OpenGPTs是一款低代碼的開源框架，專用于構建定制化的人工智能代理。

發表于 01-18 10:39 ?200次閱讀

探索LangChain：構建專屬LLM應用的基石

LangChain通過Loader加載外部的文檔，轉化為標準的Document類型。Document類型主要包含兩個屬性：page_content 包含該文檔的內容。meta_data 為文檔相關的描述性數據，類似文檔所在的路徑等。

發表于 01-30 10:33 ?349次閱讀

什么是RAG，RAG學習和實踐經驗

高級的RAG能很大程度優化原始RAG的問題，在索引、檢索和生成上都有更多精細的優化，主要的優化點會集中在索引、向量模型優化、檢索后處理等模塊進行優化

發表于 04-24 09:17 ?275次閱讀

英特爾物聯網
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 關于自動駕駛的現狀和未來的發展前景分析介紹
Hot 關于智慧學習終端seewoBook的性能分析和介紹

New 在英特爾酷睿Ultra處理器上優化和部署YOLOv8模型
New 英特爾機器視覺與AI解決方案助力生產力升級

精選推薦
更多

文章

資料

帖子

使用理想二極管控制器的汽車應用冗余電源拓撲

德州儀器
2小時前

214 閱讀

電力電子中的電大、電小尺寸？

英飛凌工業半導體
2天前

161 閱讀

EMC大揭秘 PCB設計必備指南

凡億PCB
1天前

692 閱讀

華為PCBA檢查規范設計總結

凡億PCB
1天前

792 閱讀

第一批人機戀的“AI前任”已經死了

腦極體
1天前

854 閱讀

單片機家族AM系列

王芳
521

10積分

61下載

TI-RTOS 2.20 User’s Guide

jollinyin
1.56 MB

1積分

0下載

ExpAn用于A/B測試統計分析的開源Python庫

劉軍
0.11 MB

免費

0下載

ngxtop Nginx訪問日志實時解析

陳文博
0.01 MB

2積分

1下載

bither-desktop bither的桌面客戶端

王煥鎖
2.66 MB

2積分

2下載

為什么我的電源會出現振鈴和過熱？

久醉不醒
14小時前

81 閱讀

無線鼠標主板，可以自己照著做嗎？

angel725
1天前

327 閱讀

【Vision Board創客營連載體驗】基于Vision Board的垃圾分類

大菠蘿Alpha
1天前

159 閱讀

【Vision Board創客營連載體驗】使用 Vision Board 做一個 UVC Camera

ouxiaolong
2天前

160 閱讀

【Vision Board創客營連載體驗】TinyMaix進行手寫數字識別

ouxiaolong
2天前

472 閱讀

推薦專欄
更多

華秋（原“華強聚豐”）：

電子發燒友

華秋開發

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業應用

LEDs

汽車電子

音視頻及家電

通信網絡

醫療電子

人工智能

虛擬現實

可穿戴設備

機器人

安全設備/系統

軍用/航空電子

移動通信

工業控制

便攜設備

觸控感測

物聯網

智能電網

區塊鏈

新科技

特色內容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

社區

小組

論壇

問答

評測試用

企業服務

產品

資料

文章

方案

企業

供應鏈服務

硬件開發

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務

網站廣告

在線研討會

活動策劃

新聞發布

新品發布

小測驗

設計大賽

華秋

關于我們

投資關系

新聞動態

加入我們

聯系我們

舉報投訴

社交網絡

微博

移動端

發燒友APP

硬聲APP

WAP

聯系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內容合作

黃晶晶：huangjingjing@elecfans.com

內容合作（海外）

張迎輝：mikezhang@elecfans.com

供應鏈服務 PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區合作

劉勇：liuyong@huaqiu.com

關注我們的微信

下載發燒友APP

電子發燒友觀察

電子工程師社區

1-32層PCB打樣·中小批量

元器件現貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業動態

聯系我們

企業文化

企業宣傳片

加入我們

版權所有 ? 湖南華秋數字科技有限公司
電子發燒友 （電路圖） 湘公網安備43011202000918 電信與信息服務業務經營許可證：合字B2-20210191 工商網監湘ICP備 2023018690 號

亚洲欧美日韩精品久久_久久精品AⅤ无码中文_日本中文字幕有码在线播放_亚洲视频高清不卡在线观看