日本高清一二三区,欧美成人片在线,国产一级免费片

RAG 系統的核心在于如何高效地檢索相關文檔并生成高質量的文本。為了實現這一點，RAG 系統通常包括以下兩個階段：

檢索階段

在檢索階段，系統根據輸入的問題從知識庫中尋找相關信息。知識庫可以是一個結構化的數據集，也可以是大量文檔的集合。通過關鍵詞匹配或向量相似度計算，RAG 系統能夠快速找到與問題相關的文檔。這一過程的準確性直接影響到生成階段的效果。

生成階段

在獲取到相關文檔后，RAG 系統將這些信息輸入到大語言模型中，生成最終的回答。大語言模型通過結合用戶問題和檢索到的文檔，生成符合邏輯且詳細的回答。這一過程需要模型具備強大的理解和生成能力。

基于 Doubao 的系統構建

火山引擎提供的豆包（Doubao）模型是一種強大的大語言模型，適用于 RAG 系統的構建。通過火山引擎的云搜索服務與豆包模型的結合，可以搭建出高效的智能問答平臺。

豆包模型示意圖

云搜索服務配置

在火山引擎的平臺上，首先需要配置云搜索服務。這一步驟包括創建 OpenSearch 實例，配置 CPU/內存比例，并啟用語義嵌入模型。通過這些配置，可以確保系統具備高效的信息檢索能力。

豆包模型部署

在完成云搜索服務的配置后，接下來是豆包模型的部署。在火山引擎方舟控制臺中，可以創建模型推理接入點，選擇適合的豆包模型版本，并獲取 API Key。這些配置將用于后續的推理服務調用。

向量化知識庫的創建

為了提高檢索效率，RAG 系統通常會將文檔轉化為向量存儲在知識庫中。向量化的過程包括將文檔分塊、轉換為向量，并存儲到數據庫中。

文檔分塊與向量化

文檔的分塊可以根據段落、句子等粒度進行，分塊后的文檔塊通過 Embedding 模型轉化為向量。將這些向量存儲在 Elasticsearch 等數據庫中，可以大大提高檢索效率和準確性。

向量化示意圖

from langchain_elasticsearch import ElasticsearchStore

elastic_vector_search = ElasticsearchStore(
    embedding=embeddings,
    index_name="langchain_index",
    es_url=ES_URL,
    es_api_key=ES_API_KEY,
)

檢索與生成

一旦用戶提交問題，RAG 系統將問題轉化為向量，并在知識庫中進行相似度檢索。檢索到的文檔將與用戶問題組合生成新的 prompt，輸入到豆包模型中生成回答。

retriever = elastic_vector_search.as_retriever(
    search_type="similarity_score_threshold",
    search_kwargs={"score_threshold": 0.6, "k": 3}
)

retrieved_documents = retriever.invoke("新興項目與突破")