我們可以將其提供給GPT-4V,以提出后續(xù)問題或綜合一致的回答:

示例2:多模態(tài)RAG查詢

? ? ? 我們提出了一個問題,并從整個多模態(tài)RAG pipeline中得到回應(yīng)。SimpleMultiModalQueryEngine首先檢索相關(guān)圖像/文本集,并將其輸入給視覺模型,以便合成響應(yīng)。

from llama_index.query_engine import SimpleMultiModalQueryEngine
query_engine = index.as_query_engine( multi_modal_llm=openai_mm_llm, text_qa_template=qa_tmpl)
query_str = "Tell me more about the Porsche"response = query_engine.query(query_str)

         生成的結(jié)果+來源如下所示:

參考文獻(xiàn):

[1] https://blog.llamaindex.ai/multi-modal-rag-621de7525fea

[2]?https://github.com/run-llama/llama_index/blob/main/docs/examples/multi_modal/llava_multi_modal_tesla_10q.ipynb

文章轉(zhuǎn)自微信公眾號@ArronAI

上一篇:

LLM之RAG實戰(zhàn)(四):Self-RAG如何革命工業(yè)LLM

下一篇:

LLM之RAG實戰(zhàn)(十)| 如何構(gòu)建一個RAG支持的聊天機(jī)器人,包括聊天、嵌入和重排序
#你可能也喜歡這些API文章!

我們有何不同?

API服務(wù)商零注冊

多API并行試用

數(shù)據(jù)驅(qū)動選型,提升決策效率

查看全部API→
??

熱門場景實測,選對API

#AI文本生成大模型API

對比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力

25個渠道
一鍵對比試用API 限時免費(fèi)

#AI深度推理大模型API

對比大模型API的邏輯推理準(zhǔn)確性、分析深度、可視化建議合理性

10個渠道
一鍵對比試用API 限時免費(fèi)