下面的例子就展示了 AI 智能體在產(chǎn)生回應(yīng)之前,會(huì)經(jīng)歷一系列的思考活動(dòng)。

在本文中,我們將通過深入剖析 ReAct 架構(gòu)設(shè)計(jì)模式,來揭開這個(gè)過程的神秘面紗,從而我們獲得了對(duì) AI 智能體行為的完全控制,使其更容易進(jìn)行優(yōu)化和故障排除。

一、ReAct 架構(gòu)設(shè)計(jì)剖析

1、ReAct 架構(gòu)設(shè)計(jì)模式描述

ReAct(即推理和行動(dòng))是一種 AI 智能體的架構(gòu)設(shè)計(jì)范式,AI 智能體使用鏈?zhǔn)酵评砗凸ぞ呤褂眯袆?dòng)來綜合運(yùn)用。

與其一步到位地生成直接答案,ReAct 智能體會(huì)逐步思考,并且可以在最終確定答案之前執(zhí)行中間行動(dòng)(比如:查找某件事或計(jì)算一個(gè)值)。

為了更清楚地了解這一點(diǎn),讓我們來思考一下 ReAct 架構(gòu)設(shè)計(jì)模式是如何工作的。

2、ReAct 示例描述

考慮在一個(gè)多智能體系統(tǒng)中構(gòu)建的一個(gè) AI 智能體的輸出:

在上面的例子中,我們看到了一個(gè)使用 ReAct 范式執(zhí)行任務(wù)的新聞報(bào)道 AI 智能體的實(shí)時(shí)追蹤。該 AI 智能體被要求創(chuàng)建一個(gè)與“Agent2Agent協(xié)議”相關(guān)的新聞標(biāo)題。然而,它并沒有急于下結(jié)論,而是如其結(jié)構(gòu)化的追蹤所示,逐步推理。

接下來我們拆解一下:

這是一個(gè)例子,說明了 ReAct 模式是如何鼓勵(lì) AI 智能體行為的透明性、準(zhǔn)確性和可驗(yàn)證性:對(duì)于那些需要處理真實(shí)世界信息的系統(tǒng)來說,這可是非常重要。

你可以想象,在多智能體系統(tǒng)中進(jìn)一步擴(kuò)展這個(gè)架構(gòu)設(shè)計(jì)模式:一個(gè)新聞收集者收集原始信息,一個(gè)事實(shí)驗(yàn)證者檢查可靠性,而這個(gè)新聞報(bào)道者構(gòu)建標(biāo)題,所有這些都通過推理和基于工具的行動(dòng)進(jìn)行異步協(xié)調(diào)。

3、為什么 ReAct 如此重要?

ReAct 被引入作為一個(gè)重大步驟,使基于 LLM 的 AI 智能體更加可靠和強(qiáng)大。

通過讓大模型解釋其思考過程并通過工具核實(shí)事實(shí),我們減少了幻覺和錯(cuò)誤傳播等問題。

Yao 等人最初的 ReAct 研究表明,這種方法可以通過讓大模型檢索真實(shí)信息(比如:查詢維基百科)來核實(shí)其事實(shí),從而克服問答中的幻覺。

它還提高了 AI 智能體決策過程的透明度,因?yàn)槲覀兛梢詸z查推理鏈以進(jìn)行調(diào)試或評(píng)估可信度。

總體而言,ReAct 架構(gòu)設(shè)計(jì)模式將一個(gè)被動(dòng)的 LLM 變成了一個(gè)積極的問題解決者,它可以分解復(fù)雜任務(wù)并與外部數(shù)據(jù)源互動(dòng),就像一個(gè)自主助手一樣。

這也解釋了為什么它幾乎在所有的 AI 智能體框架中都被廣泛使用。實(shí)際實(shí)現(xiàn)可能會(huì)有所不同,但一切都與 ReAct 架構(gòu)設(shè)計(jì)模式衍生出來的東西有關(guān)。

ReAct 工作流程如下:

二、推理 + 行動(dòng):ReAct 智能體的工作原理

ReAct 智能體在一個(gè)思考→行動(dòng)→觀察的循環(huán)中運(yùn)行,直到它找到解決方案或最終答案為止。

這類似于人類解決問題的方式:

我們思考要做什么,執(zhí)行一個(gè)行動(dòng)(比如:查找某件事或進(jìn)行計(jì)算), 觀察結(jié)果,然后將其納入我們的下一個(gè)思考中。

ReAct 框架使用提示詞工程來強(qiáng)制執(zhí)行這種結(jié)構(gòu)化的方法,交替大模型的思考和行動(dòng)/觀察。

下面是一個(gè) AI 智能體中 ReAct 循環(huán)的逐步分解:

這個(gè)思考/行動(dòng)/觀察循環(huán)重復(fù)進(jìn)行,允許 AI 智能體在需要時(shí)鏈接多個(gè)工具使用(搜索,然后可能是一個(gè)計(jì)算,然后另一個(gè)搜索等)。最終,AI 智能體決定它可以回答用戶。在這一點(diǎn)上,它不是輸出一個(gè)行動(dòng),而是輸出一個(gè)最終答案(有時(shí)在格式中標(biāo)記為答案:或最終答案)。在整個(gè)過程中,AI 智能體保持對(duì)話和它自己的中間步驟,這就是記憶的功能。

每個(gè)思考和觀察都可以被添加到對(duì)話上下文中,以便 LLM 記住到目前為止它已經(jīng)做了什么。

這對(duì)于連貫性至關(guān)重要。最終結(jié)果是,AI 智能體有效地規(guī)劃其方法,混合推理和行動(dòng)。

這種動(dòng)態(tài)方法比僵化的腳本或單輪回應(yīng)要靈活得多。它允許處理不可預(yù)見的子任務(wù),類似于人類在出現(xiàn)新信息時(shí)調(diào)整計(jì)劃的方式。

需要注意的是,所有這些“思考”和“行動(dòng)”注釋并不是 LLM 的神奇特性:它們來自我們?nèi)绾翁崾敬竽P汀?/p>

正如我們稍后將看到的,我們明確地指導(dǎo)大模型以這種結(jié)構(gòu)化的方式格式化其回應(yīng)。換句話說,ReAct 是通過精心設(shè)計(jì)的提示詞模板和解析邏輯實(shí)現(xiàn)的,而不是通過任何內(nèi)置的 LLM 能力。

LLM 是通過我們給它的例子和指令被引導(dǎo)表現(xiàn)得像一個(gè)推理和行動(dòng)的 AI 智能體。

文章轉(zhuǎn)載自:AI 智能體 ReAct 架構(gòu)設(shè)計(jì)模式剖析

上一篇:

連接mqtt與rest api:完整教程

下一篇:

揭示社交媒體API的力量
#你可能也喜歡這些API文章!

我們有何不同?

API服務(wù)商零注冊(cè)

多API并行試用

數(shù)據(jù)驅(qū)動(dòng)選型,提升決策效率

查看全部API→
??

熱門場(chǎng)景實(shí)測(cè),選對(duì)API

#AI文本生成大模型API

對(duì)比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力

25個(gè)渠道
一鍵對(duì)比試用API 限時(shí)免費(fèi)

#AI深度推理大模型API

對(duì)比大模型API的邏輯推理準(zhǔn)確性、分析深度、可視化建議合理性

10個(gè)渠道
一鍵對(duì)比試用API 限時(shí)免費(fèi)