亚洲精品女同一区二区三区,国内精品影院久久久久,精品成人免费视频

下面的例子就展示了 AI 智能體在產(chǎn)生回應(yīng)之前，會(huì)經(jīng)歷一系列的思考活動(dòng)。

在本文中，我們將通過深入剖析 ReAct 架構(gòu)設(shè)計(jì)模式，來揭開這個(gè)過程的神秘面紗，從而我們獲得了對(duì) AI 智能體行為的完全控制，使其更容易進(jìn)行優(yōu)化和故障排除。

一、ReAct 架構(gòu)設(shè)計(jì)剖析

1、ReAct 架構(gòu)設(shè)計(jì)模式描述

ReAct（即推理和行動(dòng)）是一種 AI 智能體的架構(gòu)設(shè)計(jì)范式，AI 智能體使用鏈?zhǔn)酵评砗凸ぞ呤褂眯袆?dòng)來綜合運(yùn)用。

與其一步到位地生成直接答案，ReAct 智能體會(huì)逐步思考，并且可以在最終確定答案之前執(zhí)行中間行動(dòng)（比如：查找某件事或計(jì)算一個(gè)值）。

為了更清楚地了解這一點(diǎn)，讓我們來思考一下 ReAct 架構(gòu)設(shè)計(jì)模式是如何工作的。

2、ReAct 示例描述

考慮在一個(gè)多智能體系統(tǒng)中構(gòu)建的一個(gè) AI 智能體的輸出：

在上面的例子中，我們看到了一個(gè)使用 ReAct 范式執(zhí)行任務(wù)的新聞報(bào)道 AI 智能體的實(shí)時(shí)追蹤。該 AI 智能體被要求創(chuàng)建一個(gè)與“Agent2Agent協(xié)議”相關(guān)的新聞標(biāo)題。然而，它并沒有急于下結(jié)論，而是如其結(jié)構(gòu)化的追蹤所示，逐步推理。

接下來我們拆解一下：

AI 智能體角色：新聞報(bào)道者–這個(gè) AI 智能體專門負(fù)責(zé)策劃和驗(yàn)證新聞內(nèi)容。
Task：該 AI 智能體被指示生成一個(gè)新聞標(biāo)題，并確保它與Agent2Agent協(xié)議相關(guān)。
Thought：該 AI 智能體首先內(nèi)部推理，它應(yīng)該通過快速搜索關(guān)于該協(xié)議的最新更新來驗(yàn)證信息。這是 ReAct 周期中的推理部分。
Action：它接著使用一個(gè)標(biāo)記為“搜索互聯(lián)網(wǎng)”的工具，傳遞一個(gè)結(jié)構(gòu)化的 JSON 輸入，查詢內(nèi)容為：“Agent2Agent 協(xié)議新聞 2023年11月”。這是 AI 智能體利用外部工具收集現(xiàn)實(shí)世界數(shù)據(jù)的行動(dòng)步驟。

Tool Output：它包含了搜索工具檢索到的結(jié)果–可能是新聞片段、文章摘要或相關(guān)網(wǎng)址。這展示了將結(jié)構(gòu)化思考和外部行動(dòng)結(jié)合起來的力量：AI 智能體不僅僅依賴大模型的內(nèi)部知識(shí)，而是通過工具進(jìn)行事實(shí)核查。

這是一個(gè)例子，說明了 ReAct 模式是如何鼓勵(lì) AI 智能體行為的透明性、準(zhǔn)確性和可驗(yàn)證性：對(duì)于那些需要處理真實(shí)世界信息的系統(tǒng)來說，這可是非常重要。

你可以想象，在多智能體系統(tǒng)中進(jìn)一步擴(kuò)展這個(gè)架構(gòu)設(shè)計(jì)模式：一個(gè)新聞收集者收集原始信息，一個(gè)事實(shí)驗(yàn)證者檢查可靠性，而這個(gè)新聞報(bào)道者構(gòu)建標(biāo)題，所有這些都通過推理和基于工具的行動(dòng)進(jìn)行異步協(xié)調(diào)。

3、為什么 ReAct 如此重要？

ReAct 被引入作為一個(gè)重大步驟，使基于 LLM 的 AI 智能體更加可靠和強(qiáng)大。

通過讓大模型解釋其思考過程并通過工具核實(shí)事實(shí)，我們減少了幻覺和錯(cuò)誤傳播等問題。

Yao 等人最初的 ReAct 研究表明，這種方法可以通過讓大模型檢索真實(shí)信息（比如：查詢維基百科）來核實(shí)其事實(shí)，從而克服問答中的幻覺。

它還提高了 AI 智能體決策過程的透明度，因?yàn)槲覀兛梢詸z查推理鏈以進(jìn)行調(diào)試或評(píng)估可信度。

總體而言，ReAct 架構(gòu)設(shè)計(jì)模式將一個(gè)被動(dòng)的 LLM 變成了一個(gè)積極的問題解決者，它可以分解復(fù)雜任務(wù)并與外部數(shù)據(jù)源互動(dòng)，就像一個(gè)自主助手一樣。

這也解釋了為什么它幾乎在所有的 AI 智能體框架中都被廣泛使用。實(shí)際實(shí)現(xiàn)可能會(huì)有所不同，但一切都與 ReAct 架構(gòu)設(shè)計(jì)模式衍生出來的東西有關(guān)。

ReAct 工作流程如下：

命令 LLM 逐步操作，
清晰地將思考與行動(dòng)分開，
確保工具的確定性輸入輸出行為，
并產(chǎn)生可檢查或調(diào)試的可追溯推理鏈。

二、推理 + 行動(dòng)：ReAct 智能體的工作原理

ReAct 智能體在一個(gè)思考→行動(dòng)→觀察的循環(huán)中運(yùn)行，直到它找到解決方案或最終答案為止。

這類似于人類解決問題的方式：

我們思考要做什么，執(zhí)行一個(gè)行動(dòng)（比如：查找某件事或進(jìn)行計(jì)算），觀察結(jié)果，然后將其納入我們的下一個(gè)思考中。

ReAct 框架使用提示詞工程來強(qiáng)制執(zhí)行這種結(jié)構(gòu)化的方法，交替大模型的思考和行動(dòng)/觀察。

下面是一個(gè) AI 智能體中 ReAct 循環(huán)的逐步分解：

Thought：AI 智能體（由 LLM 驅(qū)動(dòng)）分析用戶的查詢和內(nèi)部上下文，并以自然語(yǔ)言產(chǎn)生一個(gè)推理步驟。這通常不會(huì)顯示給最終用戶，但它是 AI 智能體規(guī)劃的一部分。例如：“問題要求一個(gè)國(guó)家的人口；我應(yīng)該使用網(wǎng)絡(luò)搜索來找到最新數(shù)字?！?/li>

Action：根據(jù)思考，AI 智能體決定要執(zhí)行的外部工具或操作。它輸出一個(gè)規(guī)定的格式來表示行動(dòng)。例如：行動(dòng)：WebSearch（”2023年加拿大人口”）。AI 智能體本質(zhì)上是通過名稱“調(diào)用”一個(gè)函數(shù)（工具），通常帶有一些輸入?yún)?shù)。

Observation：AI 智能體的環(huán)境（我們的代碼）執(zhí)行請(qǐng)求的行動(dòng)，并將結(jié)果（觀察）返回給 AI 智能體。例如，網(wǎng)絡(luò)搜索工具可能會(huì)返回：“觀察：2023年加拿大人口為3800萬(wàn)。”這個(gè)觀察結(jié)果被輸入到 AI 智能體的上下文中。

AI 智能體帶著新信息回到第一步（另一個(gè)思考）。它將用新數(shù)據(jù)進(jìn)行推理。在我們的例子中，它可能會(huì)想：“現(xiàn)在我有了人口數(shù)字；我可以回答問題了?！?/li>

這個(gè)思考/行動(dòng)/觀察循環(huán)重復(fù)進(jìn)行，允許 AI 智能體在需要時(shí)鏈接多個(gè)工具使用（搜索，然后可能是一個(gè)計(jì)算，然后另一個(gè)搜索等）。最終，AI 智能體決定它可以回答用戶。在這一點(diǎn)上，它不是輸出一個(gè)行動(dòng)，而是輸出一個(gè)最終答案（有時(shí)在格式中標(biāo)記為答案：或最終答案）。在整個(gè)過程中，AI 智能體保持對(duì)話和它自己的中間步驟，這就是記憶的功能。

每個(gè)思考和觀察都可以被添加到對(duì)話上下文中，以便 LLM 記住到目前為止它已經(jīng)做了什么。