如果你只想對 AI Agent 有個大致了解,那么讀到這兒再加上面這幅用windsurf生成的網(wǎng)頁總結(jié)圖,應(yīng)該就能有個初步認(rèn)識了。不想花太多時間閱讀下面文字的朋友建議往上翻,聽上面論文概述前的音頻解讀,感興趣的朋友可以繼續(xù)往下看。

二、核心概念與定義

論文首先將AI Agents定位為基于大型語言模型(LLM)和大型圖像模型(LIM),通過工具集成(如API調(diào)用、函數(shù)調(diào)用)、提示工程和增強的推理能力,實現(xiàn)特定、狹窄任務(wù)自動化的系統(tǒng)。它們是生成式AI(作為前體,主要負(fù)責(zé)內(nèi)容生成)在任務(wù)執(zhí)行能力上的延伸,強調(diào)單體智能體的自主性對外部工具的調(diào)用以完成明確定義的功能。我們可以把AI Agents想象成 “單個的、能使用工具的智能助手”,它們有 “感知”(接收信息)、“思考”(處理信息)和“行動”(執(zhí)行任務(wù)) 這些核心能力,擅長處理特定、界限清晰的任務(wù)。

與此相對,Agentic AI被描繪為一個更高級、更復(fù)雜的范式轉(zhuǎn)變。它代表了由多個專業(yè)化AI代理組成的協(xié)作系統(tǒng),這些AI代理能夠共同分解復(fù)雜目標(biāo)、動態(tài)分配子任務(wù)、通過共享記憶(如持久化記憶、情景記憶)進行通信和協(xié)調(diào),并由編排層(或元智能體)進行管理,以實現(xiàn)更宏大的、開放式的目標(biāo)。Agentic AI 強調(diào)的是系統(tǒng)級的、涌現(xiàn)的智能,以及在動態(tài)環(huán)境中的適應(yīng)性和魯棒性。 它更像是一個由多個具備專長、能互相協(xié)作的智能助手組成的“團隊”,它們可以一起解決更復(fù)雜、更大范圍的問題。

論文中的智能家居示意圖

為了幫助讀者更好地理解AI Agents和Agentic AI的區(qū)別,論文中通過智能家居系統(tǒng)類比的方式,形象地對比了 AI Agent 和 Agentic AI 的概念區(qū)別。左側(cè)展示了一個傳統(tǒng)的 AI Agent(智能恒溫器),它執(zhí)行一個獨立的、特定任務(wù)。右側(cè)展示了一個 Agentic AI 系統(tǒng)(綜合智能家居生態(tài)系統(tǒng)),其中多個專業(yè)化智能體協(xié)同工作,共同實現(xiàn)更復(fù)雜的、高層次的目標(biāo)。這張圖體現(xiàn)了從任務(wù)特定的自動化到自適應(yīng)、協(xié)調(diào)智能的架構(gòu)和功能上的飛躍。

對于已經(jīng)接觸過Agent產(chǎn)品的朋友來說,判斷一個系統(tǒng)是AI Agents 還是 Agentic AI,可以通過以下幾個關(guān)鍵問題來判斷:

  1. 系統(tǒng)是單個AI代理在工作,還是多個AI代理在協(xié)作?

? AI Agents: 通常是單個AI代理(或表現(xiàn)為單個實體)執(zhí)行任務(wù),即使它內(nèi)部可能調(diào)用了多個工具或模塊。

? Agentic AI: 核心特征是多個、專業(yè)化的AI代理協(xié)同工作,它們之間有明確的通信、協(xié)調(diào)和任務(wù)分配。

  1. 系統(tǒng)是否存在一個明確的“編排層”或“元智能體”來管理其他AI代理?

? AI Agents: 一般不涉及復(fù)雜的編排,任務(wù)流相對直接。

? Agentic AI: 通常會有一個編排層 (Orchestration Layer) 或元智能體 (Meta-Agent) 來協(xié)調(diào)不同AI代理的活動、分配任務(wù)、管理依賴。

  1. 任務(wù)的復(fù)雜性和目標(biāo)是如何定義的?

? AI Agents: 傾向于處理定義明確、范圍較窄的自動化任務(wù)。

? Agentic AI: 旨在解決復(fù)雜、高層次、甚至可能是開放式的目標(biāo),通常需要將大目標(biāo)動態(tài)分解為子任務(wù)。

  1. 系統(tǒng)是否強調(diào)“持久化記憶”和“共享上下文”供多個組件/AI代理使用?

? AI Agents: 可能有會話內(nèi)記憶或工具緩存,但一般不強調(diào)跨多個任務(wù)周期或多個獨立實體的持久化、共享記憶。

? Agentic AI: 持久化記憶(如情景、語義、向量記憶)和共享上下文是關(guān)鍵組成部分,以支持AI代理間的協(xié)作和長期學(xué)習(xí)。

  1. “協(xié)作”、“通信”、“動態(tài)任務(wù)分配”是系統(tǒng)的核心機制嗎?

而對于沒有實際接觸過 Agent 的朋友來說,可能理解起來還是會有些困難。沒關(guān)系,我們繼續(xù)往下看,論文中結(jié)合日常生活工作中我們熟悉的例子,對 AI Agents 和 Agentic AI 的概念進行了一些說明。

擴展思考:按照以上概念定義,Dify 和 Manus 是 AI Agents 還是 Agentic AI?請在評論區(qū)分享你的看法。

三、AI Agents 和 Agentic AI 的典型應(yīng)用場景

論文的第四章節(jié)中,作者將AI Agents和Agentic AI的應(yīng)用分成了八個核心應(yīng)用領(lǐng)域:

論文中的應(yīng)用場景圖

AI代理 (AI Agents)的四個應(yīng)用領(lǐng)域

  1. 客戶支持自動化和企業(yè)內(nèi)部搜索 (Automation for Customer Support & Internal Enterprise Search):簡單來說,它就像一個非常聰明的自動化客服或公司內(nèi)部的“活字典”。在客戶服務(wù)方面,它們能理解客戶的問題(比如“我的訂單到哪兒了?”或者“怎么退貨?”),然后連接到公司的系統(tǒng)(比如訂單數(shù)據(jù)庫),自動找到答案并回復(fù)客戶。它們甚至能幫你發(fā)起退貨流程。
    在公司內(nèi)部,你可以用自然語言(就像平時說話一樣)問它們問題(比如“上次會議的關(guān)鍵決定是什么?”或者“去年的銷售報告在哪里?”),它們能快速搜索并提供相關(guān)文檔或總結(jié)。
  2. 電子郵件過濾和優(yōu)先級劃分 (Email Filtering and Prioritization):簡單來說,它就像一個非常高效的智能郵件助理。
    它們能自動幫你整理收件箱里的大量郵件。通過分析郵件的內(nèi)容、發(fā)件人等信息,它們可以判斷郵件的緊急程度,幫你自動打上標(biāo)簽(比如“重要”、“待辦”、“低優(yōu)先級”),或者提煉出郵件里的關(guān)鍵任務(wù)。
  3. 個性化內(nèi)容推薦、基本數(shù)據(jù)分析和報告 (Personalized Content Recommendation, Basic Data Analysis and Reporting):簡單來說,它們是你的專屬“猜你喜歡”專家和簡單的“數(shù)據(jù)分析師”。
    在像亞馬遜、YouTube、Spotify 這樣的平臺,它們會學(xué)習(xí)你的瀏覽、點擊、購買、收聽習(xí)慣,然后給你推薦你可能感興趣的商品、視頻或音樂。
    在商業(yè)分析工具中,你可以用簡單的話(比如“告訴我上季度哪個地區(qū)的銷售額最高”)向它們提問,它們能自動把你的問題轉(zhuǎn)換成查詢,然后生成報告或圖表給你看。
  4. 自主日程安排助手 (Autonomous Scheduling Assistants):簡單來說,它們是能自己幫你安排會議的智能秘書。
    它們可以連接到你的日歷,理解你模糊的指令(比如“下周找個時間跟李總開個短會”)。它們會自動查看所有相關(guān)人員的日歷,找到大家都有空的時間,避開沖突,然后幫你發(fā)出會議邀請。它們還能學(xué)習(xí)你的偏好,比如你不喜歡在周五下午開會。

智能體 AI(Agentic AI)的四個應(yīng)用領(lǐng)域

  1. 多智能體研究助手 (Multi-Agent Research Assistants):簡單來說,它們就像一個由多個AI專家組成的“研究團隊”。
    當(dāng)你要做一個復(fù)雜的研究項目或撰寫一份詳細(xì)報告時,這個系統(tǒng)會派出不同的AI智能體:一個可能去互聯(lián)網(wǎng)或數(shù)據(jù)庫里搜索所有相關(guān)的文獻,另一個閱讀并總結(jié)這些文獻的要點,還有一個可能負(fù)責(zé)把信息整合起來,幫你起草報告或論文的某個部分。它們之間會互相交流和協(xié)作。
  2. 智能機器人協(xié)調(diào) (Intelligent Robotics Coordination):簡單來說,它就像一個能指揮一群不同機器人協(xié)同工作的“總指揮”。
    在工廠、倉庫或農(nóng)場等地方,可能需要很多不同類型的機器人一起完成任務(wù)。比如,在智能倉庫里,有的機器人負(fù)責(zé)揀貨,有的負(fù)責(zé)運輸,有的負(fù)責(zé)清點庫存。Agentic AI系統(tǒng)能協(xié)調(diào)這些機器人,動態(tài)分配任務(wù),優(yōu)化它們的工作流程,讓它們像一個有機的整體一樣高效運作。
  3. 協(xié)作醫(yī)療決策支持 (Collaborative Medical Decision Support):簡單來說,它們就像一個由多個AI醫(yī)療專家組成的“臨床會診團隊”。
    在醫(yī)院,特別是情況復(fù)雜的重癥監(jiān)護室(ICU),Agentic AI系統(tǒng)可以整合不同AI智能體的分析結(jié)果:一個智能體可能分析病人的生命體征和各種檢測數(shù)據(jù),尋找早期預(yù)警信號;另一個可能快速查詢病人的所有病史、用藥史等;還有一個可能根據(jù)最新的醫(yī)學(xué)指南,結(jié)合當(dāng)前病情,提出診斷或治療的建議方案。這些智能體互相驗證、補充信息,幫助醫(yī)生做出更準(zhǔn)確、更安全的臨床決策。
  4. 多智能體博弈AI和自適應(yīng)工作流程自動化 (Multi-Agent Game AI & Adaptive Workflow Automation):簡單來說,這類系統(tǒng)既能創(chuàng)造出行為更復(fù)雜、更智能、能互相影響的游戲角色,也能用來處理企業(yè)里那些非常復(fù)雜、需要多種專業(yè)判斷、能根據(jù)情況靈活調(diào)整的工作流程。
    在游戲里,它們讓非玩家角色(NPC)的行為更自然、更有故事性,能根據(jù)玩家的行動動態(tài)調(diào)整自己的策略。在企業(yè)里,比如處理一個復(fù)雜的法律案件,或者應(yīng)對一個突發(fā)的網(wǎng)絡(luò)安全威脅,Agentic AI系統(tǒng)可以調(diào)動不同的AI智能體:一個智能體分析法律文件,另一個智能體查詢相關(guān)法規(guī);或者一個智能體識別網(wǎng)絡(luò)攻擊類型,另一個智能體評估影響范圍,還有一個模擬應(yīng)對措施。它們協(xié)同工作,自動完成大部分分析和初步?jīng)Q策,并且能根據(jù)情況變化動態(tài)調(diào)整應(yīng)對策略。

當(dāng)然,隨著AI技術(shù)的不斷發(fā)展,AI Agents和Agentic AI的應(yīng)用范圍及它們所能發(fā)揮的作用也會不斷擴大。

四、從 AI Agents 向 Agentic AI 的演進

AI Agents 的架構(gòu)演進

前面我們提到過,AI Agents 善于處理定義明確、范圍較窄的自動化任務(wù),而 Agentic AI 則擅長解決復(fù)雜、高層次、甚至可能是開放式的目標(biāo),通常需要將大目標(biāo)動態(tài)分解為子任務(wù),從前者向后者的演進過程中,架構(gòu)的變化是非常明顯的。

論文中的架構(gòu)演進圖

具體來說,這種演進體現(xiàn)在以下幾個關(guān)鍵方面:

  1. 從單體到團隊架構(gòu): 傳統(tǒng)的 AI Agents 通常是單一實體系統(tǒng),專注于執(zhí)行特定任務(wù)。而 Agentic AI 系統(tǒng)由多個、專業(yè)化的AI代理組成一個協(xié)同工作的“團隊”。
  2. 引入“總指揮”(Orchestration): Agentic AI 系統(tǒng)增加了一個或多層協(xié)調(diào)層或“總指揮”智能體。這個“總指揮”負(fù)責(zé)分配任務(wù)、管理依賴關(guān)系以及協(xié)調(diào)團隊中各個AI代理的活動,而這是傳統(tǒng) AI Agents 所沒有的。
  3. 增強的規(guī)劃與記憶能力: Agentic AI 引入了更高級的推理和規(guī)劃機制,使其能夠?qū)?fù)雜的整體目標(biāo)分解為更小、可管理的子任務(wù),并動態(tài)調(diào)整計劃。同時,它們具備持久的記憶架構(gòu)(包括情景記憶、語義記憶等),使得AI代理能夠在跨任務(wù)或跨會話時保留上下文和知識,實現(xiàn)更長時間內(nèi)的連貫性。傳統(tǒng) AI Agents 的記憶和規(guī)劃能力相對有限,或僅限于特定任務(wù)內(nèi)部。
  4. 強調(diào)協(xié)作與共享: 在 Agentic AI 中,AI代理之間可以相互溝通、共享信息和工作成果,共同推動任務(wù)進展。這種多智能體協(xié)作是 Agentic AI 區(qū)別于獨立 AI Agents 的核心特征。相信 Google 正是看到了這種多智能體協(xié)作的潛力,才提出了 A2A 協(xié)議。

上圖所展示的論文演進圖就是這種架構(gòu)演進的直觀體現(xiàn)。它展示了從傳統(tǒng) AI Agents 的感知、推理、行動核心模塊,擴展到 Agentic AI 中包含專業(yè)化AI代理、高級推理與規(guī)劃、持久記憶和協(xié)調(diào)層等更復(fù)雜的組件。這些新組件共同促成了多AI代理協(xié)作、任務(wù)分解、共享上下文和系統(tǒng)協(xié)調(diào)等新興能力。

AI Agents 和 Agentic AI 的主要挑戰(zhàn)

(a)展示了AI Agents的局限性,如因果缺陷、淺層推理等,而(b)則強調(diào)了 Agentic AI 系統(tǒng)中被放大的協(xié)調(diào)和穩(wěn)定性挑戰(zhàn)。

對于傳統(tǒng) AI Agents,主要的挑戰(zhàn)包括:
. 繼承自大型語言模型的局限性:例如,它們?nèi)菀桩a(chǎn)生**“幻覺”**(生成看似合理但不準(zhǔn)確的信息),對提示詞非常敏感,推理能力可能比較淺顯,計算成本和延遲較高,知識更新不及時,還可能存在數(shù)據(jù)帶來的偏見。
. 缺乏因果理解能力:AI Agents 主要依靠統(tǒng)計關(guān)聯(lián),難以理解真正的因果關(guān)系,這導(dǎo)致它們在面對與訓(xùn)練數(shù)據(jù)不同的情況時表現(xiàn)不穩(wěn)定。
. 有限的長遠規(guī)劃和恢復(fù)能力:它們在執(zhí)行復(fù)雜、多步驟任務(wù)時表現(xiàn)不佳,難以進行魯棒的長遠規(guī)劃,當(dāng)子任務(wù)失敗或結(jié)果不明確時,缺乏有效的恢復(fù)機制。
. 不完整的智能體屬性:雖然被稱為“智能體”,但它們在自主性、主動性、反應(yīng)性和社交能力等方面往往不完善,通常仍依賴外部指導(dǎo)才能有效運作。

對于Agentic AI系統(tǒng),由于涉及多個AI代理的協(xié)作,其挑戰(zhàn)往往是傳統(tǒng)AI Agents問題的放大,并引入了新的復(fù)雜性:
. 因果問題被放大:單個AI代理的因果理解不足會導(dǎo)致整個系統(tǒng)中出現(xiàn)AI代理間的級聯(lián)錯誤,一個AI代理的錯誤輸出可能會污染后續(xù)所有AI代理的決策。
. 通信和協(xié)調(diào)瓶頸:AI代理團隊需要精確的協(xié)調(diào)、同步執(zhí)行和強大的通信協(xié)議,但目前的實現(xiàn)在這方面存在不足,如目標(biāo)理解不一致、通信協(xié)議不規(guī)范、資源競爭等問題。
. 涌現(xiàn)行為和不可預(yù)測性:多個AI代理的交互可能產(chǎn)生系統(tǒng)層面的復(fù)雜“涌現(xiàn)行為”,這些行為難以預(yù)測和控制,可能導(dǎo)致意外結(jié)果甚至安全風(fēng)險。
. 擴展性和調(diào)試復(fù)雜性高:隨著AI代理數(shù)量和角色多樣性的增加,Agentic AI 系統(tǒng)的可靠性和可解釋性變得非常復(fù)雜。AI代理之間的黑箱推理鏈和異步交互使得追蹤錯誤根源異常困難。

關(guān)鍵解決方案及未來展望

論文中的解決方案圖

針對以上的挑戰(zhàn),論文中提出了以下解決方案:

  1. 檢索增強生成 (RAG): 通過從外部數(shù)據(jù)源檢索相關(guān)信息來增強 LLM 輸出,減少幻覺,擴展知識,為代理提供實時、可靠的信息。在Agentic AI中,RAG 可作為共享基礎(chǔ)機制,幫助代理保持共享真相,增強目標(biāo)一致性,減少代理間信息傳播不一致。
  2. 工具增強推理 (函數(shù)調(diào)用): 使代理能夠與外部系統(tǒng)(API、數(shù)據(jù)庫、腳本)交互,將 LLMs 從靜態(tài)預(yù)測器轉(zhuǎn)變?yōu)榻换ナ絾栴}解決者。在Agentic AI中,函數(shù)調(diào)用支持代理層面的自主性和角色分化,使代理能夠執(zhí)行領(lǐng)域特定操作,增強協(xié)調(diào)管道的流暢性。
  3. 代理循環(huán): 推理、行動、觀察 (ReAct): 引入迭代循環(huán),代理推理任務(wù)、調(diào)用工具行動、觀察結(jié)果,然后繼續(xù)。這使得代理行為更深思熟慮、上下文敏感。在 Agentic AI 中,ReAct對協(xié)作一致性至關(guān)重要,代理可動態(tài)評估依賴關(guān)系,適應(yīng)環(huán)境變化
  4. 記憶架構(gòu) (情景記憶、語義記憶、向量記憶): 通過持久化信息來解決長期規(guī)劃和會話連續(xù)性問題。情景記憶記錄行動和反饋,語義記憶編碼領(lǐng)域知識,向量記憶支持相似性檢索。Agentic AI需要更復(fù)雜的記憶模型來管理分布式狀態(tài)和跨代理共享知識,支持長期系統(tǒng)級規(guī)劃
  5. 多代理編排與角色專業(yè)化: 將復(fù)雜任務(wù)分解為子組件并分配給專業(yè)化代理,通過元代理或編排器協(xié)調(diào)這些代理的生命周期、管理依賴、分配角色、解決沖突。這增強了可解釋性、可伸縮性和故障隔離。
  6. 反射和自我批評機制: 使代理能夠?qū)ψ约旱妮敵鲞M行自我評估或互相評估。ReFlexion 等機制提高了魯棒性,減少了錯誤率,支持迭代改進和自適應(yīng)再規(guī)劃。
  7. 程序化提示工程管道: 自動化提示生成過程,使用任務(wù)模板、上下文填充器和檢索增強變量,提高泛化能力,減少提示變異導(dǎo)致的失敗模式。在 Agentic AI 中,這有助于實現(xiàn)可伸縮、角色一致的通信,自動化消息格式化和依賴跟蹤。
  8. 因果建模和基于模擬的規(guī)劃: 將因果推理嵌入代理中,使其能夠區(qū)分相關(guān)性和因果關(guān)系,模擬干預(yù),進行更魯棒的規(guī)劃。在 Agentic AI 中,因果推理對于安全協(xié)調(diào)和錯誤恢復(fù)至關(guān)重要,代理需預(yù)測其行動對其他代理的影響。結(jié)構(gòu)化規(guī)劃方法(如 STRIPS, PDDL)可用于治理合作行為
  9. 監(jiān)控、審計和可解釋性管道: 記錄代理行為(提示、工具調(diào)用、記憶更新、輸出)以進行事后分析、性能調(diào)優(yōu)、追蹤故障。在Agentic AI中,跨代理的審計跟蹤對于識別錯誤源和條件至關(guān)重要
  10. 治理感知架構(gòu) (問責(zé)制和角色隔離): 引入基于角色的訪問控制、沙箱、身份解析等機制,確保代理行為符合范圍,決策可審計、可撤銷。這減少了高風(fēng)險應(yīng)用中的風(fēng)險。在 Agentic AI 中,治理需跨角色、代理、工作流進行,確保安全、可信的協(xié)作環(huán)境。

此外,論文還提出了一個變革性的方向,對AI Agents和Agentic AI都有影響。Absolute Zero: Reinforced Self-play Reasoning with Zero Data (AZR) 框架,這是一個通過強化自我博弈推理(Reinforced Self-play Reasoning)實現(xiàn)“零數(shù)據(jù)(Zero Data)”學(xué)習(xí)的范式。該框架使AI代理能夠自主生成、驗證和解決自己的任務(wù),通過可驗證的反饋機制(例如代碼執(zhí)行)來鞏固學(xué)習(xí)。這為Agentic AI 系統(tǒng)中的AI代理實現(xiàn)共同進化、知識細(xì)化和任務(wù)靈活性奠定了基礎(chǔ)。關(guān)于AZR框架的詳細(xì)介紹,我在arxiv.org上找到了一篇論文,感興趣的朋友可以通過文后鏈接去找來讀讀。

五、最后嘮叨兩句

所以啊,今天跟大家‘叨叨’了這么多,其實就是想把這兩個概念掰扯清楚。現(xiàn)在回過頭看,AI Agent就像個能干的‘單兵尖兵’,而Agentic AI則更像一支配合默契的‘特種部隊’。從‘單兵’到‘部隊’,這條路肯定不好走,坑也不少,但想想未來那些聰明絕頂?shù)腁I系統(tǒng)能幫我們搞定那么多復(fù)雜的事兒,還是挺讓人激動的,不是嗎?不知道大家看完有啥想法,歡迎一起聊聊!

以上是我今天分享的內(nèi)容,如果你覺得內(nèi)容還算有用,或?qū)δ阌幸欢◣椭瑲g迎留言或?qū)⒈疚霓D(zhuǎn)發(fā)給你身邊的朋友。

引用鏈接

[1] 《AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges》: https://arxiv.org/pdf/2505.10468
[2] 一篇論文: https://arxiv.org/abs/2505.03335

文章轉(zhuǎn)載自:深度長文 | 康奈爾最新論文:你真的了解AI Agent嗎?

上一篇:

200行python代碼實現(xiàn)LLM

下一篇:

Cursor入門:MCP開發(fā)調(diào)用和項目實戰(zhàn)
#你可能也喜歡這些API文章!

我們有何不同?

API服務(wù)商零注冊

多API并行試用

數(shù)據(jù)驅(qū)動選型,提升決策效率

查看全部API→
??

熱門場景實測,選對API

#AI文本生成大模型API

對比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力

25個渠道
一鍵對比試用API 限時免費

#AI深度推理大模型API

對比大模型API的邏輯推理準(zhǔn)確性、分析深度、可視化建議合理性

10個渠道
一鍵對比試用API 限時免費