圖2:總體研究結構框架

為什么工具學習是有益的?

一方面,將工具整合到LLMs中可以增強多個領域內的能力,即知識獲取、專業技能提升、自動化與效率以及交互增強。另一方面,采用工具學習范式可以增強響應的穩健性和生成過程的透明度,從而提高可解釋性和用戶信任度,以及改善系統的穩健性和適應性

  1. 知識獲取(Knowledge Acquisition)
    1. LLMs 的能力受限于預訓練期間學習的知識范圍,這些知識是固定的,不能動態更新。
    2. 通過集成外部工具,如搜索引擎、數據庫和知識圖譜、天氣或地圖工具,LLMs 能夠動態獲取和整合外部知識,從而提供更準確、與上下文相關的輸出。
  2. 專業知識增強(Expertise Enhancement)
    1. LLMs 在特定領域缺乏專業知識,例如復雜數學計算、編程和科學問題解決。
    2. 通過使用在線計算器、數學工具、Python解釋器等工具,LLMs 能夠執行復雜計算、解決方程式、分析統計數據,從而增強其在專業領域的能力。
  3. 自動化和效率(Automation and Efficiency)
    1. LLMs 本質上是語言處理器,缺乏獨立執行外部操作的能力,如預訂會議室或機票。
    2. 通過與外部工具集成,LLMs 可以自動化執行任務,如日程安排、設置提醒、過濾電子郵件等,提高實用性和用戶交互的效率。
  4. 交互增強(Interaction Enhancement)
    1. 用戶查詢具有多樣性和多模態性,LLMs 在理解不同類型輸入時面臨挑戰。
    2. 利用多模態工具和機器翻譯工具,LLMs 可以更好地理解和響應更廣泛的用戶輸入,優化對話管理和意圖識別。
  5. 增強的可解釋性和用戶信任(Enhanced Interpretability and User Trust)
    1. 當前LLMs的“黑箱”特性導致其決策過程對用戶不透明,缺乏可解釋性。
    2. 通過工具學習,LLMs可以展示決策過程的每一步,增加操作透明度,使用戶能夠快速識別和理解錯誤來源,增強對LLMs決策的信任。
  6. 改進的魯棒性和適應性(Improved Robustness and Adaptability)
    1. LLMs 對用戶輸入非常敏感,微小的變化可能導致響應的大幅變化,顯示出缺乏魯棒性。
    2. 集成專用工具可以減少對訓練數據中統計模式的依賴,提高對輸入擾動的抵抗力和對新環境的適應性。

如何實現工具學習?

圖3:使用大型語言模型進行工具學習的整體工作流程左側部分展示了工具學習的四個階段:任務規劃、工具選擇、工具調用和響應生成。右側部分展示了兩種工具學習范式:一步式任務解決的工具學習和迭代式任務解決的工具學習。

任務規劃(Task Planning )

  1. 任務規劃的重要性:
    1. 任務規劃是工具學習過程中的首要階段,它涉及對用戶查詢的全面分析,以理解用戶意圖。
    2. 用戶的問題往往包含復雜的意圖,需要被分解為多個可執行的子問題。
  2. 任務規劃的步驟:
    1. 任務分解:將用戶的問題分解為多個子問題,這有助于逐步解決復雜問題。
    2. 依賴關系和執行順序:確定子問題之間的依賴關系以及它們應該被執行的順序。
  3. 任務規劃的方法:
    1. 無需調整的方法(Tuning-free Methods):利用LLMs的內在能力,通過少量示例或零示例提示來實現任務規劃。例如,使用CoT(Chain of Thought)或ReACT等框架來引導LLMs逐步思考和規劃。
    2. 基于調整的方法(Tuning-based Methods):通過在特定任務上微調LLMs來提高任務規劃能力。例如,Toolformer等方法通過微調來增強LLMs對工具使用的意識和能力。

工具選擇(Tool Selection)

工具選擇的重要性:

工具選擇的分類:

  1. 基于檢索器的工具選擇(Retriever-based Tool Selection)
  2. 基于LLM的工具選擇(LLM-based Tool Selection)

工具選擇的方法:

工具調用(Tool Calling)

工具調用的重要性:

工具調用的步驟:

  1. 參數提取:LLMs必須能夠從用戶查詢中提取出符合工具描述中指定格式的參數。
  2. 調用工具:使用提取的參數向工具服務器發送請求,并接收響應。

工具調用的方法:

響應生成(Response Generation)

響應生成的重要性:

響應生成的方法:

  1. 直接插入方法(Direct Insertion Methods)
  2. 信息整合方法(Information Integration Methods)

信息整合的策略:

工具學習范式(Paradigms of Tool Learning)

工具學習范式:

  1. 一步任務解決(Tool Learning with One-step Task Solving):
  2. 迭代任務解決(Tool Learning with Iterative Task Solving):

范式的特點:

工具學習評估基準與指標

評估指標(Evaluation)

任務規劃評估(Task Planning Evaluation):

工具選擇評估(Tool Selection Evaluation):

工具調用評估(Tool Calling Evaluation):

響應生成評估(Response Generation Evaluation):

圖4:不同基準測試及其具體配置的詳細列表。符號①、②、③和④分別代表工具學習的四個階段——任務規劃、工具選擇、工具調用和響應生成

Tool Learning with Large Language Models: A Survey
https://arxiv.org/pdf/2405.17935
https://github.com/quchangle1/LLM-Tool-Surve

本文轉自微信公眾號@PaperAgent

上一篇:

AI Agent框架 - 7大認知框架全解析與代碼講解ai實現

下一篇:

7 款便捷好用的AI AP推薦
#你可能也喜歡這些API文章!

我們有何不同?

API服務商零注冊

多API并行試用

數據驅動選型,提升決策效率

查看全部API→
??

熱門場景實測,選對API

#AI文本生成大模型API

對比大模型API的內容創意新穎性、情感共鳴力、商業轉化潛力

25個渠道
一鍵對比試用API 限時免費

#AI深度推理大模型API

對比大模型API的邏輯推理準確性、分析深度、可視化建議合理性

10個渠道
一鍵對比試用API 限時免費