Skip to content
字数
2005 字
阅读时间
8 分钟

Agent 和 RAG 是当前 AI 应用的两大核心范式,两者在概念定位和技术实现上有本质区别,但也常被结合使用。核心结论是:RAG 是“增强 AI 知识的工具”,解决 AI 知识过时、不准确的问题;Agent 是“赋予 AI 自主决策与行动能力的框架”,解决 AI 无法主动完成复杂任务的问题

关键区别总结

维度RAGAgent
核心定位知识增强工具,补充 LLM 外部知识自主行动框架,赋予 LLM 决策与执行能力
核心目标提升回答的准确性、时效性、专业性完成复杂、多步骤的任务
流程特性固定流程(检索→融合→生成),无决策环节动态流程(规划→执行→反馈→调整),决策贯穿全程
LLM 角色仅负责“基于知识生成回答”,被动执行作为“大脑”,负责规划、决策、判断,主动驱动
关键依赖向量数据库、文档处理技术任务规划算法、工具生态、记忆机制
典型应用企业知识库问答、产品手册查询、学术论文问答自动数据分析报告、智能办公助手、代码生成与调试

一、概念区别:定位与核心目标完全不同

1. RAG(检索增强生成):“知识增强工具”

  • 核心定位:为 LLM 补充“外部知识”的技术方案,本质是一种“知识增强手段”
  • 核心目标:解决 LLM 本身的两大缺陷——
    • 知识固化:训练数据截止到某个时间点,无法获取实时/最新知识(如 2025 年的新政策)。
    • 知识不准确:对特定领域(如企业内部文档、专业论文)的知识储备不足,易产生“幻觉”。
  • 核心逻辑:用户提问时,先从外部知识库(如文档库、数据库)中检索出与问题相关的信息,再将这些信息与问题一起传给 LLM,让 LLM 基于“检索到的准确知识”生成回答。
  • 类比:相当于给 LLM 配了一个“实时可查的参考书”,回答问题前先翻书找依据。

2. Agent(智能代理):“自主决策行动框架”

  • 核心定位:赋予 LLM “自主规划、决策、调用工具完成复杂任务”能力的框架,本质是一种“任务执行范式”。
  • 核心目标:解决 LLM 只能“被动回答问题”的缺陷,让 AI 能主动拆解复杂任务、选择工具、执行步骤,甚至根据结果调整策略。
  • 核心逻辑:接收用户的复杂目标(如“写一份 2025 年 AI 行业报告”),通过 LLM 完成:
    1. 任务规划:将目标拆解为子步骤(如“收集 2025 年 AI 行业数据→分析关键趋势→撰写报告框架→填充内容”)。
    2. 工具选择:根据子步骤选择合适工具(如用搜索引擎查数据、用 Excel 工具分析数据、用文档工具写报告)。
    3. 执行与反馈:调用工具执行,获取结果后判断是否需要调整步骤(如数据不足则重新检索),直到完成最终目标。
  • 类比:相当于给 LLM 配了一个“大脑+手脚”,能主动思考“怎么做”并动手执行,而不是只被动回应“是什么”。

二、技术实现区别:核心组件与流程完全不同

1. RAG 的技术实现:围绕“知识检索与融合”构建

RAG 的核心是“检索到准确知识并传递给 LLM”,技术流程高度固定,组件聚焦“知识处理”。

核心组件
  • 文档处理模块:负责加载(如 PDF/网页解析)、分割(将长文档切为短片段)、向量化(生成文本嵌入向量)。
  • 向量数据库:存储文档向量,提供高效的相似性检索能力(根据用户查询向量找最相关的文档片段)。
  • 检索模块:接收用户查询,生成查询向量,从向量数据库中检索 Top K 相关文档。
  • Prompt 融合模块:将检索到的文档片段与用户查询拼接为“带知识的 Prompt”,传给 LLM。
  • LLM 生成模块:基于融合后的 Prompt 生成回答。
典型流程
mermaid
graph TD
    A[用户提问] --> B[生成查询向量]
    B --> C[向量数据库检索相关文档]
    C --> D[拼接“查询+文档”为 Prompt]
    D --> E[LLM 基于 Prompt 生成回答]
    E --> F[返回结果]

2. Agent 的技术实现:围绕“自主决策与工具调用”构建

Agent 的核心是“让 LLM 具备自主能力”,技术流程动态可变,组件聚焦“任务管理与工具交互”。

核心组件
  • 任务规划器(Planner):由 LLM 承担,负责将复杂目标拆解为可执行的子任务序列(如用 Chain of Thought 思维链引导拆解)。
  • 工具库(Toolkit):包含 Agent 可调用的各类工具,如搜索引擎(Google)、数据库(SQL)、代码执行器(Python REPL)、RAG 系统、文件操作工具等。
  • 工具调用器(Tool Caller):解析 LLM 的决策结果,调用对应工具的 API,获取执行结果。
  • 反馈与记忆模块(Memory & Feedback):存储任务执行历史(如已完成的子步骤、工具返回结果),供 LLM 调整后续策略;部分 Agent 还支持用户反馈修正。
  • 决策中枢(LLM):作为 Agent 的“大脑”,统筹任务规划、工具选择、结果判断,是 Agent 的核心驱动。
典型流程
mermaid
graph TD
    A[用户提出复杂目标] --> B[LLM 拆解为子任务序列]
    B --> C[LLM 选择当前子任务所需工具]
    C --> D[调用工具执行,获取结果]
    D --> E[LLM 判断结果是否满足需求?]
    E -- 否 --> F[调整子任务/工具,重新执行]
    E -- 是 --> G[执行下一个子任务]
    G --> H[所有子任务完成?]
    H -- 否 --> C
    H -- 是 --> I[LLM 整合结果,生成最终输出]

三、常见关联:Agent 常集成 RAG 作为工具

两者并非对立关系,实际应用中 Agent 往往会将 RAG 作为“知识检索工具”集成进来。例如:

  • 当 Agent 接到“撰写公司 2024 年财务分析报告”的任务时:
    1. 任务规划:拆解为“收集公司 2024 年财务数据→分析核心指标→撰写报告”。
    2. 工具选择:收集数据时,调用“RAG 工具”(检索公司内部财务文档库)。
    3. 执行:RAG 检索到财务报表片段,返回给 Agent。
    4. 后续流程:Agent 再调用“Excel 工具”分析数据,最后调用“文档工具”撰写报告。

此时,RAG 是 Agent 众多工具中的一种,服务于“获取特定知识”的子任务,而 Agent 负责统筹整个复杂任务的完成。

贡献者

The avatar of contributor named as jiechen jiechen

页面历史

撰写