Nólëbase

字数

2005 字

阅读时间

8 分钟

Agent 和 RAG 是当前 AI 应用的两大核心范式，两者在概念定位和技术实现上有本质区别，但也常被结合使用。核心结论是：RAG 是“增强 AI 知识的工具”，解决 AI 知识过时、不准确的问题；Agent 是“赋予 AI 自主决策与行动能力的框架”，解决 AI 无法主动完成复杂任务的问题。

关键区别总结

维度	RAG	Agent
核心定位	知识增强工具，补充 LLM 外部知识	自主行动框架，赋予 LLM 决策与执行能力
核心目标	提升回答的准确性、时效性、专业性	完成复杂、多步骤的任务
流程特性	固定流程（检索→融合→生成），无决策环节	动态流程（规划→执行→反馈→调整），决策贯穿全程
LLM 角色	仅负责“基于知识生成回答”，被动执行	作为“大脑”，负责规划、决策、判断，主动驱动
关键依赖	向量数据库、文档处理技术	任务规划算法、工具生态、记忆机制
典型应用	企业知识库问答、产品手册查询、学术论文问答	自动数据分析报告、智能办公助手、代码生成与调试

一、概念区别：定位与核心目标完全不同

1. RAG（检索增强生成）：“知识增强工具”

核心定位：为 LLM 补充“外部知识”的技术方案，本质是一种“知识增强手段”。
核心目标：解决 LLM 本身的两大缺陷——
- 知识固化：训练数据截止到某个时间点，无法获取实时/最新知识（如 2025 年的新政策）。
- 知识不准确：对特定领域（如企业内部文档、专业论文）的知识储备不足，易产生“幻觉”。
核心逻辑：用户提问时，先从外部知识库（如文档库、数据库）中检索出与问题相关的信息，再将这些信息与问题一起传给 LLM，让 LLM 基于“检索到的准确知识”生成回答。
类比：相当于给 LLM 配了一个“实时可查的参考书”，回答问题前先翻书找依据。

2. Agent（智能代理）：“自主决策行动框架”

核心定位：赋予 LLM “自主规划、决策、调用工具完成复杂任务”能力的框架，本质是一种“任务执行范式”。
核心目标：解决 LLM 只能“被动回答问题”的缺陷，让 AI 能主动拆解复杂任务、选择工具、执行步骤，甚至根据结果调整策略。
核心逻辑：接收用户的复杂目标（如“写一份 2025 年 AI 行业报告”），通过 LLM 完成：
1. 任务规划：将目标拆解为子步骤（如“收集 2025 年 AI 行业数据→分析关键趋势→撰写报告框架→填充内容”）。
2. 工具选择：根据子步骤选择合适工具（如用搜索引擎查数据、用 Excel 工具分析数据、用文档工具写报告）。
3. 执行与反馈：调用工具执行，获取结果后判断是否需要调整步骤（如数据不足则重新检索），直到完成最终目标。
类比：相当于给 LLM 配了一个“大脑+手脚”，能主动思考“怎么做”并动手执行，而不是只被动回应“是什么”。

二、技术实现区别：核心组件与流程完全不同

1. RAG 的技术实现：围绕“知识检索与融合”构建

RAG 的核心是“检索到准确知识并传递给 LLM”，技术流程高度固定，组件聚焦“知识处理”。

核心组件

文档处理模块：负责加载（如 PDF/网页解析）、分割（将长文档切为短片段）、向量化（生成文本嵌入向量）。
向量数据库：存储文档向量，提供高效的相似性检索能力（根据用户查询向量找最相关的文档片段）。
检索模块：接收用户查询，生成查询向量，从向量数据库中检索 Top K 相关文档。
Prompt 融合模块：将检索到的文档片段与用户查询拼接为“带知识的 Prompt”，传给 LLM。
LLM 生成模块：基于融合后的 Prompt 生成回答。

典型流程

mermaid

graph TD
    A[用户提问] --> B[生成查询向量]
    B --> C[向量数据库检索相关文档]
    C --> D[拼接“查询+文档”为 Prompt]
    D --> E[LLM 基于 Prompt 生成回答]
    E --> F[返回结果]

2. Agent 的技术实现：围绕“自主决策与工具调用”构建

Agent 的核心是“让 LLM 具备自主能力”，技术流程动态可变，组件聚焦“任务管理与工具交互”。

核心组件

任务规划器（Planner）：由 LLM 承担，负责将复杂目标拆解为可执行的子任务序列（如用 Chain of Thought 思维链引导拆解）。
工具库（Toolkit）：包含 Agent 可调用的各类工具，如搜索引擎（Google）、数据库（SQL）、代码执行器（Python REPL）、RAG 系统、文件操作工具等。
工具调用器（Tool Caller）：解析 LLM 的决策结果，调用对应工具的 API，获取执行结果。
反馈与记忆模块（Memory & Feedback）：存储任务执行历史（如已完成的子步骤、工具返回结果），供 LLM 调整后续策略；部分 Agent 还支持用户反馈修正。
决策中枢（LLM）：作为 Agent 的“大脑”，统筹任务规划、工具选择、结果判断，是 Agent 的核心驱动。

典型流程

mermaid

graph TD
    A[用户提出复杂目标] --> B[LLM 拆解为子任务序列]
    B --> C[LLM 选择当前子任务所需工具]
    C --> D[调用工具执行，获取结果]
    D --> E[LLM 判断结果是否满足需求？]
    E -- 否 --> F[调整子任务/工具，重新执行]
    E -- 是 --> G[执行下一个子任务]
    G --> H[所有子任务完成？]
    H -- 否 --> C
    H -- 是 --> I[LLM 整合结果，生成最终输出]

三、常见关联：Agent 常集成 RAG 作为工具

两者并非对立关系，实际应用中 Agent 往往会将 RAG 作为“知识检索工具”集成进来。例如：

当 Agent 接到“撰写公司 2024 年财务分析报告”的任务时：
1. 任务规划：拆解为“收集公司 2024 年财务数据→分析核心指标→撰写报告”。
2. 工具选择：收集数据时，调用“RAG 工具”（检索公司内部财务文档库）。
3. 执行：RAG 检索到财务报表片段，返回给 Agent。
4. 后续流程：Agent 再调用“Excel 工具”分析数据，最后调用“文档工具”撰写报告。

此时，RAG 是 Agent 众多工具中的一种，服务于“获取特定知识”的子任务，而 Agent 负责统筹整个复杂任务的完成。

贡献者

jiechen

页面历史

最后编辑于 2 分钟前

查看完整历史

vue模板的编译

响应时原理

复杂表单场景

关键区别总结 ​

一、概念区别：定位与核心目标完全不同 ​

1. RAG（检索增强生成）：“知识增强工具” ​

2. Agent（智能代理）：“自主决策行动框架” ​

二、技术实现区别：核心组件与流程完全不同 ​

1. RAG 的技术实现：围绕“知识检索与融合”构建 ​

核心组件 ​

典型流程 ​

2. Agent 的技术实现：围绕“自主决策与工具调用”构建 ​

核心组件 ​

典型流程 ​

三、常见关联：Agent 常集成 RAG 作为工具 ​

贡献者

页面历史

关键区别总结

一、概念区别：定位与核心目标完全不同

1. RAG（检索增强生成）：“知识增强工具”

2. Agent（智能代理）：“自主决策行动框架”

二、技术实现区别：核心组件与流程完全不同

1. RAG 的技术实现：围绕“知识检索与融合”构建

核心组件

典型流程

2. Agent 的技术实现：围绕“自主决策与工具调用”构建

核心组件

典型流程

三、常见关联：Agent 常集成 RAG 作为工具