本文基于 AI 生成。
下面用“分层架构 + 数据流”的方式,把这些 AI 核心概念串成一个可落地的系统模型。
一、AI 系统整体分层架构
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
| ┌─────────────────────────────────────────────┐ │ 应用层(Application) │ │ Chat / Copilot / BI / 自动化系统 │ └─────────────────────────────────────────────┘ ↓ ┌─────────────────────────────────────────────┐ │ Agent 层(Orchestration) │ │ Agent / Multi-Agent / Planner / Executor │ │ Workflow / Memory / Guardrails │ └─────────────────────────────────────────────┘ ↓ ┌─────────────────────────────────────────────┐ │ 能力层(Capabilities) │ │ Prompt / Skill / Tool / RAG │ └─────────────────────────────────────────────┘ ↓ ┌─────────────────────────────────────────────┐ │ 数据层(Knowledge) │ │ Vector DB / Embedding / Documents │ └─────────────────────────────────────────────┘ ↓ ┌─────────────────────────────────────────────┐ │ 模型层(Model) │ │ LLM / Fine-tuning / RLHF / Token │ └─────────────────────────────────────────────┘
|
二、核心执行链路(端到端数据流)
这是最关键的一段,基本等价于“Agent 是怎么工作的”:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
| 用户输入 ↓ [Prompt 构建] ↓ [Agent 接管] ├── Planner:拆解任务 ├── Memory:补充上下文 └── Guardrails:校验输入 ↓ [是否需要外部知识?] ├── 是 → RAG(Embedding → Vector DB 检索) └── 否 → 直接推理 ↓ [是否需要工具?] ├── 是 → Tool / Skill 调用(Function Calling) └── 否 → 继续 ↓ [LLM 推理] ↓ [Executor 执行] ↓ [结果校验(Guardrails)] ↓ 输出结果
|
三、结构化表格(组件职责一览)
| 层级 |
组件 |
作用 |
关键技术 |
| 应用层 |
Chat / BI / Copilot |
用户交互入口 |
Web / API |
| Agent层 |
Agent |
控制执行流程 |
状态机 / ReAct |
|
Planner |
任务拆解 |
CoT / Tree-of-Thought |
|
Executor |
执行动作 |
Tool调用 |
|
Memory |
上下文记忆 |
KV / 向量存储 |
|
Guardrails |
安全与约束 |
校验规则 |
| 能力层 |
Prompt |
指令定义 |
Prompt Engineering |
|
Skill |
能力封装 |
模块化设计 |
|
Tool |
外部能力 |
Function Calling |
|
RAG |
知识增强 |
检索+生成 |
| 数据层 |
Embedding |
语义向量化 |
向量模型 |
|
Vector DB |
相似度检索 |
FAISS / Milvus |
| 模型层 |
LLM |
核心推理 |
GPT / Claude |
|
Fine-tuning |
定制能力 |
SFT |
|
RLHF |
对齐优化 |
强化学习 |
四、一个更“工程化”的架构(开发场景)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31
| ┌───────────────┐ │ 前端 UI │ └──────┬────────┘ ↓ ┌──────────────────────┐ │ API Gateway │ └──────┬───────────────┘ ↓ ┌────────────────────────────┐ │ Agent Service │ │ - Planner │ │ - Memory │ │ - Workflow Engine │ └──────┬────────────────────┘ ↓ ┌───────────────────────────────┐ │ Capability Layer │ │ - Prompt Template │ │ - Tool Registry (Spring Bean) │ │ - Skill Modules │ └──────┬───────────────┬────────┘ ↓ ↓ ┌───────────────┐ ┌────────────────┐ │ RAG Service │ │ Tool Service │ │ Embedding API │ │ 外部系统调用 │ │ Vector DB │ │ (DB / HTTP) │ └──────┬────────┘ └──────┬─────────┘ ↓ ↓ ┌────────────────────────┐ │ LLM API │ └────────────────────────┘
|
五、关键理解(避免常见误区)
- Agent ≠ 模型
- RAG ≠ 数据库查询
- Skill vs Tool
- Tool:原子能力(API)
- Skill:组合能力(可能包含多个 Tool)
- Prompt 是“代码”
- 在很多系统里,Prompt ≈ DSL(领域语言)