type
status
date
slug
summary
tags
category
icon
password
Property
Apr 18, 2025 02:26 AM
基于 OpenAI 官方文档《A Practical Guide to Building Agents》整理
适用于:企业AI项目、产品经理、开发者、AIGC落地团队内部培训
1. 什么是 Agent?2. 适用场景3. Agent 三大核心结构🎯 编写 Instructions 的建议:4. Agent 调度模式:单体 vs 多体🟢 单 Agent 模式(推荐起步)🟡 多 Agent 模式5. 安全机制与 Guardrails🛡️ 类型总览⚠️ 实施建议6. 部署路线图7. 代码结构参考8. 落地建议与迭代策略
1. 什么是 Agent?
Agent 是能独立代表用户完成任务的智能系统。
区别于传统LLM应用:
- ✅ 控制多步骤工作流
- ✅ 动态调用工具
- ✅ 判断任务是否完成
- ✅ 可在失败时中止并转交人类
💡 不是所有集成GPT的系统都是Agent,Agent具备“流程控制 + 决策 + 工具调用”能力。
2. 适用场景
典型问题 | 示例 |
复杂判断,非结构化信息密集 | 客服退款、保险理赔、异常检测 |
自动化规则维护困难,更新代价高 | 安全合规审核、供应商审批流程 |
多个步骤交互,强依赖上下文理解 | 企业内部工单、文档撰写助手 |
🧠 适合流程:“判断逻辑复杂 + 无法用 if-else 完美穷举 + 上下文强相关”
3. Agent 三大核心结构
组件 | 描述 |
🔮 Model | 模型负责理解上下文与决策(如GPT-4) |
🔧 Tools | Agent调用的API或功能模块 |
📋 Instructions | 类似SOP,告诉Agent每一步要怎么做 |
🎯 编写 Instructions 的建议:
- 拆成小步骤,每步只干一件事
- 显式写出“行为动作”与“输出要求”
- 处理异常情况(如信息缺失、意外问题)
- 可用o1模型从文档自动生成SOP步骤
4. Agent 调度模式:单体 vs 多体
🟢 单 Agent 模式(推荐起步)
- 一个智能体执行所有步骤,直到完成
- 使用
Runner.run()
实现工作流循环
🟡 多 Agent 模式
模式 | 描述 |
Manager 模式 | 一个中央智能体调度多个子Agent,各自处理特定任务 |
去中心化模式 | Agent之间相互传递任务控制权,实现无主协作 |
5. 安全机制与 Guardrails
🛡️ 类型总览
类型 | 功能 |
✅ 相关性分类器 | 拦截跑题输入 |
🔐 安全分类器 | 识别提示注入、权限越界等攻击 |
👤 PII 识别 | 阻止输出敏感用户信息 |
⚙️ 工具调用权限评级 | 评估操作风险,执行高风险操作前强制检查或转人工 |
🧾 规则拦截(正则/黑名单) | 拦截危险字符、命令注入等 |
📦 输出内容验证 | 防止品牌受损内容输出,如错误陈述、偏见话术 |
⚠️ 实施建议
- 默认“乐观执行”,护栏实时监听输入/输出/调用
- 超过失败次数 or 高风险场景 = 人工介入
- 护栏机制 = 安全、合规、品牌形象的保护墙
6. 部署路线图
7. 代码结构参考
✅ 单Agent + 工具调用:
• ✅ 多Agent调度(Manager Pattern):
• ✅ 添加 Guardrail 示例:
8. 落地建议与迭代策略
- ✅ 从单流程试点开始(如“客服退款处理”)
- ✅ 初期使用最强模型做baseline测试
- ✅ 实时监控 + 人工介入保障稳定性
- ✅ 用真实用户反馈持续优化指令 & 模型
- ✅ 成熟后再拆分为多Agent系统,提高扩展性
- 作者:yaney
- 链接:https://yaney.top/article/example-30
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。