从零构建AI Agent:大模型驱动的智能体设计与实战
定 价:69 元
丛书名:通用智能与大模型丛书
- 作者:姚宇航
- 出版时间:2026/1/1
- ISBN:9787121520655
- 出 版 社:电子工业出版社
- 中图法分类:TP18
- 页码:160
- 纸张:
- 版次:01
- 开本:16开
本书系统梳理了智能体与大模型驱动的智能体系统的发展脉络,构建了一套从认知原理、系统架构到工程实践的完整知识体系。本书内容涵盖单智能体与多智能体的核心概念、六层系统架构设计、任务规划与工具调用机制、模型路由与记忆管理,以及安全与合规落地等关键技术,并通过多个可复现的实战案例展示智能体在客服、创意生成、编程自动化、金融决策与交易、医疗健康等场景中的应用。书中还拆解了系统级智能体的设计方法,并展望未来智能体生态的发展趋势。
姚宇航,美国卡内基梅隆大学电子与计算机工程博士,师从Carlee Joe-Wong教授,荣获A.G. Milnes最佳博士论文奖。现任Zoom研究工程师,专注于垂直智能体系统与可扩展AI基础架构的研发工作。曾在微软、亚马逊及多家人工智能初创公司从事研究工作,在分布式学习框架、大规模模型优化与工程化部署方面积累了系统性的实践经验。其研究聚焦于联邦图学习与多智能体系统,致力于推动分布式学习理论向真实人工智能系统落地,是该领域中兼具理论创新与系统实现能力的代表性研究者之一。在 NeurIPS、KDD、EMNLP、AAAI 等国际人工智能会议发表论文三十余篇,并多次担任 MLSys、NeurIPS 等会议程序委员会委员。丁博生,南洋理工大学计算机科学专业博士,AI量化交易公司Calais创始成员、COO,新加坡社科大学客座教授。带队发布的海外中文开源大模型及预训练—微调一体化框架 PandaLLM在学术与工程实践层面均产生广泛影响。研究方向为大语言模型与智能体系统,目前专注于探索前沿 AI算法与量化交易、金融系统的深度融合,致力于将大模型与智能体技术转化为可落地、可规模化的金融应用。
目录
第1章 智能体发展脉络
1.1 什么是智能体:从规则系统到超级智能体
1.2 反应式智能体:决策简单、响应快速
1.3 计划式智能体:从BDI 模型到智能体自动规划
1.4 单智能体:认知框架与大语言模型驱动的任务闭环
1.5 要不要训练智能体
1.6 多智能体系统:从协作系统到智能生态
第2章 智能体系统架构
2.1 设计原则
2.1.1 用户友好:降低门槛的第一原则
2.1.2 系统智能:真正理解意图并完成任务
2.1.3 可扩展性:模块化带来的演进能力
2.1.4 高性价比:让智能体系统真正可用
2.2 六层架构概述:输入、意图、规划、执行、推理、反馈
2.3 智能体系统六层架构调用链
2.4 现有智能体框架分析
2.4.1 LangChain:大语言模型驱动的工具调用框架
2.4.2 AutoGen:多智能体协同的任务自动化框架
2.4.3 CrewAI:具备角色分工与团队结构的智能体编排系统
2.4.4 LangGraph:图结构驱动的多智能体任务编排引擎
2.4.5 智能体框架能力对比
第3章 智能体系统分层实现
3.1 用户输入与多模态交互
3.1.1 用户输入处理:文本、语音、图像的统一接入
3.1.2 多轮上下文与用户状态维护
3.1.3 系统接入与设备交互
3.2 意图识别与任务路由
3.2.1 意图识别机制:提示工程vs 分类器vs 函数调用
3.2.2 智能体注册与动态匹配机制
3.2.3 路由模块实现
3.3 任务规划与编排
3.3.1 单智能体任务与多智能体任务链的区别
3.3.2 自动规划方法:基于大语言模型的任务分解与链路生成
3.3.3 实践:利用LangGraph 和AutoGen 构建多智能体工作流
3.4 任务执行与工具调用
3.4.1 任务智能体:模型、工具与记忆的组合
3.4.2 工具调用机制:函数注册、输出格式、调用规范
3.4.3 系统级执行链:并行、条件、循环任务流控制
3.5 模型推理与路由选择
3.5.1 多模型路由机制:按任务复杂度自动分发
3.5.2 本地模型与云端模型混合推理架构
3.5.3 成本优化与性能保障
3.6 记忆管理与反思反馈
3.6.1 记忆系统设计:短期记忆与长期记忆
3.6.2 反思机制:任务失败回溯与自我修正
3.6.3 系统进化:基于用户反馈与历史行为的自学习机制
3.7 系统安全性与可信性保障
3.7.1 幻觉与错误响应的识别与抑制
3.7.2 指令攻击与数据隐私防护机制
3.7.3 可控性与审计追踪:构建“可信智能体系统”
第4章 扣子智能体构建平台:功能、能力与典型应用
4.1 平台定位与设计理念
4.2 扣子的核心功能模块
4.2.1 智能体创建
4.2.2 知识库
4.2.3 智能体技能:工具与插件系统
4.2.4 工作流
4.2.5 发布与生态集成
4.3 使用扣子能实现哪些类型的应用
4.3.1 知识型智能体
4.3.2 工具型智能体
4.3.3 创意型智能体
4.3.4 工作流型智能体
4.3.5 服务型智能体
4.4 上手扣子:一键创建你的第一个智能体
4.4.1 进入创建界面
4.4.2 输入描述
4.4.3 编辑与增强智能体
4.4.4 发布
第5章 智能体核心模块与实践
5.1 大语言模型调用:从基础到实践
5.1.1 大语言模型的定义与作用
5.1.2 调用大语言模型的方式:API 调用、SDK 封装和框架集成
5.1.3 基础调用示例:提示工程与常见应用
5.2 工具调用与模型上下文协议
5.2.1 什么是工具
5.2.2 模型上下文协议简介
5.2.3 如何将工具挂载到智能体中
5.2.4 案例:调用搜索工具、数据库及本地函数
5.3 Agent Skills:能力模块化与执行层抽象
5.3.1 提出背景与设计动机
5.3.2 Agent Skills的定义
5.3.3 Agent Skills分层架构
5.3.4 Skill 声明文件与能力感知
5.3.5 Agent Skills与Tool / MCP的关系
5.3.6 案例:基于Agent Skills 的自动化内容生成
5.4 智能体之间的协作模式
5.4.1 LangGraph中心化协作
5.4.2 A2A去中心化协作
5.4.3 对比与应用场景
5.4.4 未来展望
5.4.5 A2A实战
第6章 通用型智能体实战:从知识到创意
6.1 智能客服系统:基于RAG 的知识问答
6.1.1 场景分析与技术挑战
6.1.2 六层系统架构应用
6.1.3 模块划分与流程图详解
6.1.4 核心代码说明
6.1.5 完整调用流程
6.1.6 案例延伸
6.2 多模态创意生成:文案与设计
6.2.1 文案与营销场景需求分析
6.2.2 从文案到视觉的联动
6.2.3 协作式创意闭环
6.2.4 核心代码说明
6.2.5 运行输出示例
6.3 编程智能体:构建“AI 程序员”
6.3.1 编程任务的自动化流程分析
6.3.2 系统结构:规划器+ 生成器+ 分析器+ 编辑器+ 工作区
6.3.3 核心代码说明
6.3.4 运行输出示例
第7章 进化型智能体实战:自适应与个性化
7.1 自我演进智能体:自适应多轮迭代
7.1.1 场景分析与技术挑战
7.1.2 系统架构
7.1.3 核心代码说明
7.1.4 应用价值
7.2 英语教学智能体:个性化与记忆管理
7.2.1 场景分析与技术挑战
7.2.2 六层系统架构设计
7.2.3 模块划分与数据管理
7.2.4 核心代码说明
第8章 协作型智能体实战:多智能体与实时决策
8.1 多智能体对话系统:基于LangGraph的游戏NPC智能体
8.1.1 系统设计
8.1.2 模块划分与目录结构
8.1.3 核心代码说明
8.1.4 运行输出示例
8.2 实时决策智能体系统实战:金融决策与交易
8.2.1 场景需求与多智能体分工协作模型
8.2.2 实时协作模式
8.2.3 实战案例:构建实时决策智能体系统
8.2.4 主要功能与实现方式
8.2.5 核心代码示例
8.2.6 运行输出示例
第9章 行业型智能体实战:合规与安全落地
9.1 医疗健康智能体:辅助诊断与健康管理
9.1.1 场景分析与技术挑战
9.1.2 系统架构
9.1.3 RAG框架
9.1.4 代码结构与模块说明
9.1.5 系统架构图
9.1.6 核心代码示例
9.1.7 合规设计总结
9.2 法律智能体:辅助合规与法律服务
9.2.1 场景分析与技术挑战
9.2.2 法律知识库与RAG
9.2.3 合规性与可解释性设计
9.2.4 核心代码示例
第10章 超级智能体系统实战:拆解Super Agent
10.1 设计目标
10.2 系统架构
10.3 模型路由器
10.4 多模态与RAG Memory
10.5 案例演示:任务链条复现
10.5.1 任务说明
10.5.2 执行流程
10.5.3 核心代码示例
10.6 体系分析与启示
10.6.1 Super Agent的运行流程
10.6.2 关键特征与可借鉴设计
10.6.3 系统风险与设计约束
10.6.4 系统优化与扩展建议
第11章 智能体系统的发展趋势
11.1 面向未来的超级智能体平台建设
11.1.1 从单智能体到平台:智能体云、AgentOS的可能性
11.1.2 构建超级智能体生态:能力市场、记忆共享、行为调度
11.1.3 智能体即服务:平台化部署路径与商业模型
11.2 自进化智能体:自动优化与自学习
11.3 多模态具身智能:跨界集成与人机交互
11.4 Agentic Web 和Agent Network Protocol
11.5 x402 支付协议与智能体支付系统:为智能经济打造的互联网原生支付协议
11.5.1 支付:智能体世界的基础设施
11.5.2 x402 支付协议:为AI 时代重建支付层
11.5.3 协议哲学:开放、信任最小化、HTTP原生
11.5.4 技术结构与角色
11.5.5 核心创新:请求即支付
11.5.6 对智能体的意义
11.5.7 展望:从支付协议到智能体货币系统
11.6 下一代智能体生态
11.7 智能体赋能的超级个体
参考文献