
资源介绍
构建人工智能智能体(英文版电子书)
文件格式epub
介绍如何结合大型语言模型(LLMs)、检索增强生成(RAG)和知识图谱构建自主化、现代化的 AI 智能体
第一部分:AI 智能体引擎 —— 从文本到大型语言模型
第 1 章:用深度学习分析文本数据
文本表示方法:
基础编码:独热编码(One-hot encoding)、词袋模型(Bag-of-words)、TF-IDF
高级嵌入:Word2Vec(通过上下文预测学习词向量,支持语义相似性计算与类比推理)
深度学习架构:
循环神经网络(RNNs)及变体(LSTMs、GRUs):处理序列数据,解决长程依赖问题
卷积神经网络(CNNs):通过 1D 卷积提取文本局部特征
应用案例:结合嵌入与深度学习进行情感分析
第 2 章:Transformer—— 现代 AI 革命的核心模型
注意力机制:自注意力(Self-attention)允许模型关注输入序列的不同部分,解决 RNN 的并行化缺陷
模型结构:
由编码器(Encoder)和解码器(Decoder)组成,包含多头注意力、前馈网络、残差连接和层归一化
位置编码(Positional Encoding):通过正弦余弦函数注入序列位置信息
训练与应用:
掩码语言模型(Masked Language Modeling)预训练任务
微调(Fine-tuning)适配下游任务(如文本分类、翻译)
第 3 章:探索作为强大 AI 引擎的 LLMs
LLMs 演进:
缩放定律(Scaling law):模型参数、数据量与计算量的增长与性能正相关
涌现能力(Emergent properties):大模型展现出小模型不具备的复杂推理能力
关键技术:
上下文长度(Context length):影响模型处理长文本的能力
混合专家模型(Mixture of experts):通过稀疏计算提高效率
指令微调(Instruction tuning)与对齐(Alignment):提升模型遵循人类指令的能力
挑战与优化:幻觉问题(Hallucinations)、伦理法律问题、提示工程(Prompt engineering)
第二部分:AI 智能体与知识检索
第 4 章:用 LLM 构建网页爬虫智能体
智能体框架:
核心三组件:大脑(LLM 负责决策)、感知(处理多模态输入)、行动(执行工具调用)
关键特性:自主性、反应性、主动性、社交能力
分类与工具:
单智能体与多智能体系统
主流库:LangChain、Haystack、LlamaIndex、Semantic Kernel、AutoGen
实践案例:构建网页检索智能体,通过工具调用获取互联网信息
第 5 章:用 RAG 扩展智能体以防止幻觉
RAG 基础:
核心流程:索引(Indexing)、检索(Retrieval)、生成(Generation)
关键策略:分块(Chunking)、嵌入(Embedding)、向量数据库存储
评估与对比:
与微调(Fine-tuning)的对比:RAG 更适合动态更新知识,微调适合特定任务适配
应用案例:构建电影推荐智能体,结合 RAG 提供个性化推荐
第 6 章:信息检索与增强的高级 RAG 技术
** naive RAG 的问题 **:检索精度不足、相关信息缺失、生成格式不符等
高级技术:
分层索引(Hierarchical indexing)、假设性问答(HyDE)、上下文富集(Context enrichment)
混合检索(Hybrid search):结合关键词搜索与语义检索
重排序(Reranking):优化检索结果排序
** scalability 与挑战 **:数据规模扩展、并行处理、安全隐私问题
第 7 章:创建知识图谱并连接至 AI 智能体
知识图谱基础:
定义:由实体(Entities)、关系(Relations)和属性(Properties)组成的有向图
本体(Ontologies)与分类法(Taxonomies):规范知识结构
构建与应用:
用 LLM 提取实体与关系,进行知识清洗与富集
GraphRAG:结合知识图谱与 RAG,增强推理能力
推理技术:知识图谱嵌入、图神经网络(GNNs)、LLM 图谱推理
第 8 章:强化学习与 AI 智能体
强化学习基础:
马尔可夫决策过程(MDPs):状态、动作、奖励与策略
多臂老虎机问题(Multi-armed bandit):平衡探索与利用
深度强化学习:
模型 - free 与模型 - based 方法
策略梯度(Policy Gradient)、Q-learning、深度 Q 网络(DQN)、近邻策略优化(PPO)
LLM 与强化学习结合:
RL 增强 LLMs(如 RLHF 对齐人类偏好)
LLM 增强 RL(如用 LLM 进行任务规划)
第三部分:创建复杂场景的高级 AI
第 9 章:构建单智能体与多智能体系统
典型系统:Toolformer、HuggingGPT、ChemCrow 等
多智能体协作:在法律、医疗等领域的应用,通过通信与分工解决复杂任务
服务范式:SaaS(软件即服务)、MaaS(模型即服务)、DaaS(数据即服务)、RaaS(结果即服务)
第 10 章:构建 AI 智能体应用
开发工具:Streamlit 快速构建前端界面
工程实践:
机器学习运维(MLOps)与 LLM 运维(LLMOps)
异步编程、Docker 容器化、Kubernetes 编排
部署考量:推理优化、错误处理、安全防护
第 11 章:未来展望
应用领域:医疗(生物医学智能体)、游戏、网页交互等
挑战:人机交互障碍、多智能体优势不明确、推理能力局限、伦理问题
未来方向:迈向人工通用智能(AGI)的路径探索
核心亮点
技术整合:系统讲解 LLMs、RAG、知识图谱与强化学习的协同方法
实践导向:提供代码示例(GitHub 仓库:https://github.com/PacktPublishing/Modern-AI-Agents)与实际案例
前沿视角:涵盖多模态模型、模型压缩、伦理安全等前沿话题
本书适合软件工程师、数据科学家和研究人员,需具备 Python 编程与机器学习基础知识,旨在帮助读者理解并构建工具型智能体系统,把握 AI 智能体的发展与应用前景。