
资源介绍
英文版电子书)
本书分为两大部分,共 20 章,从基础概念到进阶应用,循序渐进地引导读者掌握 PyTorch 在 AI 与机器学习领域的应用。
(一)第一部分:PyTorch 基础与经典机器学习模型(第 1-11 章)
PyTorch 入门(第 1 章):介绍机器学习的基本概念,对比传统编程与机器学习的差异,讲解 PyTorch 的定义、生态系统(如 TorchServe 部署工具、分布式训练库、移动端部署支持、预训练模型库等),并指导读者通过 Python 命令行、PyCharm IDE、Google Colab 三种方式安装和使用 PyTorch,最后以简单的线性关系预测案例(通过神经网络学习 y=2x-1 的关系),帮助读者入门机器学习的基本流程。
计算机视觉基础(第 2 章):聚焦计算机视觉领域,以 Fashion MNIST 数据集(包含 10 类服装的 28×28 灰度图像)为案例,讲解计算机视觉的工作原理,设计包含线性层、ReLU 激活函数、LogSoftmax 输出层的神经网络,实现服装图像分类,并介绍模型训练、评估、过拟合及早停(Early Stopping)等关键技术。
图像特征检测进阶(第 3 章):深入计算机视觉的特征提取技术,介绍卷积(Convolution)与池化(Pooling)操作的原理与作用,教读者实现卷积神经网络(CNN),并通过 “马与人类” 数据集、“猫狗” 数据集等案例,探索图像增强(Image Augmentation)、迁移学习(Transfer Learning)、多分类(Multiclass Classification)、 dropout 正则化等技术,提升模型泛化能力,解决过拟合问题。
PyTorch 数据处理(第 4 章):系统讲解 PyTorch 的数据生态,介绍 torch.utils.data.Dataset 抽象类及自定义数据集的方法,探索 FashionMNIST 等内置数据集的使用,同时讲解 ImageFolder、DatasetFolder、FakeData 等通用数据集类的应用场景,还介绍了数据的自定义分割方法,以及提取、转换、加载(ETL)流程在机器学习数据管理中的应用,重点优化数据加载阶段的性能,如通过 DataLoader 实现批处理、洗牌、并行数据加载等。
自然语言处理基础(第 5 章):开启自然语言处理(NLP)学习,讲解如何将语言编码为数字(如基于单词的标记化),介绍自定义标记器及 Hugging Face 的预训练标记器的使用,说明如何将句子转换为序列、处理未登录词(OOV)、进行序列填充(Padding),还讲解了文本清洗技术,如去除 HTML 标签、停用词、标点符号,最后介绍如何处理真实数据源(如 IMDb 评论数据集、CSV 格式情感数据集、JSON 格式讽刺检测数据集)。
基于嵌入的情感分析(第 6 章):深入 NLP 的语义表示,讲解嵌入(Embedding)的概念,即通过高维空间向量表示单词语义,以讽刺检测数据集为案例,构建基于嵌入层的情感分类模型,分析模型过拟合问题,并介绍调整学习率、优化词汇表大小、调整嵌入维度、优化模型架构、使用 dropout、正则化等多种减少过拟合的方法,还讲解了模型的预测应用及嵌入可视化工具的使用,同时介绍了使用预训练嵌入(如 GloVe)提升模型性能的方法。
循环神经网络与 NLP(第 7 章):介绍循环神经网络(RNN)及其在 NLP 中的应用,讲解 RNN 的基本原理、长短期记忆网络(LSTM)的结构与优势(如长期保存上下文),以及双向 LSTM 的应用(同时从正向和反向学习序列上下文),以讽刺检测数据集为例,构建基于 LSTM 的文本分类器,探索堆叠 LSTM、调整学习率、使用 dropout、结合预训练嵌入等技术优化模型,提升分类性能。
文本生成技术(第 8 章):聚焦文本生成任务,讲解如何将文本序列转换为训练数据(以固定长度的文本片段为特征,下一个单词为标签),以传统爱尔兰歌曲歌词数据集为案例,构建基于 LSTM 的文本生成模型,介绍模型训练过程,以及如何通过种子文本生成新文本,还探索了优化模型架构(如调整嵌入维度、初始化 LSTM 参数、使用可变学习率)、改进数据处理(如滑动窗口扩展数据集)、基于字符的编码等提升文本生成质量的方法。
时间序列数据理解(第 9 章):介绍时间序列数据的概念及常见属性(趋势、季节性、自相关性、噪声),通过合成时间序列数据(包含趋势、季节性和噪声),讲解朴素预测方法(以 t 时刻值预测 t+1 时刻值),并使用均方误差(MSE)、平均绝对误差(MAE)评估预测准确性,还介绍了基于移动平均的预测方法及通过差分改进移动平均预测的技术。
序列预测的 ML 模型(第 10 章):将机器学习应用于序列预测,讲解如何创建窗口化数据集(将时间序列数据划分为固定长度的窗口,前 n-1 个值为特征,第 n 个值为标签),以合成时间序列数据为例,构建基于深度神经网络(DNN)的序列预测模型,介绍模型训练与评估过程,还讲解了调整学习率等超参数优化模型性能的方法。
卷积与循环序列模型(第 11 章):探索更先进的序列预测技术,介绍一维卷积(Conv1D)在序列数据特征提取中的应用,以时间序列数据为例构建基于 CNN 的预测模型,并通过超参数搜索优化模型,还讲解了 RNN、GRU、LSTM 等循环模型在序列建模中的应用,以 NASA 天气数据集、英国中心地区日温度数据集等真实数据集为案例,探索模型优化技术,如使用 dropout、双向循环模型等提升预测准确性。
(二)第二部分:生成式 AI 与模型部署(第 12-20 章)
推理基础概念(第 12 章):讲解机器学习推理的核心数据结构 —— 张量(Tensor),介绍张量的定义、不同维度张量(标量、向量、矩阵、高维张量)的创建与应用,重点说明图像数据、文本数据如何转换为张量格式(如图像的通道、高度、宽度维度处理,文本的标记化与嵌入转换),以及模型输出张量的解读(如分类任务中输出神经元对应类别的概率),为后续模型推理与部署奠定基础。
PyTorch 模型部署(第 13 章):介绍 PyTorch 模型的部署技术,重点讲解 TorchServe 工具的使用,包括环境搭建、配置文件设置、模型定义、处理器文件创建、模型归档、服务器启动与推理测试,还介绍了使用 Flask 框架部署模型的方法,包括 Flask 环境搭建、服务器创建,帮助读者将训练好的模型部署到 Web 或云端,实现模型的实际应用。
第三方模型与模型库(第 14 章):探索第三方模型资源的使用,介绍 Hugging Face Hub 与 PyTorch Hub 的应用,讲解如何从这些模型库加载预训练模型(如计算机视觉模型、NLP 模型),减少重复开发工作,快速应用成熟模型解决实际问题。
Transformer 与相关库(第 15 章):深入 Transformer 架构,讲解 Transformer 的编码器、解码器、编码器 - 解码器架构原理,介绍 transformers API 的核心概念(如管道 Pipelines、标记器 Tokenizers),指导读者使用 transformers 库快速构建基于 Transformer 的模型,为后续生成式 AI 模型学习打下基础。
基于自定义数据的 LLM 应用(第 16 章):聚焦大型语言模型(LLM)的定制化应用,讲解如何使用自定义数据微调 LLM(包括环境搭建、数据加载与预处理、模型与标记器初始化、训练配置与执行、模型保存与测试),以及提示调优(Prompt-Tuning)技术(数据准备、数据加载器创建、模型定义、训练与评估、提示嵌入保存与推理),帮助读者根据特定任务优化 LLM 性能。
Ollama 部署 LLM(第 17 章):介绍使用 Ollama 工具部署 LLM 的方法,包括 Ollama 的入门与服务器运行,指导读者构建使用 Ollama LLM 的应用,如 Python 概念验证程序、Web 应用(包含前端页面与后端逻辑),实现 LLM 的本地化部署与应用。
检索增强生成(RAG)入门(第 18 章):讲解检索增强生成(RAG)的概念与原理,介绍 RAG 的核心流程(如相似性理解、数据库创建、相似性搜索、结合 LLM 生成内容),指导读者实现基础的 RAG 系统,并探索结合托管模型扩展 RAG 能力,提升 LLM 生成内容的准确性与相关性。
基于 Hugging Face Diffusers 的生成模型(第 19 章):聚焦图像生成领域,介绍扩散模型(Diffusion Models)的概念,讲解如何使用 Hugging Face Diffusers 库实现图像生成、图像到图像转换、图像修复(Inpainting)等任务,帮助读者入门生成式图像技术。
LoRA 与 Diffusers 调优生成图像模型(第 20 章):深入生成图像模型的调优,介绍使用 LoRA(Low-Rank Adaptation)技术结合 Diffusers 库微调生成图像模型的方法,包括 Diffusers 库获取、微调数据准备、模型微调、模型发布、使用自定义 LoRA 生成图像,帮助读者定制化生成符合特定需求的图像。
三、书籍特色与价值
实战导向,代码优先:全书以实际代码案例为核心,每个知识点都配套具体的 PyTorch 代码实现,读者可直接运行代码、观察结果,快速理解 AI 与机器学习的实际应用过程,避免陷入复杂的理论推导,尤其适合注重实践的程序员。
内容全面,覆盖广泛:从 PyTorch 基础操作、经典机器学习模型(如图像分类、文本分类、序列预测)到生成式 AI 技术(文本生成、图像生成、RAG、LLM 微调),再到模型部署,涵盖 AI 开发的全流程,满足读者从入门到进阶的学习需求。
降低门槛,友好入门:无需读者具备高深的数学知识或 AI 理论基础,通过通俗的语言与直观的代码示例,将复杂的 AI 概念简化,让不同基础的程序员都能快速入门并上手实践。
贴近实际,实用性强:书中案例多来自真实应用场景(如情感分析、图像分类、天气预测、文本生成),使用的数据集与工具(如 Hugging Face 库、TorchServe、Ollama)均为行业常用资源,读者所学技能可直接应用于实际工作中的 AI 项目开发。