视频课程编程

从零构建大语言模型（LLM）实战编程课 (中文字幕英文视频

¥3.90 已售 1

✓ 自动发货 ✓ 永久有效 ✓ 售后保障

立即购买

资源介绍

教程) 本课程是一套聚焦大语言模型（LLM）底层原理与实战开发的系统化视频教程，共包含 48 个核心教学视频，配套完整中文字幕（srt 格式），帮助学习者从基础环境搭建到实际模型部署，逐步掌握 LLM 的构建逻辑与编程实现能力。课程采用 “理论拆解 + 代码落地” 的双轨教学模式，内容覆盖大语言模型开发全流程，从最基础的 Python 环境配置起步，层层深入核心技术模块。在基础准备阶段，学习者将掌握文本分词、令牌 ID 转换、特殊上下文令牌添加等文本预处理关键技能，同时理解字节对编码（BPE）、滑动窗口数据采样等核心数据处理方法，为模型训练奠定基础。随后，课程详细讲解令牌嵌入创建、词位置编码等基础技术，帮助学习者建立对语言模型输入层设计的完整认知。自注意力机制作为 LLM 的核心技术，课程通过多个专项视频进行递进式教学：从无训练权重的简单自注意力机制入门，分步拆解注意力权重计算过程，再到紧凑式自注意力 Python 类的实现，让学习者直观理解自注意力的工作原理。在此基础上，课程进一步拓展至因果注意力掩码、dropout 注意力权重掩码等优化技术，以及因果自注意力类的开发、多头注意力层堆叠与权重拆分实现，全面覆盖自注意力机制的进阶应用与工程优化。在模型架构搭建阶段，课程聚焦 Transformer 与 GPT 模型的实战开发，系统讲解层归一化、GELU 激活函数前馈网络、 shortcut 连接等关键组件的实现方法，以及注意力层与线性层在 Transformer 块中的整合逻辑。通过完整的代码演示，学习者将掌握 GPT 模型的整体编码流程，以及文本生成功能的核心实现技巧，完成从模型组件开发到完整架构搭建的跨越。模型训练与优化部分，课程围绕文本生成损失计算（交叉熵、困惑度）、训练集与验证集损失评估、LLM 全流程训练等核心任务展开，同时深入讲解温度调节、Top-k 采样等解码策略，帮助学习者掌握控制文本生成随机性的方法，提升生成内容的质量与可控性。此外，课程还涵盖 PyTorch 框架下模型权重的加载与保存技巧，为模型的后续部署与迭代提供技术支持。应用实战环节，课程通过数据集准备、数据加载器创建、预训练权重初始化等前置步骤，引导学习者完成模型微调全流程 —— 包括添加分类头、计算分类损失与准确率、基于有监督数据的模型微调，最终实现将 LLM 应用于垃圾信息分类等实际场景。同时，课程专门设置有监督指令微调模块，详细讲解指令数据集构建、训练批次组织、指令数据加载器开发等关键步骤，以及预训练 LLM 的加载、指令微调实现、响应提取与保存、微调后模型评估等完整流程，帮助学习者掌握提升模型指令遵循能力的核心方法。本课程所有教学内容均基于 Python 编程语言与 PyTorch 框架展开，代码实现简洁易懂，逻辑清晰，适合具备基础 Python 编程能力与机器学习入门知识的学习者。无论是希望深入理解 LLM 底层原理的技术爱好者，还是寻求大语言模型实战开发能力的工程师，都能通过本课程系统掌握从 0 到 1 构建、训练与优化大语言模型的核心技能，为后续从事 LLM 相关研究与开发工作奠定坚实基础。课程配套的中文字幕确保学习者能够精准理解教学内容，高效吸收技术要点，提升学习效率。