视频课程人工智能

深度学习进阶架构：从理论到实践的系统指南 (英文课程中文字幕)

¥5.00 已售 0

✓ 自动发货 ✓ 永久有效 ✓ 售后保障

立即购买

资源介绍

视频数量：140个总时长：12小时7分课程介绍：深度学习进阶架构：从理论到实践的系统指南你有没有想过，那些能够生成逼真图像的人工智能模型，背后到底是怎么运作的？为什么GPT能理解你的问题，Midjourney能画出你想象中的画面，而特斯拉的自动驾驶能够准确识别道路上的每一个物体？这些看似神奇的能力，都建立在深度学习架构的精妙设计之上。如果你想真正理解这些技术的底层原理，而不是仅仅停留在调API调参数层面，这门课程会给你一个完整的答案。这门课程来自Coursera的进阶深度学习专项课程，由浅入深地覆盖了深度学习领域最核心的三大方向：生成式模型、计算机视觉和Transformer架构。总共140个视频，超过12小时的系统学习，带你从基础原理出发，一步步深入到工业级应用的层面。先说生成式模型这部分。现在最火的AI绘画、AI视频生成，背后用到的核心技术就是扩散模型和GAN。课程会从最基础的自编码器和变分自编码器讲起，让你理解模型是怎么把复杂的数据压缩到一个低维的潜在空间里的。你会看到实际的代码演示，学习如何可视化潜在空间，理解为什么相似的内容在潜在空间中会聚集在一起，以及如何利用这种特性进行检索和生成。 GAN的部分则是另一条路。课程会带你从零实现一个完整的GAN训练循环，包括判别器和生成器的设计、对抗训练的过程。你会遇到GAN训练中最常见的问题——模式坍塌，也就是生成器只会产出几种固定的结果，课程会教你如何诊断和解决这个问题。然后会深入到DCGAN和CycleGAN这样的高级架构，教你如何评估生成图像的质量，如何对比不同架构的优劣。扩散模型是这两年最热门的技术方向，课程用了相当大的篇幅来讲解。从DDPM的扩散过程开始，你会学到噪声调度这个看似简单但实际上极为关键的技巧。然后是反向扩散步骤的实现，如何从纯噪声逐步还原出清晰的图像。U-Net架构在扩散模型中扮演着核心角色，课程会详细讲解跳跃连接在U-Net中的设计原理和作用。最后会延伸到条件扩散模型，教你如何根据文本描述来控制图像生成，实现真正的文本到图像生成。深度学习离不开GPU，但大多数课程只教你怎么用，不教你怎么用好。课程专门设置了GPU系统和可扩展深度学习的模块，彻底打通从算法到工程的闭环。你会学到CUDA核心和线程块的基本概念，理解GPU并行计算是怎么实现的。更重要的是学会性能分析，找出GPU利用率低和内存瓶颈的真正原因。混合精度训练能显著加速训练同时减少显存占用，分布式数据并行让你能够利用多块GPU进行大规模训练。这些技术在实际工作中都是刚需。计算机视觉是深度学习最经典的应用领域。课程从神经网络的基础讲起，手把手教你用Python从零实现前向传播、损失计算、反向传播这些核心概念。你会亲自实现一个完整的训练循环，画出损失曲线，分析模型是否正常收敛。这些基础打扎实了，后面学任何新技术都会觉得顺理成章。优化器是训练神经网络的关键。课程会系统讲解SGD、带动量的SGD、Adam、RMSprop这些常用优化器的原理和适用场景。你会通过实验对比不同优化器的收敛速度，理解为什么学习率调度如此重要，以及如何针对自己的任务选择合适的优化策略。正则化和归一化部分会教你Dropout、权重衰减、BatchNorm、LayerNorm这些技术的正确打开方式，让模型既能学到东西又不会过拟合。卷积神经网络是计算机视觉的基石。课程会从图像的多维表示开始，让你真正理解为什么图像在计算机中是一个张量，理解空间结构和通道的概念。然后是卷积层、池化层的工作原理，特征图的可视化让你直观看到模型在不同层学到了什么。目标检测和图像分割部分会介绍bounding box和分割掩码的区别，相似性学习会教你用嵌入向量来度量图像之间的相似程度。 Transformer已经成为了深度学习的统一框架，不管你是做NLP还是做CV都用得上。课程从RNN和LSTM的基础开始，解释为什么需要注意力机制，然后一步步演进到完整的Transformer架构。你会深入理解自注意力和多头注意力的数学原理，学会分析不同注意力头的作用。编码器和解码器的设计、位置编码的两种主要方法——正弦位置编码和RoPE——课程都会详细讲解。高效Transformer组件部分介绍了FlashAttention、GQA和MoE这些前沿技术，让你能够训练真正大规模的语言模型。多模态是当下的热门方向。课程会教你如何让模型同时理解和处理图像与文本，理解视觉Transformer和 CLIP 这类模型的设计原理。你会学到图像和文本的嵌入向量是如何对齐的，如何计算跨模态的相似性，以及这种能力在实际产品中怎么应用。大语言模型的相似性学习会讲到文本嵌入和语义相似度计算，这些技术在检索增强生成和知识库问答中都会用到。训练系统扩展的部分会讨论分布式Transformer训练和显存优化，让你有能力去训练真正有竞争力的模型。每节课都配有完整的Jupyter Notebook代码演示和实验，涵盖了从基础的神经网络实现到前沿的扩散模型训练。大量的对比实验和可视化帮助你直观理解每个技术的效果差异。课程最后的实践项目会带你完整实现一个条件扩散生成系统，把学到的所有知识串联起来。这门课适合已经掌握了深度学习基础，想要深入理解核心原理、跟上技术前沿的学习者。不管你是研究生做科研、工程师做产品开发，还是想系统性地补全知识体系，这门课都能给你提供足够的深度和广度。学完这门课之后，你不仅能看懂论文里的技术细节，还能自己动手实现前沿模型，理解为什么某些技术有效、某些技术不行，真正具备独立研究和创新的能力。