视频课程 人工智能

深度学习进阶架构:从理论到实践的系统指南 (英文课程中文字幕)

¥5.00 已售 0
✓ 自动发货 ✓ 永久有效 ✓ 售后保障

资源介绍

视频数量:140个 总时长:12小时7分 课程介绍: 深度学习进阶架构:从理论到实践的系统指南 你有没有想过,那些能够生成逼真图像的人工智能模型,背后到底是怎么运作的?为什么GPT能理解你的问题,Midjourney能画出你想象中的画面,而特斯拉的自动驾驶能够准确识别道路上的每一个物体?这些看似神奇的能力,都建立在深度学习架构的精妙设计之上。如果你想真正理解这些技术的底层原理,而不是仅仅停留在调API调参数层面,这门课程会给你一个完整的答案。 这门课程来自Coursera的进阶深度学习专项课程,由浅入深地覆盖了深度学习领域最核心的三大方向:生成式模型、计算机视觉和Transformer架构。总共140个视频,超过12小时的系统学习,带你从基础原理出发,一步步深入到工业级应用的层面。 先说生成式模型这部分。现在最火的AI绘画、AI视频生成,背后用到的核心技术就是扩散模型和GAN。课程会从最基础的自编码器和变分自编码器讲起,让你理解模型是怎么把复杂的数据压缩到一个低维的潜在空间里的。你会看到实际的代码演示,学习如何可视化潜在空间,理解为什么相似的内容在潜在空间中会聚集在一起,以及如何利用这种特性进行检索和生成。 GAN的部分则是另一条路。课程会带你从零实现一个完整的GAN训练循环,包括判别器和生成器的设计、对抗训练的过程。你会遇到GAN训练中最常见的问题——模式坍塌,也就是生成器只会产出几种固定的结果,课程会教你如何诊断和解决这个问题。然后会深入到DCGAN和CycleGAN这样的高级架构,教你如何评估生成图像的质量,如何对比不同架构的优劣。 扩散模型是这两年最热门的技术方向,课程用了相当大的篇幅来讲解。从DDPM的扩散过程开始,你会学到噪声调度这个看似简单但实际上极为关键的技巧。然后是反向扩散步骤的实现,如何从纯噪声逐步还原出清晰的图像。U-Net架构在扩散模型中扮演着核心角色,课程会详细讲解跳跃连接在U-Net中的设计原理和作用。最后会延伸到条件扩散模型,教你如何根据文本描述来控制图像生成,实现真正的文本到图像生成。 深度学习离不开GPU,但大多数课程只教你怎么用,不教你怎么用好。课程专门设置了GPU系统和可扩展深度学习的模块,彻底打通从算法到工程的闭环。你会学到CUDA核心和线程块的基本概念,理解GPU并行计算是怎么实现的。更重要的是学会性能分析,找出GPU利用率低和内存瓶颈的真正原因。混合精度训练能显著加速训练同时减少显存占用,分布式数据并行让你能够利用多块GPU进行大规模训练。这些技术在实际工作中都是刚需。 计算机视觉是深度学习最经典的应用领域。课程从神经网络的基础讲起,手把手教你用Python从零实现前向传播、损失计算、反向传播这些核心概念。你会亲自实现一个完整的训练循环,画出损失曲线,分析模型是否正常收敛。这些基础打扎实了,后面学任何新技术都会觉得顺理成章。 优化器是训练神经网络的关键。课程会系统讲解SGD、带动量的SGD、Adam、RMSprop这些常用优化器的原理和适用场景。你会通过实验对比不同优化器的收敛速度,理解为什么学习率调度如此重要,以及如何针对自己的任务选择合适的优化策略。正则化和归一化部分会教你Dropout、权重衰减、BatchNorm、LayerNorm这些技术的正确打开方式,让模型既能学到东西又不会过拟合。 卷积神经网络是计算机视觉的基石。课程会从图像的多维表示开始,让你真正理解为什么图像在计算机中是一个张量,理解空间结构和通道的概念。然后是卷积层、池化层的工作原理,特征图的可视化让你直观看到模型在不同层学到了什么。目标检测和图像分割部分会介绍bounding box和分割掩码的区别,相似性学习会教你用嵌入向量来度量图像之间的相似程度。 Transformer已经成为了深度学习的统一框架,不管你是做NLP还是做CV都用得上。课程从RNN和LSTM的基础开始,解释为什么需要注意力机制,然后一步步演进到完整的Transformer架构。你会深入理解自注意力和多头注意力的数学原理,学会分析不同注意力头的作用。编码器和解码器的设计、位置编码的两种主要方法——正弦位置编码和RoPE——课程都会详细讲解。高效Transformer组件部分介绍了FlashAttention、GQA和MoE这些前沿技术,让你能够训练真正大规模的语言模型。 多模态是当下的热门方向。课程会教你如何让模型同时理解和处理图像与文本,理解视觉Transformer和 CLIP 这类模型的设计原理。你会学到图像和文本的嵌入向量是如何对齐的,如何计算跨模态的相似性,以及这种能力在实际产品中怎么应用。大语言模型的相似性学习会讲到文本嵌入和语义相似度计算,这些技术在检索增强生成和知识库问答中都会用到。训练系统扩展的部分会讨论分布式Transformer训练和显存优化,让你有能力去训练真正有竞争力的模型。 每节课都配有完整的Jupyter Notebook代码演示和实验,涵盖了从基础的神经网络实现到前沿的扩散模型训练。大量的对比实验和可视化帮助你直观理解每个技术的效果差异。课程最后的实践项目会带你完整实现一个条件扩散生成系统,把学到的所有知识串联起来。 这门课适合已经掌握了深度学习基础,想要深入理解核心原理、跟上技术前沿的学习者。不管你是研究生做科研、工程师做产品开发,还是想系统性地补全知识体系,这门课都能给你提供足够的深度和广度。学完这门课之后,你不仅能看懂论文里的技术细节,还能自己动手实现前沿模型,理解为什么某些技术有效、某些技术不行,真正具备独立研究和创新的能力。