视频课程 编程

TensorFlow高级训练与优化 (英文课程中文字幕)

¥3.90 已售 0
✓ 自动发货 ✓ 永久有效 ✓ 售后保障

资源介绍

视频数量:32个 总时长:3小时18分 课程介绍: TensorFlow高级训练与优化 用Model.fit()跑模型谁都学过,但当你真正需要实现GAN的双循环对抗训练、需要用强化学习跟环境交互、需要在大规模集群上跑分布式训练的时候,fit()那套东西就完全不够用了。这门课就是来解决这个问题的——教你从零手写训练循环,把TensorFlow的训练过程完全掌控在自己手里。 整门课32个视频,三个多小时,结构很清晰:先讲清楚自定义训练循环的基础怎么写,再一层层往上加东西,梯度裁剪、学习率调度、混合精度、分布式训练,直到最后带你跑通GNN、VAE、GAN、强化学习这些前沿架构。每一章都是先讲原理、再讲实现、最后给完整演示,节奏很舒服。 第一章从自定义训练循环讲起。你会先搞清楚什么时候Model.fit()真的不够用——不是因为它慢,而是因为它不够灵活,想做很多自定义操作的时候根本插不进去。然后课程手把手教你从头搭建完整的GradientTape循环:前向传播怎么写、反向传播怎么算、参数怎么更新,一行一行代码给你拆开看。最后还有一个完整的端到端演示,带着你把一个小网络从零训练出来,确保每个环节你都清楚是怎么回事。 第二章进入优化控制的领域。训练不稳定是个很现实的问题,梯度爆炸能让你的loss直接变成NaN,让你几小时的计算全部白费。课程会先让你理解为什么训练会变得不稳定,然后把梯度裁剪的各种实现方式给你讲清楚——哪些情况下用范数裁剪、哪些情况下用值裁剪、怎么调参才合理。学习率调度也是必须掌握的,什么时候该衰减、用什么曲线、怎么跟梯度裁剪配合,这些都有门道。最后的演示会带你把这些稳定化手段用到真实训练中。 第三章讲的是进阶技巧,混合精度训练和嵌套GradientTape。这两个技术放在一起讲是因为它们经常需要配合使用。混合精度能让你在现代GPU上大幅提升训练速度,但里面的坑不少,什么时候用float16、什么时候用bfloat16、Loss Scale怎么设,这些细节处理不好反而会让训练崩掉。嵌套GradientTape很多人可能没听说过,但它在某些高级场景下是必须的。课程会教你一个安全的工程模式,怎么把这两种技术结合起来用,然后通过一个带梯度惩罚的混合精度训练演示,让你看到实际效果。 第四章转向自定义层和模型。TensorFlow自带的层够用吗?对简单任务够用,但当你需要实现图神经网络的消息传递层、需要自定义变分自编码器的重参数化技巧、需要把强化学习的策略网络做成可调用对象的时候,subclassing就是必经之路。课程会告诉你什么时候该用Layer子类化、什么时候该用Model子类化,怎么确保你的自定义组件能正确追踪变量、怎么正确保存和加载。最后通过两个演示,带你把自定义组件接到训练流程里,从头跑通整个pipeline。 第五章是关于自定义训练组件的更深层内容。损失函数和指标是训练效果的关键,默认的MSE、交叉熵只是入门,有时候你需要的损失函数比这复杂得多,比如WGAN的Wasserstein距离、比如感知损失、比如自定义的评估指标。优化器和train_step()方法是这一章的核心——自定义优化器让你能实现各种花式学习率更新策略,而train_step()方法是真正把整个训练逻辑封装起来的地方。课程会教你怎么设计这些组件、怎么在用之前验证它们的正确性,最后通过一个专项训练演示让你看到自定义组件在实际场景中的威力。 第六章解决的是规模化问题——分布式训练。单机训练碰到算力瓶颈怎么办,数据并行、模型并行各种策略怎么选,各有什么优缺点,课程都给你掰开了讲。分布式环境下的一致性和性能保证是个大话题,怎么确保各个worker上的梯度正确同步、怎么避免通信成为瓶颈,这里面的门道不少。课程会教你如何把现有的自定义训练代码改成分布式版本,然后通过两个完整的演示带你跑通分布式自定义循环,从单机到多机无缝切换。 最后一章是重头戏,带你跑前沿架构的完整实战。首先给你一个高级工作流的模式图,告诉你GAN、VAE、强化学习这些不同类型的任务在TensorFlow里该用什么训练模式。然后针对几个典型架构逐一讲解:图神经网络GNN的消息传递层怎么实现、变分自编码器VAE的重参数化技巧怎么用、生成对抗网络GAN的双循环怎么写。强化学习部分会教你搭建完整的RL循环,包括跟环境交互、策略更新这些环节。另外还有一个很实用的内容——怎么把TensorFlow模型跟scikit-learn生态结合起来,兼顾两者的优势。三个演示项目让你把这些东西真正跑起来。 学完这门课,你能获得什么?最直接的就是彻底搞懂了TensorFlow的训练流程,能够根据需要随时改写任意环节,而不用受限于框架提供的那几个API。更重要的是,你掌握了在生产环境里真正用得上的那些技术——分布式训练怎么跑、混合精度怎么配、自定义组件怎么管理。这些都是你在实际项目中绕不开的东西。 这门课适合有TensorFlow基础、想深入掌握框架高级用法的人;适合正在做深度学习研究、需要实现复杂训练逻辑的人;适合对GAN、VAE、GNN、强化学习感兴趣、想用TensorFlow动手实现的人;也适合需要训练大规模模型、准备上生产环境的工程师。 有一点要提醒,这门课不是零基础课程。你需要熟悉Python和TensorFlow的基本用法,了解神经网络的核心概念,有一些实战经验会更顺畅。如果你是刚入门的小白,建议先把基础打扎实再来。