视频课程 编程

基于 DAB 的 CI/CD 实践

¥5.00 已售 0
✓ 自动发货 ✓ 永久有效 ✓ 售后保障

资源介绍

基于 Databricks Asset Bundles(DAB)的持续集成与持续部署实践 (中文字幕英文视频教程) 在数据工程与开发的现代化进程中,持续集成与持续部署(CI/CD)已成为保障开发效率、提升交付质量的核心支撑体系。本课程《基于 Databricks Asset Bundles(DAB)的持续集成与持续部署实践》聚焦 Databricks 生态下的 CI/CD 落地,以 Databricks Asset Bundles(DAB)为核心工具,系统构建从环境搭建到全流程自动化的完整知识体系,助力学习者掌握数据工程项目的规范化开发与自动化交付能力。 课程配套资源丰富,涵盖 14 个核心模块、56 个视频教学资源,所有视频均配备中文字幕,确保学习者能够清晰理解关键知识点与操作细节。课程内容遵循 “基础认知 — 环境搭建 — 工具实操 — 项目落地 — 全流程贯通” 的逻辑脉络,从核心概念导入到实际项目部署,层层递进,既适合数据工程领域的新手入门,也能为有经验的开发人员提供规范化、体系化的进阶指导。 课程开篇以 “引言与核心概念” 模块奠定基础,通过 5 个视频清晰铺陈课程框架、核心工具与学习路径。其中,课程概述视频明确学习目标与内容结构,帮助学习者建立整体认知;Databricks Asset Bundles 详解视频精准解析这一核心工具的定义与价值,为后续实操筑牢理论根基;CI/CD 基础概念视频则梳理持续集成与持续部署的核心逻辑,阐明其在数据工程中的应用意义;开发与 CI/CD 工作流视频结合课程实例,具象化展示完整开发链路;课程资源视频及配套链接则提供了代码仓库、学习资料等关键支撑资源,方便学习者同步实操。 环境搭建是技术课程落地的前提,本课程专门设置 “环境配置” 模块,通过 5 个视频提供全流程指导。从 Azure Databricks 工作区的搭建,到开发工具的配置,形成完整的环境准备闭环。视频内容涵盖 VS Code 的安装与配置、本地 Java 环境的部署(含版本兼容性说明与下载指引)、Python 环境的搭建,以及 Databricks CLI 的安装与配置,每个环节均配备详细操作演示,确保学习者能够顺利完成从云端到本地的环境部署,为后续开发工作扫清障碍。 Databricks CLI 作为与 Databricks 生态交互的重要工具,课程单独设置模块进行深入讲解。2 个视频分别聚焦 CLI 的工作区配置与认证,以及核心命令演示,配合配套的命令参考与 API 文档链接,帮助学习者熟练掌握 CLI 的使用技巧,实现对 Databricks 资源的高效管理与操作。 作为课程核心的 Databricks Asset Bundles(DAB),在 “Databricks Asset Bundles 入门” 模块中得到系统拆解。7 个视频从项目初始化开始,逐步深入 DAB 的核心能力:初始化视频演示项目创建的完整流程,配备 YAML 语法与配置文档参考;验证与部署视频讲解基础操作规范;多目标部署视频拓展至不同环境的部署策略;工作流作业演示视频结合部署模式详解实操应用;配置文件模块化视频教授高效配置管理方法;销毁与状态追踪视频则补充了部署生命周期的关键知识点,形成 DAB 操作的全流程覆盖。 本地开发环境的无缝衔接是提升开发效率的关键,“本地开发配置” 模块通过 6 个视频构建完整的本地开发体系。视频内容包括开发集群的创建、VS Code 与 Databricks 集群的集成配置、Databricks Connect 的安装与使用、DatabricksSession 的创建与终端运行脚本演示,同时针对 VS Code 中 Python 解释器与虚拟环境的匹配问题、虚拟环境的 Git 排除方法等实用技巧进行专项讲解,解决本地开发中的常见痛点。 理论学习需结合实际项目落地,“Citibike 项目配置” 模块以真实项目为载体,通过 2 个核心视频推进实践。项目概述视频明确项目目标与技术路线;工作区配置视频详细演示目录、模式与卷的创建流程,配套的数据集文件可直接用于实操,帮助学习者将前期掌握的工具与方法应用于实际场景,实现理论到实践的转化。 在项目实践的深化阶段,课程设置 “DAB 的笔记本任务与变量配置”“DAB 的 Python 脚本任务”“将可复用代码打包为 Wheel” 三个模块,层层递进提升开发能力。其中笔记本任务模块含 11 个视频,从代码结构解析入手,逐一讲解青铜层、白银层、黄金层笔记本的开发逻辑,深入探讨本地模块导入、作业配置与部署、变量配置(含常规变量、复杂变量、查找变量)等关键技术点,配备变量文档参考链接;Python 脚本任务模块的 2 个视频聚焦脚本参数处理与重构代码讲解,完善脚本开发能力;Wheel 打包模块的 4 个视频则从 Wheel 创建、集群安装、作业中安装到 Wheel 任务配置,完整覆盖可复用代码的封装与应用流程,配备 setuptools 文档参考,提升代码复用与管理效率。 Delta Live Table(DLT)作为 Databricks 生态的重要组件,“基于 DAB 的 Delta Live Table 管道” 模块通过 2 个视频实现 DAB 与 DLT 的结合应用,分别讲解 DLT 管道源笔记本的开发与管道配置方法,拓展 DAB 的应用场景。 为帮助学习者梳理核心知识,“Databricks Asset Bundles-YAML 配置方法总结” 模块通过 1 个总结视频,结合 DAB 配置参考、REST API 参考等链接,系统归纳 YAML 配置的核心思路与方法,同时补充通过 UI 获取现有作业定义的实用技巧,实现知识的沉淀与升华。 本地开发的质量保障离不开单元测试,“本地 SparkSession 开发与单元测试” 模块通过 7 个视频构建完整的测试体系。内容涵盖本地 SparkSession 的搭建与使用、Pytest 单元测试入门(含文档参考)、项目中添加单元测试、基于 Databricks Connect 运行单元测试、conftest.py 集中管理 Pytest 固件、测试覆盖率报告生成(含 pytest-cov 文档参考),最后以总结视频梳理测试流程,确保开发质量可控。 课程的终极目标是实现全流程自动化,“基于 DAB 与 GitHub 的端到端 CI/CD 工作流” 模块作为核心实战环节,通过 17 个视频构建完整的自动化交付链路。视频内容从 Git 与 GitHub 基础要求入手,配套基础图示与可选的基础操作演示;环境依赖管理视频讲解需求文件配置;代码仓库发布与新开发者入职流程视频覆盖团队协作场景;GitHub Actions 入门视频结合文档参考,解析自动化工具核心能力;CI/CD 流程概述视频明确全流程逻辑;CI 工作流实现视频分两部分详细演示配置过程;服务主体相关视频讲解 Azure 服务主体的创建、测试与生产环境部署配置(含认证文档参考);GitHub 环境配置视频演示环境搭建与管理;CD 工作流实现视频完成部署自动化配置;最终通过端到端演示视频完整呈现从开发到部署的全流程,实现 CI/CD 的落地闭环。 课程最后以 “课程总结” 模块收尾,通过 1 个总结视频回顾核心知识点,肯定学习者的学习成果,为后续实践应用提供激励与指引。 本课程通过系统的模块设计、丰富的实操演示、完整的项目支撑,构建了从基础到进阶、从理论到实践的 Databricks CI/CD 学习体系。所有内容均配备中文字幕与配套资源链接,确保学习过程顺畅高效,助力学习者快速掌握基于 DAB 的 CI/CD 实践能力,提升数据工程项目的开发与交付水平。