
资源介绍
电子书
借助基于 Apache Airflow 构建的数据管道,简化、优化并扩展你的数据操作。
Apache Airflow 提供了一个功能完备的平台,用于设计、实施和监控数据管道。在 Airflow 上构建管道无需拼凑式的技术栈和自制流程,还能为流程增添安全性与一致性。《Apache Airflow 数据管道(第二版)》将教你利用这一强大平台,简化并自动化数据管道,降低运营开销,无缝集成技术栈中的所有技术。
在《Apache Airflow 数据管道(第二版)》中,你将学习:
掌握 Airflow 架构和工作流设计的核心概念
使用 Dataset API 和时间表调度数据管道,包括复杂的非规则调度
针对特定需求开发自定义 Airflow 组件
为管道实施全面的测试策略
应用构建和维护 Airflow 工作流的行业最佳实践
在生产环境中部署和操作 Airflow
在原生容器环境中编排工作流
使用 Airflow 构建和部署机器学习和生成式 AI 模型
《Apache Airflow 数据管道》已助力数千名数据工程师打造更成功的数据平台。这本全新的第二版经过全面修订,涵盖了 Apache Airflow 的最新功能,包括 Taskflow API、可延迟运算符和大型语言模型集成。书中充满真实场景和示例,将引导你从 Airflow 新手成长为专家。
关于本书
《Apache Airflow 数据管道(第二版)》教你如何构建和维护高效的数据管道。你将掌握有向无环图(DAGs)的方方面面 —— 这是 Airflow 的核心功能 —— 并学会根据管道的特定需求对其进行自定义。本书既是参考手册,也是教程,每种技术都配有引人入胜的实操示例,从训练生成式 AI 的机器学习模型到优化配送路线,不一而足。你将探索常见的 Airflow 使用模式,包括聚合多个数据源和连接到数据湖,同时发现令人兴奋的新功能,如动态调度、Taskflow API 和 Kubernetes 部署。