
资源介绍
端到端分析解决方案构建入门
通过整合数据分析与工程领域的原则,全面理解分析工程的生命周期
核心特点
探索分析工程如何与组织的数据战略相契合
获取由 7 位行业专家分享的见解
解决现代企业面临的常见分析工程问题
购买纸质书或 Kindle 版附赠免费 PDF 电子书
内容简介
由 7 位行业专家联袂撰写的《分析工程基础》,将为你介绍从基础概念到高级技能的所有知识,助你开启分析工程师的职业生涯。
在掌握数据摄入以及数据质量与可扩展性相关技术后,你将学习数据清洗转换、数据建模、SQL 查询优化与复用,以及跨平台数据服务等技术。凭借这些知识,你将实现一个从数据摄入到可视化的简单数据平台,所使用的工具包括 Airbyte Cloud、Google BigQuery、dbt 和 Tableau。你还将掌握数据完整性保障策略,重点关注数据质量与可观测性,以及版本控制(Git)等协作编码实践。此外,你将学习持续集成 / 持续部署(CI/CD)、工作流自动化、业务需求的收集、界定与文档化,以及数据治理等高级原则。
读完本书后,你将掌握开发端到端可扩展分析解决方案所需的关键技术与最佳实践。
你将学到什么
设计并实现从数据摄入到数据服务的完整数据管道
探索数据建模与 schema 设计的最佳实践
借助基于云的分析平台和工具实现数据处理的规模化
理解数据质量管理与数据治理的原则
通过协作编码、版本控制、代码审查和标准规范等最佳实践优化代码库
实现数据管道的自动化与编排
通过有效的分析用例界定、优先级划分,推动业务落地
本书适用人群
本书面向希望转型为分析工程师的数据工程师和数据分析师。希望提升技能、查漏补缺的分析工程师,以及希望了解分析工程在组织数据成熟度发展过程中价值的其他数据专业人士,也会发现本书颇具帮助。为了充分利用本书,你应具备数据分析与工程的基本概念知识,例如数据清洗、可视化、ETL(抽取、转换、加载)和数据仓库等。
目录
什么是分析工程?
现代数据栈
数据摄入
数据仓库
数据建模
数据转换
数据服务
实践:构建数据平台
数据质量与可观测性
团队协作编码
构建稳健的数据管道
收集业务需求
业务逻辑文档化
数据治理