电子书 数据分析

叙事性 SQL:打造会讲故事的数据分析查询(英文电子书)

¥1.90 已售 0
✓ 自动发货 ✓ 永久有效 ✓ 售后保障

资源介绍

书中所有查询均基于 PostgreSQL 14.17 开发和测试,相关查询、故事和示例可通过出版商的 GitHub 仓库获取。 核心主题与内容概览 本书围绕 “叙事性 SQL” 展开,强调 SQL 不仅是查询数据的工具,更是讲述数据故事的手段。通过将 SQL 技术与叙事结构相结合,从基础的 SELECT 语句到复杂的窗口函数、子查询等,引导读者掌握用 SQL 进行数据分析并构建数据叙事的技能,适用于数据分析师、开发者及未来的数据故事讲述者。 主要章节内容 第 1 章:故事讲述者的数据库(The Storyteller’s Database) 数据与数据库基础:介绍数据的定义、价值,数据库的概念,区分关系型数据库与非关系型数据库,探讨数据库在数据分析和叙事中的作用。 SQL 入门:讲解 SQL 的起源与演变,将 SQL 命令分为数据定义语言(DDL)、数据操纵语言(DML)、数据控制语言(DCL)、事务控制语言(TCL)和数据查询语言(DQL)五大类,重点说明 DML 和 DQL 在数据分析中的应用。 PostgreSQL 环境搭建:指导读者安装 PostgreSQL、创建数据库和表,介绍 SQL 中的数据类型(如数值型、字符串型、日期时间型等)及使用示例。 叙事构建:提出 “叙事 SQL” 理念,即把自然语言查询转化为 SQL 命令,通过侦探式故事帮助读者理解 SQL 概念。 第 2 章:从 SELECT 开始(Starting with SELECT) SELECT 语句基础:阐述 SELECT 语句在数据叙事中的重要性,讲解其基本结构和语法,通过书店周年庆等故事示例说明如何选择表中的列、使用列别名、CONCAT 函数以及 SQL 数学运算。 CASE 语句与字符串模式:介绍 CASE 语句用于条件判断,以及字符串模式匹配(如使用 % 通配符)。 DISTINCT 选择与聚合函数:说明 DISTINCT 关键字用于获取唯一值,讲解聚合函数(如 COUNT、SUM、AVG 等)与常规算术函数的区别,通过社交媒体标签分析等故事展示聚合函数的应用。 第 3 章:用 WHERE 过滤事实(Filtering Facts with WHERE) WHERE 子句基础:介绍 WHERE 子句在数据叙事中的作用,讲解其语法及常用比较运算符(如 =、!=、>、<、BETWEEN、LIKE、IN 等)。 实际应用示例:通过在线商店订单分析等故事,展示如何用 WHERE 子句过滤数据,包括多条件组合(AND、OR)、日期过滤、子查询过滤等。 常见错误及避免方法:分析使用 WHERE 子句时可能出现的数据类型问题、逻辑条件错误、NULL 值处理问题和大小写敏感性问题,并给出解决方法。 第 4 章:用 JOINs 处理复杂角色(Complex Characters with JOINs) JOINs 基础:解释 JOINs 在数据叙事中的重要性,介绍 JOIN 子句的结构,详细说明不同类型的 JOIN(如 INNER JOIN、LEFT OUTER JOIN、RIGHT OUTER JOIN、FULL OUTER JOIN、CROSS JOIN、SELF JOIN 等)及其适用场景。 实际应用示例:通过足球学院球员数据、科技公司组织架构等故事,展示如何使用不同 JOIN 类型连接多个表,处理 NULL 值在 JOIN 中的情况,介绍关系数据库中的键(如主键、外键、唯一键等)。 第 5 章:聚合行为(Aggregating Acts) GROUP BY 基础:介绍 GROUP BY 子句的作用和语法,结合聚合函数(如 COUNT、SUM、AVG、MIN、MAX 等)对数据进行分组汇总分析。 高级聚合技术:讲解多步骤计算(如子查询与嵌套聚合结合)、窗口函数在聚合中的应用,通过健身房数据、汽车销售