
资源介绍
设计具备数据加载概念、高级计算、富有洞察力的可视化技术及新功能的交互式仪表板应用
介绍如何使用 Tableau 设计交互式仪表板应用,涵盖数据加载概念、高级计算、有洞察力的可视化技术和新功能。
适用人群:有志于成为 Tableau 开发人员、BI 分析师、数据探索者和其他数据爱好者,无需 Tableau 或高级 IT 概念的先验知识,具备基本的 MS-Excel 知识会有帮助。
主要内容概览
本书共 14 章,涵盖 Tableau 从基础到高级的各类知识,具体如下:
第 1 章:入门
Tableau 套件主要应用:包括 Tableau desktop(可视化创作应用,需授权)、Tableau Public(免费平台,功能有限制)、Tableau Server(可视化存储库,需授权)、Tableau Online(云端的 Tableau Server)、Tableau Prep builder(用于数据的 ETL 操作,需授权)。
Tableau 的作用与工作原理:作为数据可视化应用,强调商业智能,在 BI 生命周期的最后一步呈现数据;可连接多种数据源,以实时或提取方式连接,创建的可视化可发布到服务器供用户使用。
安装相关:介绍了 Tableau desktop 和 Tableau Public desktop 的安装要求及步骤。
其他:介绍了 My Tableau Repository 文件夹、Tableau 中的文件类型、书中使用的数据集、Tableau 开发环境及保存设计文件的方法。
第 2 章:数据窗格
数据类型:包括文本 / 字符串、日期、日期 / 时间、数值、布尔值和地理数据类型,且可根据可视化需求更改。
Tableau 生成的字段:如 Orders (Count)、Measure Names、Measure Values、Latitude (generated) 和 Longitude (generated) 等。
维度和度量:维度描述数据,为定性属性;度量量化价值,为定量属性,两者在可视化中作用不同,且可相互转换。
离散和连续数据:维度多为离散数据(蓝色),创建标签;度量多为连续数据(绿色),创建轴,且它们对颜色显示有影响。
日期的离散与连续:日期默认作为离散维度,可转换为连续,且有相应的层级结构。
聚合:Tableau 对度量自动聚合,默认聚合为求和,维度也可聚合,但选项有限。
第 3 章:数据转换
重命名字段:可通过右键菜单或直接点击字段名重命名,以提供更友好的名称。
创建层次结构:在维度字段上创建,便于在可视化中进行钻取操作,以父子结构呈现。
移动字段:当 Tableau 对字段分类错误时,可手动将字段在维度和度量间移动。
组织字段到文件夹:将相关字段组织到文件夹,方便使用,可在维度和度量上创建。
创建别名:为维度的成员提供替代名称,仅适用于维度,不能用于日期或度量。
拆分列:基于分隔符拆分字段,有 Split 和 Custom Split 两种方式。
默认属性:可设置字段的默认格式等属性,如注释、颜色、形状、排序、数字格式等,且在多个工作表中保持一致。
数据提取:是数据的压缩快照,与实时连接不同,介绍了创建和刷新提取的方法。
重用数据源:可将数据源保存为.tds 或.tdsx 文件,或发布到 Tableau 服务器供共享。
第 4 章:组合数据
关系:Tableau 2020.2 新增功能,基于公共字段和基数在同一数据源的多个表间创建逻辑层关系,保留各表数据,在可视化时结合相关数据。
连接:在物理层基于连接类型合并表数据,有内连接、左连接、右连接和全外连接等类型。
联合:用于追加一个或多个表的行,要求表结构相同,可合并同一数据源的多个表或文件夹中的多个文件。
自定义查询:使用复杂的数据库查询直接在 Tableau 中组合数据,可复制粘贴复杂 SQL。
数据混合:用于显示来自不同数据源的数据,每个数据源单独查询但在可视化中一起显示,需至少一个同名且值匹配的维度列。
第 5 章:Tableau 中的计算
数据粒度:指表或视图中数据的详细程度,受维度字段影响,而非度量。
计算字段:用于实现业务逻辑,创建数据集中不存在的列,根据表达式可作为维度或度量。
计算类型:包括常规计算、表计算和详细级别(LOD)计算。
常规计算:介绍了逻辑函数(如 IF)、IN 函数、ATTR 函数、ZN 函数、字符串函数(如 Proper、Contains)等的使用。
第 6 章:表计算和 LOD 计算
表计算:在可视化级别计算,使用 Tableau 提供的表计算函数,用于计算运行总计、占总计的百分比等,涉及寻址和分区字段。
快速表计算:是预定义的表计算。
LOD 计算:在数据源级别和可视化级别计算,提供对数据粒度的更多控制,使用 Fixed、Include 和 Exclude 关键字。
第 7 章:日期函数
Tableau 中的日期:日期可分为离散和连续,有预定义的层级结构,可对日期应用聚合。
日期属性:可修改默认日期属性,更改日期的数据类型。
自定义日期:通过创建自定义日期选项获取不同级别或格式的日期。
日期函数:介绍了 DATEADD、DATEDIFF、DATEPARSE、DATEPART、DATENAME 和 DATETRUNC 等常用日期函数的使用。
第 8 章:筛选器和参数
筛选器:用于根据用户定义的条件限制数据,有多种类型,如提取筛选器、数据源筛选器、上下文筛选器等,且有特定的执行顺序。
参数:类似于工作簿级别的全局变量,可用于替换计算中的常量值,可在筛选器和计算中使用,在视图中通过 “显示参数” 选项显示,且为单选择。
第 9 章:排序
排序类型:包括使用工具栏图标排序、字段排序、手动排序和嵌套排序。
各种排序方式:工具栏图标提供快速排序;字段排序可通过字段右键菜单进行;手动排序通过拖拽数据点实现;嵌套排序用于视图中有多个维度的情况。
第 10 章:组、集和箱
组:用于组合字段中相关的数据成员,可从视图或数据窗格创建,可用于计算字段,也可从不同维度创建。
集:基于特定条件获取数据子集,有动态集(随基础数据变化)和固定集(不随基础数据变化),可组合两个基于相同维度的集,也可用于计算。
箱:用于对度量值进行分组,是等大小的容器,有固定箱(硬编码箱大小)和动态箱(使用参数)。
第 11 章:地图
Tableau 中的地图:用于在地理位置上分析数据,基于经纬度绘制,有符号地图和填充地图等。
地理角色:Tableau 自动识别位置字段并分配地理角色,也可手动分配。
未知位置编辑:当 Tableau 无法识别位置时,可进行编辑处理。
背景图层:用于自定义地图外观,有不同的样式和图层选项。
标记图层:允许在地图上叠加多个地理 / 空间数据层,各层可独立设置样式。
空间函数:如 AREA、MAKEPOINT、MAKELINE、BUFFER、DISTANCE 等,用于高级空间分析。
第 12 章:可视化(第一部分)
可视化基础:数据可视化是数据的图形表示,有助于将原始数据转化为有意义的图表,关键元素包括图表类型、工作表、仪表板、故事、颜色、标签和工具提示。
格式化:可在工作簿级别、特定工作表、仪表板或故事上实现,以提供一致的外观。
各类可视化:介绍了文本表、热图、密度热图、突出显示表、地图、饼图、甜甜圈图、棒棒糖图、堆积条形图、并列条形图、树状图等的创建和应用场景。
第 13 章:可视化(第二部分)
更多可视化类型:包括折线图、面积图、子弹图、甘特图、聚类分析、预测、工具提示中的可视化、表报告和图像角色等的创建和应用。
第 14 章:仪表板
Tableau 中的仪表板:是多个工作表可视化的组合,呈现组织的关键绩效指标,设计时需考虑屏幕尺寸、相关工作表组合等。
仪表板工作区:包括仪表板窗格(用于指定大小、设备布局等)和布局窗格(用于控制工作表和对象的放置)。
容器:有水平、垂直和空白容器,可分为平铺和浮动,用于组织仪表板中的内容。
使用动作实现交互性:包括筛选器动作、突出显示动作、转到 URL 动作、转到工作表动作、更改参数动作、更改集值动作等,用于为仪表板中的数据添加交互性。
动态区域可见性:根据字段值或参数隐藏或显示区域,适用于不同用户组使用的仪表板。
故事:将仪表板和工作表按顺序组合,以传达关于业务元素或度量的叙述,类似于 PowerPoint 演示文稿。
Dashboarding with TABLEAU