描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787121391293
用DIKW模型解释可视化分析原理
以可视化心理学研究的成果解释了什么是可视化的前意识属性
详细阐述了Tableau可视化分析全流程
系统介绍Tableau 可视化数据准备产品——Tableau Prep Builder
本书系统地讲解了Tableau Prep Builder和Tableau Desktop的原理与实践应用。全书以可视化分析、Tableau计算为重点,详细介绍了如何理解数据的层次、如何使用Tableau Prep Builder整理和准备数据、如何使用Tableau Desktop开展敏捷数据分析、Tableau高级互动,特别是深入介绍了Tableau的各种计算,从而以有限的数据实现无限的业务场景分析。全书贯穿数据与问题的层次分析方法,并用实例加以说明,不仅适合希望系统学习Tableau的初学者,而且适合Tableau的中高级分析师。
第1篇 从数据到图形:Tableau可视化
第1章 可视化分析:进入大数据时代的理性与直觉之门 2
1.1 数据金字塔:从数据到决策有多远? 2
1.2 直觉先于理性:可视化的心理学 5
1.3 Tableau:大数据时代的“梵高” 8
1.4 Tableau快速学习路线图 11
第2章 数据可视化:理念与基础 13
2.1 从Excel到Tableau:不同的视角与层次思维 13
2.1.1 IT分析师和业务人员看待数据的不同视角 14
2.1.2 数据分析的层次模型 16
2.1.3 层次、聚合度和颗粒度 18
2.2 数据基础概念:字段、图形与拖曳逻辑 20
2.2.1 编码:从真实世界到虚拟世界 20
2.2.2 数据分析的两种表达方式:数据交叉表与可视化图表 21
2.2.3 字段的两种分类:维度和度量 21
2.2.4 字段的两种特征:连续和离散 23
2.2.5 从字段到图形:Tableau Desktop的设计逻辑 25
2.3 Tableau Desktop初级可视化:过程与方法 27
2.3.1 数据连接:建立连接和基本整理 28
2.3.2 数据可视化:基本方法与基本图形 30
2.3.3 数据洞察:组合与互动 37
2.3.4 分享数据见解 39
第3章 数据准备:用Prep Builder进行数据整理与结构调整 41
3.1 Prep Builder基础操作 41
3.2 初级字段整理:数据清理和筛选 44
3.2.1 数据拆分 47
3.2.2 数据分组 49
3.2.3 筛选器 51
3.2.4 字符串清理 53
3.3 中级结构整理:数据转置 53
3.3.1 Prep Builder和Desktop的列至行转置 54
3.3.2 Prep Builder的行至列转置 55
3.4 高级结构整理:数据聚合 56
3.4.1 聚合的必要性和用法——单一层次聚合 56
3.4.2 FIXED LOD——独立层次聚合 59
3.4.3 Prep Builder聚合的注意事项 63
3.5 高级计算:在Prep Builder中计算排名 63
3.5.1 单一维度的排名计算 63
3.5.2 具有分区字段的排名计算 64
3.5.3 行级别排名与密集排名 65
第4章 数据准备:数据合并与数据建模 68
4.1 行级别合并:并集、连接与Desktop方法 68
4.1.1 数据并集 69
4.1.2 数据连接 72
4.1.3 并集与连接的异同点 76
4.2 视图级别合并:数据混合与Desktop方法 78
4.2.1 使用Desktop进行数据混合 79
4.2.2 数据混合的逻辑及其与连接的差异 84
4.3 使用Prep Builder做数据合并 86
4.3.1 使用Prep Builder 完成数据并集 86
4.3.2 使用Prep Builder做数据连接 92
4.3.3 使用Prep Builder完成“数据混合”:聚合 连接 95
4.4 如何选择数据合并方式 97
4.5 数据模型:数据关系 99
4.5.1 从物理表到逻辑表:数据关系的背景与特殊性 99
4.5.2 数据模型(上):以数据关系实现数据连接 101
4.5.3 数据模型(下):建立物理层和逻辑层的多层关系 103
4.5.4 改善数据模型的性能(上):关系类型 107
4.5.5 改善数据模型的性能(下):引用完整性 110
4.5.6 从数据合并迈向数据建模 111
4.6 数据准备综合应用 112
4.6.1 使用Prep Builder快速合并和整理Excel数据 112
4.6.2 使用Prep Builder匹配和整合SAP HANA多表数据 117
4.7 为什么Prep Builder是数据整理的 121
4.8 如何优雅地使用Prep Builder 124
4.8.1 思考和问题先于数据 125
4.8.2 层次思维是关键 125
4.8.3 各有所长:与其他工具的匹配和合作 125
4.8.4 Prep Builder与Desktop的结合 127
第5章 可视化分析与探索 128
5.1 Tableau报表可视化的三步骤 128
5.1.1 整理字段:理解数据表中的独立层次结构 128
5.1.2 工作表:依据字段的层次结构完成数据可视化 131
5.1.3 仪表板:探索不同数据之间的关联关系 137
5.2 Tableau复杂业务问题中的关联分析 138
5.2.1 多数据分析:每个数据表行级别的性 138
5.2.2 即席计算:通过计算字段完善分析模型 140
5.2.3 数据解释:AI驱动的智能关联分析 141
5.3 如何选择可视化图表框架 142
5.3.1 常见的问题类型与图表 142
5.3.2 从简单可视化到复杂可视化 152
5.4 高级可视化功能 163
5.4.1 度量名称与度量值:并排比较多个度量 163
5.4.2 条形图双轴:各个子类别的销售额和利润 166
5.4.3 堆叠度量与重叠度量:重叠比较多个度量 166
5.4.4 聚合度量与解聚度量 169
5.5 可视化增强分析技术 170
5.5.1 常用筛选器及其优先级 170
5.5.2 集 177
5.5.3 参数 181
5.5.4 分组和分层结构 182
5.5.5 排序:对数据按照规则排序 183
5.5.6 参考线、参考区间、分布区间和盒须图 185
5.6 格式设置 194
5.6.1 通过标签设置突出度量值 195
5.6.2 工具提示的高级设置 196
5.6.3 其他常见设置 199
第6章 地理位置可视化 201
6.1 Tableau地理分析简介 201
6.2 符号地图和填充地图 203
6.3 点图和热力图 206
6.4 路径地图 207
6.5 空间函数 212
6.6 地图与形状的结合:自定义图形与HEX函数 217
第7章 与数据对话:信息呈现与高级交互 220
7.1 比“数据”更多:从工作簿到仪表板 220
7.1.1 仪表板:可视化七巧板 221
7.1.2 精确设计和布局 223
7.1.3 更节省空间的折叠工具栏 225
7.1.4 多设备设计和大屏设计 226
7.2 故事:构建你的DataPoint 227
7.3 可视化交互:与数据对话 228
7.3.1 多重筛选和共用筛选器 229
7.3.2 页面与动画 231
7.3.3 突出显示 234
7.4 高级互动:动态参数和参数动作 235
7.4.1 实例:使用参数更新度量 237
7.4.2 实例:使用操作动态更新度量 239
7.4.3 实例:使用参数动作动态控制参考线 240
7.4.4 实例:使用参数展开指定的类别 243
7.5 高级互动的:集动作 244
7.5.1 实例:指定省份的销售额占比 245
7.5.2 实例:查看所选省份在各商品类别的销售占比 247
7.5.3 实例:各省份相对于指定省份的销售额差异 248
7.5.4 实例:指定省份随着日期的销售趋势 251
7.5.5 关键原理:Tableau多种操作的优先级 254
7.5.6 高级实例:多个集动作构建的自定义矩阵 254
7.5.7 技巧:集与分层结构、工具提示的结合 258
7.6 让集动作更强大:增量更新与集控制 258
7.6.1 集动作增减 259
7.6.2 集控制——“集”真正变身“多值参数” 260
7.7 高级互动的使用建议 261
第2篇 从有限到无限:Tableau计算
第8章 Tableau基本计算:原理与入门 264
8.1 数据的层次与两类基本的计算类型 264
8.1.1 借助Excel学大数据:行级别计算和聚合计算 265
8.1.2 从Excel数据透视表到Tableau视图计算 268
8.2 行级别函数及其作用 272
8.2.1 行级别函数的使用场景 272
8.2.2 字符串函数 274
8.2.3 日期函数 278
8.2.4 数字函数 285
8.2.5 类型转换函数 286
8.2.6 高级字符串函数之“正则函数” 287
8.3 聚合函数 290
8.4 逻辑函数及行级别与聚合计算的差异 291
8.4.1 IF函数 292
8.4.2 IIF函数 293
8.4.3 CASE WHEN函数 294
8.4.4 其他简化逻辑判断 294
8.4.5 高级实例:各类别的盈利分层与盈利结构分析 295
8.4.6 高级说明:两类逻辑表达式的差异 298
第9章 Tableau高级计算:表计算 302
9.1 多层次分析与高级计算原理简介 302
9.1.1 表计算函数代表:WINDOW_SUM函数 303
9.1.2 狭义LOD表达式代表:FIXED LOD 306
9.1.3 广义LOD表达式的分类及区别 310
9.2 表计算的独特性与原理 311
9.2.1 表计算的独特性原理 312
9.2.2 表计算的独特性:维度如何参与计算过程 313
9.2.3 两种指定方向的方法 316
9.3 表计算函数及实例 318
9.3.1 代表性的函数: LOOKUP函数和差异计算 319
9.3.2 RUNNING_SUM函数:移动汇总计算 320
9.3.3 实例:LOOKUP和RUNNING_SUM表计算(TC5) 321
9.3.4 WINDOW_SUM函数:窗口汇总函数 326
9.3.5 WINDOW_SUM函数初级实例:加权计算与合计百分比(TC6) 329
9.3.6 WINDOW_SUM函数中级实例:相对于任意选定子类别的相对差异 332
9.3.7 高级实例:相对于任意日期的百分比差异(TC1) 335
9.3.8 参数类表计算 338
9.3.9 INDEX与RANK函数:排序表计算 340
9.3.10 实例:基于公共日期基准的销售增长(INDEX函数)(TC2) 341
9.3.11 实例:随日期变化的RANK函数(TC4) 343
9.3.12 统计类表计算和第三方表计算 346
9.3.13 快速表计算 347
9.4 高级表计算设置 348
9.4.1 实例:多遍聚合的嵌套表计算(TC3) 348
9.4.2 实例:多个方向字段的深度优先原则 349
9.5 综合实例:帕累托分布图制作方法 351
9.6 综合实例:作为筛选器的表计算 356
9.7 Tableau 2020新功能:Prep Builder计算特定层次的排名 359
第10章 高级计算:狭义LOD表达式 362
10.1 LOD表达式的独特性和原理 362
10.2 LOD表达式的语法 365
10.3 FIXED LOD表达式的3种类型 367
10.3.1 聚合度高于视图的详细级别 368
10.3.2 聚合度低于视图的详细级别 372
10.3.3 独立于视图的聚合 375
10.3.4 3种语法的原理说明 376
10.4 INCLUDE/EXCLUDE LOD表达式 377
10.4.1 EXCLUDE LOD实现更高层次的聚合 377
10.4.2 INCLUDE LOD实现更低层次的聚合 378
10.4.3 FIXED、EXCLUDE、表计算的计算逻辑与优先级 379
10.5 如何选择高级计算类型——层次分析 381
10.5.1 高级分析的4个步骤 381
10.5.2 高级分析4个步骤的简要示例 386
10.6 高级应用:嵌套LOD
推荐序一
英国数学家和企业家、消费者洞察公司Starcount的首席数据科学家Clive Humby曾经说过:“数据是新的石油!”但是如果数据不能被提炼,就不能被真正利用。就像石油需要被转换成燃料、化工制品等才可以变成有价值的物品驱动盈利的行为,数据必须被整合、分析后才会产生价值。
越来越多的企业领导者认识到数据的价值,并且付出行动,开始向“数据驱动型企业”转型。根据咨询公司麦肯锡的调查,在数据转型的道路上,92%的企业面临挫折,只有8%的企业取得了成功。市场咨询公司IDC和Gartner的研究指出,在推动数据驱动型企业的转型道路上,企业员工的数据素养是企业转型的关键因素之一;所谓的数据素养是指人们读取、处理分析和讨论数据的能力。Gartner 预测,数据素养是21世纪人类需要的重要的技能之一。自2003年诞生以来,Tableau一直致力于“帮助人们看到和理解数据”这一伟大使命,很多数据分析爱好者、Tableau的粉丝也在默默传播数据分析文化。
在国内,有很多学术机构和商业机构编写了不少Tableau主题的书籍,介绍如何使用Tableau进行数据分析。近,我拜读了“Tableau 传道士”喜乐君(吴玉鹏)的《数据可视化分析:Tableau原理与实践》初稿,马上给人眼前一亮的感觉。喜乐君以非技术人员的背景,将数据可视化的原理、过程和方法娓娓道来,以浅显的道理将读者带入了可视化分析的领域,进而用Tableau 将这些理论方法变成实践。
在国内众多的图书中,本书创造了众多“次”,具有鲜明的特征:
? 国内本用DIKW模型解释可视化分析原理的书——在商业用户中,很多人问Tableau和其他厂商有什么区别?当你了解DIKW模型后,你自然会理解为什么Tableau可视化分析与其他厂商产品有本质区别。
? 国内本以可视化心理学研究的成果解释了什么是可视化的前意识属性(Preattentive Attribute)的书,并利用可视化实践将这些元素用于可视化分析。
? 国内本详细阐述了Tableau可视化分析全流程的书,并一一讲解可视化分析的平台,真正反映了Tableau可视化数据分析平台的精髓。
? 国内本系统介绍Tableau 可视化数据准备产品——Tableau Prep Builder的书,方便用户进行数据准备。
? 数据是为了回答业务问题的,本书以业务实例的方式展示了技术人员和业务人员看待数据的不同方式,按照业务人员的分析思维用Tableau将数据分析层层展示,探索数据的价值。
? 本书也展示了大量Tableau使用中的实践和业务模型,方便读者快速应用到实际业务场景中。
感谢喜乐君倾心编写本书,无论你是数据分析的老兵还是数据数据分析的小白,这本书都会给你提供非常有价值的信息。作为帮助企业推广数据分析文化的同道中人,感谢喜乐君将自己的实践心得整理成书,奉献给读者!感谢喜乐君在践行Tableau的使命——Help People See and Understand Data!祝愿更多的读者通过本书进入数据分析领域,帮助企业成为数据驱动型企业,成为企业数据分析文化的布道者!
Tableau大中华区副总裁 张磊
2020年3月21日于新加坡
推荐序二
欣闻喜乐君要写一本关于Tableau学习方面的书,我很是期待。
我在2007年真正深入接触数据分析,除了Office里面的Excel和Access,公司正在逐步推行BI,在早些年接触过SAP BW、SAP BO等建模和展示工具,直到2014年7月公司升级BI系统,引入Tableau,从此被这款绚丽的可视化工具所吸引。Tableau这些年在国内发展迅猛,版本不断迭代,但我们对其的认识和应用基本还是停留在初的作图展示阶段。
在Tableau官方的推荐下,2019年夏天,我请喜乐君为我的团队提供了3天的Tableau深层应用培训,这使得我们次比较系统地学习了Tableau的理论基础、数据处理以及深层次应用。也正因为这3天的培训,使我对作者对Tableau的掌握和理解程度感到由衷赞叹。因为他并非技术人员出身,而是一个典型的应用人员,通过自己的实践、摸索和自学达到了专家级的水平。
数据分析的难点在哪里?在理解业务的前提下,无非是复杂的数据处理、错综的逻辑表达以及如何直观地展示,而Tableau具备了解决以上问题的所有特点。不过,市面上很多Tableau相关书籍或一些视频课程,都偏于功能介绍,却不能系统地从原理和应用两个方面阐述。
我翻阅了这本书的样稿,除去前面的理论介绍,大致分为3个方面:数据基础处理、数据可视化和高级应用。作者都结合自己的实践经验将其故事化、场景化,通过优雅的文笔、哲学的思维在纸上娓娓道来。通过阅读,你会发现技术并不枯燥,数字亦很有趣。作为由业务人员成长起来的数据分析师,本书作者更加了解业务需求的痛点、使用的难点以及Tableau的核心优点。
我也相信读者通过阅读学习此书,不仅能绘制适合应用场景的图表,更能学会和理解其原理和方法;还能养成数据思维,进而能在自己的领域达到一定的高度。
作者是一位有深厚修为、深谙哲学且学识渊博的人,本书虽为侧重应用的工具书,但也不乏是一本介绍数据思维培养的难得读本!每一个章节不仅有专业的统计学术语,也有对数据处理原理通俗的解释,这些论述内容都融入了作者哲理性的思维和个人的虔诚。
这是一本可以面向初级、中级和高级各个阶段应用者学习的书籍,我相信每位读者都会有不同的收获!
石家庄以岭药业股份有限公司,营销效率部经理 宋洪涛
2020年4月3日
推荐序三
十年前,作为供应链管理咨询顾问团队成员,我为外企、国企、民企等各类型企业提供数据方案规划时,感受特别深的就是各层级领导和部门关注的KPI差异很大。当我们试图提供一套通用的KPI报告时,公司的各级管理层、经营层和执行层,都会提出层出不穷的新需求。那时我就想,如果能有一个工具,让各层级的人员结合自己的业务经验,确定分析视角,自行完成数据提取、分析展现和预测趋势,那么将会使行业管理变得更轻松。
五年前,我开始深入零售数据分析领域,我和团队列出了25个影响门店销量和利润的关键点,借助数据分析精确指导门店铺货、调货,不仅完全控制了货物损失,更是实实在在地将销售额增长了65%以上,净利润增长自不必说。不过,那时仅靠团队成员从各种报表中手动提取数据,再用Excel分析,不仅工作量巨大,而且需要每天反复地进行数据验证,这对团队中的每个人的能力、体力、精力是考验也是折磨。那时我就想,如果能有一个工具可以即时呈现、灵活验证、固化模型,将会减少非常多的工作量。
很幸运的是,2019年年底,我认识了喜乐君,他向我简单介绍了敏捷BI的代表作Tableau,不足两小时的时间,我就确定它能解决我多年来的数据困扰,能让我的团队发挥更大的价值。
喜乐君并非IT专业,却有深厚的业务背景,正因为如此,他更清楚业务分析的需求点,更明白如何可视化数据,让管理者一目了然,包括各种维度、习惯,所以基于业务目标或者问题的分析,他总是能深入浅出地解析。他那种不骄不躁的沉稳、执着让人佩服,Tableau工具的灵活、便捷也被他演绎得淋漓尽致。当他说想写一本Tableau主题的数据分析的书,帮助所有爱好者、需要者快速掌握并受益时,我就非常期待这本书的问世。
时隔不足半年,喜乐君便将本书的稿寄给了我。他用通俗易懂的方式,特别是大量的图形和示例,向读者展示了他多年来使用Tableau的经验和思考。特别是他总结的报表分析的多个步骤、高级分析的过程,可以帮助公司的数据分析师少走弯路,从而大幅度地提高效率。
衷心地感谢这本书介绍的工具、方法、分析维度给我带来的轻松感,它可以说是让IT部门升级为DT部门并得到企业认可的催化剂。
湛江国联水产开发股份有限公司,信息总监 王强
2020年4月26日
推荐序四
能为我的学生作序,十分开心,因为我看到玉鹏(喜乐君)在继续前行。
我和玉鹏在2007年的山东大学创新教育的课堂上结下师生之缘,至今保持了十多年的师生友谊。玉鹏是法学本科和教育学硕士毕业,对学习创新一直保持着渴望,更难能可贵的是,他能在学习中加入自己的理解、展望。他早早地寄来他的书稿请我过目,这本书有许多与众不同之处。
其一,他在书中展示的不只是操作方法,而更多是自己的理解;其二,理念超前,他从自己的分析经验中努力构建各种分析方法,“营造方法”是发明创造中关键的部分。
玉鹏时常和我沟通他的工作、学习,以及动态性思考问题的方法,呈现在你眼前的这本书,是他近几年的学习成果。当你读完本书后就会发现,他没有教科书一般地罗列知识点,而是独具匠心地将软件的工具知识和来自经验的所思所想创造性地结合,并用问题分析和层次思维一以贯之。
如今,数据分析师成为21世纪重要的职业之一,正因如此,越来越多的大学开设了数据相关专业,旨在为企业培养具有丰富的知识基础、创新性的分析能力的从业者。以Tableau为代表的数据可视化分析软件,是这个专业中非常重要的细分领域。不管是大学生,还是企业的从业者,都可以从本书中快速地了解数据可视化分析的思维和原理,以及Tableau的基础知识与应用。
本书中也包含了很多企业真实的分析场景和案例,故有助于读者提前了解企业的真正需求,更有针对性地进行学习,对于尚未进入职场的学生或者初入职场的新人而言非常重要。
期待每位读者都有所收获。
山东大学发明创造研究室主任 王思悦教授
2020年4月
自序
鸟会飞是因为有羽毛吗——Tableau与笔者的分析之旅
从2017年在婴贝儿偶遇Tableau至今整整三年时间,从昨日的爱好到今朝的工作,仿佛一瞬,又好似半生。如今,笔者完成了之前未曾想象的任务——把笔者的所思所想、所知所悟以出版的方式分享给更多人。
理想主义者总是习惯性地低估困难,写书这件事情尤其如此。累计638张精心制作的插图,有
评论
还没有评论。