描述
开 本: 32开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787302473770
产品特色
编辑推荐
本书由专业的数据分师根据新版Tbaleau 10精心编撰,全书以Tableau桌面软件Desktop为主线,详尽介绍了Tableau的基本概念、术语及数据分析与可视化的各种功能和知识。 介绍了连接多种数据源,包括Excel、文本文件、Access、JSON文件、统计文件及SQL Server、MySQL、Oracle等数据库,同时介绍了连接大数据平台Hadoop Hive以及大数据引擎的优化。 介绍了如何在Tableau中创建图表、使用函数、创建地图、创建故事表,并配合案例进行分析。 介绍了Tableau Online和Tableau Server的使用和操作技巧。 通过网上超市运营分析和网站流量统计分析两个商业案例深入介绍了Tableau的应用技巧,帮助读者尽快将Tableau的强大功能应用于工作实践。
内容简介
本书由专业的数据分析师基于Tableau 10.1精心编撰,详细介绍Tableau的数据连接、图形编辑与展示功能,包括软件的安装与激活、数据类型和运算符、连接数据源、基础操作、数据与图形的导出、连接大数据、基础图表、函数、高级数据操作、地图分析、故事、Tableau Online、Tableau Server等内容,并通过网上超市运营、网站流量统计等案例介绍Tableau在实际项目中的应用。
本书适合互联网、银行证券、咨询审计、快消品、能源等行业的数据分析师以及媒体、网站等数据可视化从业者使用,也可供高等院校相关专业的师生及从事数据分析的研究者参考,还可用作Tableau软件的培训教材。
本书适合互联网、银行证券、咨询审计、快消品、能源等行业的数据分析师以及媒体、网站等数据可视化从业者使用,也可供高等院校相关专业的师生及从事数据分析的研究者参考,还可用作Tableau软件的培训教材。
前 言
前 言
大数据时代正在变革我们的生活、工作和思维。如何让大数据更有意义,使之更贴近大多数人,重要的手段之一就是数据可视化。数据可视化是关于数据视觉表现形式的技术,这种数据的视觉表现形式被定义为一种以某种概要形式抽取出来的信息,包括相应信息单位的各种属性和变量。Tableau可以帮助人们将数据转化为可以付诸行动的见解,探索无所不能的可视化分析,只需点击几下即可构建仪表板,进行即兴分析,与任何人共享自己的工作成果。从全球性企业到早期初创企业和小企业,使用 Tableau 来查看和理解数据的人无处不在,其中既有像联合利华、德勤、UPS、耐克、杜邦、Verizon、T-mobile、BBC、探索频道、美国航空、Zynga、LinkedIn、Facebook、雅虎、苹果、可口可乐等欧美知名企业,也有美国联邦航空管理局、美国陆军等美国政府机构以及康奈尔、杜克、牛津等知名学府,Tableau在中国市场也有所开拓,中国东方航空是其重要客户。Tableau的应用已经遍及商务服务、能源、电信、金融服务、互联网、生命科学、医疗保健、制造业、媒体娱乐、公共部门、教育、零售等各个行业,因此掌握该软件的使用非常必要。本书的内容本书基于Tableau 10.1编写,详细介绍了Tableau的数据连接功能、图形编辑与展示功能。本书共分16章,各章内容说明如下:第1章介绍大数据时代的特征和挑战、数据可视化的新特性以及目前主要的数据可视化软件。此外,还简单介绍了Tableau软件,包括Tableau Desktop、Taleau Online、Tableau Server、Tableau Mobile、Tableau Public和Tableau Reader。第2章介绍Tableau Desktop的新增功能,以及软件的数据类型、运算符、开始页面、软件的安装与激活。第3章介绍Tableau Desktop可以连接的数据源,包括Excel文件、文本文件、Access、统计文件等,还将介绍如何连接各类数据库,如Tableau Server、SQL Server、MySQL、Oracle等。第4章首先介绍Tableau Desktop中维度和度量、连续和离散的概念和操作,然后介绍工作区和工作表,并结合具体的案例进行讲解。第5章介绍Tableau Desktop的数据导出,包括数据文件导出、图片文件导出、PDF文件导出。第6章和第7章介绍Tableau在大数据方面的应用,主要包括连接基本条件、主要步骤和注意事项等,还将介绍Tableau大数据引擎的优化方法,以及如何提升连接性能。第8章介绍如何使用Tableau 生成一些统计图形,如条形图、饼图、直方图、折线图、散点图、并排图、甘特图等。第9章介绍Tableau函数,包括数学函数、字符串函数、日期函数、类型函数、逻辑函数、聚合函数、直通函数、用户函数、表计算函数等,同时介绍每类函数的用法和例子。第10章介绍Tableau的一些高级操作,如表计算、创建字段、创建参数、聚合数据和缺失值处理,并结合具体实例进行讲解。第11章介绍如何使用Tableau创建地图,包括设置角色、比较地图、添加字段信息、设置地图选项、创建分布图和自定义地图等。第12章介绍Tableau故事的概念,包括如何创建故事、修改故事点、设置格式和演示故事等。第13章介绍Tableau Online,包括如何导入工作簿、导入数据源、搜索内容、创建用户站点角色、为站点添加用户、导入现有用户、添加和删除项目、为项目添加工作簿等。第14章介绍Tableau Server,包括安装的系统要求、安装步骤,以及如何配置服务器,包括常规配置、数据连接、通知和订阅、SMAL、OpenID等。第15章介绍网上超市运营分析案例,主要从客户分析、配送分析、销售分析、利润分析、退货分析和预测分析6个方面分析。第16章介绍网站流量分析案例,主要从页面指标分析、访问量分析、浏览量分析、退出量分析和下载量分析5个方面分析。本书的特色(1)内容全面,讲解详细本书详细介绍了Tableau大部分常用功能,对于初次学习Tableau软件的读者来说帮助较大。书中列出了创建可视化数据分析视图的每一步操作,便于读者的实践练习。(2)由浅入深、循序渐进本书从Tableau简介、连接数据源、基础操作、高级操作到Tableau Online和Tableau Server等,由浅入深,循序渐进,适合各个层次的读者阅读。(3)案例丰富,高效学习本书在介绍功能的同时基本都是结合案例进行操作。同时,为了使读者快速提高数据分析的整体能力,本书的后两章列举了网上超市运营案例分析和网站流量案例分析两个案例。本书的读者对象本书的内容和案例适用于互联网、银行证券、咨询审计、快消品、能源等行业数据分析用户及媒体、网站等数据可视化用户,可供高等院校相关专业学生及从事数据分析的研究者参考使用,也可作为Tableau软件培训和自学的教材。由于编者水平所限,书中难免存在错误和不妥之处,请广大读者批评指正。
编 者 2017年3月
编 者 2017年3月
媒体评论
评论
在线试读
第10章 Tableau的高级操作前面我们学习了Tableau视图生成的基本知识,包括连接各类数据源、工作表的基础操作、数据的导出、Tableau函数以及创建各类图形等。本章将介绍一些Tableau常用的高级操作,如表计算、创建字段、创建参数、聚合计算、缺失值处理等,使用的数据源是“2016年1-6月某超市销售数据”。10.1 表 计 算表计算应用于整个表中值的计算,通常依赖于表结构本身,这些计算的独特之处在于使用数据库中多行数据计算一个值。要创建表计算,需要定义计算目标值和计算对象值,可在“表计算”对话框中使用“计算类型”和“计算对象”下拉菜单定义这些值。例如,在销售环境中,可以使用表计算计算指定日期范围内的销售额汇总,或者计算一个季度中每种产品对销售总额的贡献。1. 打开“表计算”对话框右击视图中的某个度量,并选择“添加表计算”,如图10-1所示。 图10-1 添加表计算2. 选择计算类型在“表计算”对话框中选择要应用的计算类型,这里选择“总额百分比”,如图10-2所示。 图10-2 选择计算类型表计算的计算类型主要有以下8种。? 差异:显示变化。? 百分比差异:显示变化率。? 百分比:显示为其他指定值的百分比。? 总额百分比:以总额百分比的形式显示值。? 排序:以数字形式对值进行排名。? 百分位:计算百分位值。? 汇总:显示累积总额。? 移动计算:消除短期波动以确定长期趋势。3. 定义计算在“表计算”对话框的下半部分定义计算依据,这里选择“表(横穿)”,如图10-3所示。 图10-3 值汇总范围4. 查看表计算完成定义计算的操作后单击“确定”按钮。原始度量现在标记为表计算,如图10-4所示。还可以对其进行适当调整,修改为我们日常比较习惯的图形。 图10-4 查看表计算结果10.2 创建字段Tableau Desktop中的计算编辑器经过重新设计,可提供交互式编辑、智能公式完成,以及拖放支持。此外,在Tableau Server或Tableau Online中编辑视图时也可以使用编辑器。若要打开计算编辑器,则单击“数据”窗格“维度”右侧的下拉菜单,并选择“创建计算字段”,如图10-5所示。也可以选择“分析”→“创建计算字段”,或在“数据”窗格中右击并选择“创建计算字段”,如图10-6所示。 图10-5 “数据”窗格创建计算字段 图10-6 菜单栏创建计算字段维度和度量字段度都可以直接拖放到计算编辑器中。这里我们将“销售价”和“进货价”拖到编辑器中,命名为“每件商品利润”,右边是可以使用的函数列表,如图10-7所示。 图10-7 输入计算公式在计算编辑器中,如果单击“应用”按钮将保存新创建的字段,并将其添加到“数据”窗格中,但不关闭编辑器;如果单击“确定”按钮,那么会将保存新创建的字段并关闭编辑器,将返回字符串或日期的字段保存为维度,将返回数字的字段保存为度量,如图10-8所示。 图10-8 单击“确定”按钮关闭编辑器此外,在处理比较复杂的公式时,计算编辑器可能会显示“计算包含错误”。Tableau允许保存无效的新字段,不过在“数据”窗格中,该新字段的旁边会出现一个红色感叹号,在更正无效的计算字段之前,该新字段将无法拖放到视图中,如图10-9所示。 图10-9 计算包含错误时的显示10.3 创建参数在分析过程中,我们往往需要从“计算字段”对话框创建新参数,或者基于所选字段创建新参数,操作步骤如下: 使用维度右上角的箭头打开创建菜单,选择“创建参数”,如图10-10所示。 还可以在“数据”窗格中,右击要作为参数基础的字段(如商品类型代码),并选择“创建”→“参数”,如图10-11所示。 在“创建参数”对话框中,为新参数输入名称“商品类型”,如图10-12所示。 图10-10 通过“数据”窗格创建参数 图10-11 通过菜单栏创建参数 图10-12 命名新参数 还可以单击右上方的“注释”按钮,编写注释以描述新创建的参数,如图10-13所示。 图10-13 注释新参数 指定参数将接收的值的数据类型,如图10-14所示。 图10-14 参数的数据类型 指定参数当前的值,这是参数的默认值,如图10-15所示。 图10-15 指定参数当前的值 指定要在参数控件中使用的显示格式,如图10-16所示。 图10-16 指定参数的显示格式指定参数接收值的方式,有以下3种。? 全部:参数控件是字段中的简单类型。? 列表:参数控件提供可供选择的可能值的列表。? 范围:参数控件可用于选择指定范围中的值。这些选项的可用性由数据类型确定。例如,字符串参数只能接收所有值或列表,不支持范围。如果选择“列表”,就必须指定值列表。单击左列可键入值。每个值还可拥有显示别名。可通过单击“从剪贴板粘贴”复制和粘贴值列表,或者通过选择“从字段中添加”,以值列表的形式添加字段成员,如图10-17所示。 图10-17 列表类型的参数值如果选择“范围”,就必须指定小值、值和步长。例如,可以定义介于2016年1月1日和2016年12月31日之间的日期范围,并将步长设置为1个月,以创建可用来选择2016年每个月的参数控件,如图10-18所示。 图10-18 范围类型的参数值 完成后单击“确定”按钮。参数列在“数据”窗格底部的“参数”部分,如图10-19所示。在“筛选器”的“前”选项卡和“参考线”对话框中也会显示参数。参数在工作簿中为全局参数,可在任何工作表中使用。可以通过“数据”窗格或参数控件编辑参数,步骤如下: 在“数据”窗格中右击参数,并选择“编辑”,如图10-20所示。 图10-19 新参数的显示 图10-20 编辑新参数 在参数控件菜单中选择“编辑”,可以在“编辑参数”对话框中对参数进行必要的修改,如图10-21所示。 图10-21 “编辑参数”对话框 完成后单击“确定”按钮。参数会随使用它的计算一起更新。若要删除参数,则在“数据”窗格中右击该参数并选择“删除”。使用已删除参数的任何计算字段都会变为无效。参数控件是可用来修改参数值的工作表卡。参数控件与筛选器卡非常相似,两者都包含修改视图的控件。可以在工作表和仪表板上打开参数控件,在保存到Web或发布到Tableau Server时会涉及这些参数控件。若要打开参数控件,在“数据”窗格中右键单击参数并选择“显示参数控件”,如图10-22所示。像其他卡一样,参数控件有一个菜单,可以使用卡右上角的下拉箭头打开此菜单。使用此菜单可自定义控件的显示。例如,可以将值列表显示为单选按钮、精简列表、滑块或字段中的类型。此菜单中可用的选项取决于参数的数据类型以及该参数是接收所有值、值列表还是值范围,如图10-23所示。 图10-22 显示参数控件 图10-23 参数控件菜单10.4 聚合计算聚合函数允许对数据求和,Tableau提供了很多预定义聚合,如求和和方差。除了这些预定义聚合外,聚合计算还允许用户自定义聚合。假设需要分析数据源中2016年1月份每一种产品的利润率,步骤如下: 通过计算编辑器创建一个名为“利润率”的新计算字段。“利润率”等于利润除以销售额,公式为:利润率=SUM(利润)/SUM(销售额),如图10-24所示。 图10-24 输入变量计算公式 将此度量放在功能区中,使用预定义求和聚合。将“利润率”放在功能区时,它的名称自动更改为“聚合(利润率)”,表示聚合计算。将“日期”拖放到筛选器中,如图10-25所示。 图10-25 日期拖放到筛选器单击“下一步”按钮,会出现“筛选器”的具体选项,包括“常规”“条件”“顶部”。其中,“常规”包括“从列表中选择”“自定义值列表”“使用全部”,如图10-26所示。 图10-26 筛选器选项“店面名称”和“利润率”拖放到列功能区,将“商品名称”拖放到行功能区,如图10-27所示。 图10-27 将字段拖放到行和列功能区如果我们需要查看每个店面商品利润率的排名,如选择“定远路店”右边的降序按钮,将会按照商品的利润率对华联定远路店销售的商品进行降序排列,如图10-28所示。 图10-28 按利润率降序排列10.5 缺失值处理Tableau中有些数据需要特殊处理,具体包括null空值、无法识别或不明确的地理位置、使用对数标度时的负值或零值以及使用树图时的负值或零值。数据中包含这些特殊值时,Tableau无法在视图中绘制它们,而是在视图的右下角显示一个指示器。单击该指示器可查看有关处理这些值的更多选项,如图10-29所示。 图10-29 缺失值指示器如果字段中包含null值或对数轴上包含零值或负值,Tableau就无法绘制这些值,而是在视图右下角使用一个指示器显示这些值。单击该指示器并从以下两个选项进行选择。? 筛选数据:使用筛选器从视图中排除null值。筛选数据时,也会从视图中使用的所有计算中排除这些null值。? 在默认位置显示数据:在轴上的默认位置显示数据,null值仍将包含在计算中,默认位置取决于数据类型。表10-1定义了默认设置。表10-1 缺失值默认设置数据类型 默认位置数字 0日期 1899/12/31对数轴上的负值 1未知地理位置 (0,0)如果不知道如何处理这些值,就可以选择保留特殊值指示器。通常应该继续显示指示器,提示存在视图中未显示的数据。若要根据需要隐藏指示器,则右击它并选择“隐藏指示器”,如图10-30所示。 图10-30 隐藏缺失值指示器10.6 案例:超市利润额变化使用此计算类型可沿着特定维度计算表中两个指定数值之间的差异。例如,为2016年某超市细分计算1月份至6月份利润之间的差异。要定义差异计算,需要指定作为计算范围的维度或表结构、在计算中使用的维度级别以及要与当前值比较的值。下面是“差异”计算的一个例子。图10-31显示2016年诚信超市1月份至6月份的销售额。 图10-31 1月份至6月份销售额将度量下的“利润”拖放到标记下的“文本”框中,下方会出现“总计(利润)”,右击“总计(利润)”,选择“添加表计算”,如图10-32所示。 图10-32 添加表计算计算2016年诚信超市1月份至6月份利润之间的差异,可以使用“表计算”对话框中的值,如图10-33所示。 图10-33 设置表计算我们要对2016年诚信超市1月份至6月份的利润进行比较,沿着“日期”维度在月度级别计算差异。注意,没有1月份的值,原因是没有2016年1月份以前的数据可用于比较差异,可以隐藏该列,不影响计算,如图10-34所示。 图10-34 表计算结果显示这里我们仅展示了差异计算的具体步骤,百分比、百分比差异、总额百分比、排名、百分位、汇总和移动计算的步骤基本类似,这里不再一一举例。
书摘插画
评论
还没有评论。