描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787302486589丛书名: 大众创业系列丛书
以“明确数据分析目的→获取数据→处理数据→分析数据→呈现数据→撰写报告”为线索,严格按照商业数据分析的流程安排本书内容,帮助读者理清数据分析正确的学习思路。
5大数据分析方法论:4P营销理论、用户使用行为理论、PEST分析法、逻辑树分析法、5W2H分析法,营销与管理数据分析模型快速建立。
7种经典数据分析法:对比分析法、分组分析法、交叉分析法、综合评价分析法等,用对数据分析方法才能正确分析数据。
写作手法上,以解决具体的问题为目的,引出要讲解的内容,让实际应用与知识点紧密结合,学得更快。
《新手学数据分析(入门篇)》共分为10章,内容涉及数据分析工作的各个方面,循序渐进地讲解了数据分析工作的开展流程、技术以及各种注意事项,其主要内容有:认识数据分析、了解数据分析方法论和数据分析方法,数据源的获取、加工、处理、分析、呈现以及*终的报告撰写等。
《新手学数据分析(入门篇)》内容详细全面,且注重实践操作,尤其对于想要从事数据分析工作的读者,借助《新手学数据分析(入门篇)》可实现快速入门,此外《新手学数据分析(入门篇)》也非常适合从事数据分析相关工作不久的新人巩固知识和提升相关技能。
第1章 全面了解数据分析行业 001
1.1 数据分析概述 002
1.1.1 认识数据分析及其分类 002
1.1.2 数据分析的重要性 003
1.2 初步了解数据分析行业 004
1.2.1 数据分析行业的发展历程 004
1.2.2 充分认识大数据时代 006
1.2.3 我国大数据产业存在挑战 011
1.3 数据分析人才的培养 012
1.3.1 大数据时代需要的人才 012
1.3.2 数据分析人才需要具备的能力 013
1.3.3 成为数据分析人才的素质 015
1.4 认识数据分析职位 016
1.4.1 数据分析的职位体系 016
1.4.2 数据分析师的工作内容 017
1.4.3 常见数据分析职位的技能要求 018
第2章 深入认识数据分析 019
2.1 充分理解数据 020
2.1.1 了解数据形成过程与数据处理 020
2.1.2 理解字段、记录和数据表 021
2.1.3 认识Excel处理的数据类型 022
2.2 掌握数据分析的流程 024
2.2.1 步:明确数据分析的目的和思路 024
2.2.2 第二步:获取需要分析的数据 025
2.2.3 第三步:对收集的数据进行处理 029
2.2.4 第四步:分析数据以获得有用信息 030
2.2.5 第五步:选择合适的数据呈现方式 031
2.2.6 第六步:撰写数据分析结果报告 033
2.3 认识数据分析的误区 033
2.4 了解基本的数据分析指标 035
2.4.1 平均数指标 036
2.4.2 频数与频率指标 036
2.4.3 数与相对数指标 037
2.4.4 其他常见数据分析指标 039
第3章 数据分析方法论和数据分析方法 041
3.1 数据分析方法论和数据分析方法概述 042
3.1.1 了解数据分析方法论 042
3.1.2 了解数据分析方法 043
3.2 经典数据分析方法论详解 044
3.2.1 4P营销理论:分析公司整体营运情况 044
3.2.2 用户使用行为理论:分析用户行为 047
3.2.3 PEST分析法:分析宏观环境 048
3.2.4 逻辑树分析法:分析专项业务问题 050
3.2.5 5W2H分析法:分析任何问题 051
3.3 常见的数据分析法模型 054
3.3.1 对比分析法 054
3.3.2 分组分析法 055
3.3.3 交叉分析法 057
3.3.4 综合评价分析法 058
第4章 准备数据是数据分析的步 069
4.1 直接获取外部数据源 070
4.1.1 导入文本文件数据 070
4.1.2 导入Access数据 072
4.1.3 导入网站数据 073
4.1.4 导入SQL Server数据 075
4.1.5 导入XML数据 076
4.2 手工录入数据的方法 077
4.2.1 快速录入表格数据的技巧 077
4.2.2 特殊数据的
输入方法 081
4.3 问卷调查数据的录入要求 085
4.4 手动整理数据要快而准 091
4.4.1 数据来源的有效性设置 091
4.4.2 数据的编辑与修改 096
4.4.3 数据的批量修改 098
4.5 优化待分析的数据显示效果 100
4.5.1 利用字体格式提升专业性 100
4.5.2 表格效果的优化操作 102
4.5.3 格式化设置中的颜色使用原则 107
第5章
加工处理数据源是数据分析的关键 109
5.1 正确理解数据的加工处理 110
5.1.1 数据处理的要求 110
5.1.2 数据处理的步骤 112
5.2 数据处理的基础知识 114
5.2.1 公式和函数基础 114
5.2.2 使用公式与函数的方法 116
5.3 对数据进行清理与检查 121
5.3.1 处理数据源中的重复数据 121
5.3.2 检查数据的完整性 125
5.4 对数据源进行二次加工 127
5.4.1 在数据源中抽取数据 127
5.4.2 计算需要的数据结果 132
第6章 利用工具快速分析数据 135
6.1 利用透视功能分析数据 136
6.1.1 创建数据透视表的方法 136
6.1.2 合理地设计透视表的布局和格式 139
6.1.3 更改数据透视的汇总方式 143
6.1.4 刷新数据透视表中的数据 145
6.1.5 在数据透视表中使用计算字段 146
6.1.6 使用切片器分析数据 147
6.2 Excel数据分析工具库的应用 150
6.2.1 加载Excel分析工具库 150
6.2.2 数据的描述性统计分析 152
6.2.3 数据的抽样分析 154
6.2.4 数据的回归分析 156
6.2.5 数据的相关性分析 160
6.2.6 数据的假设检验分析 162
6.2.7 数据的预测分析 165
第7章 数据结果的简单呈现方式 169
7.1 使用条件格式展示分析结果 170
7.1.1 条件格式在数据分析情况下使用的场合 170
7.1.2 用填充色突出显示某个范围的数据 172
7.1.3 将前X%的数据显示出来 174
7.1.4 用图形比较数据大小 175
7.1.5 根据关键字将对应的记录突出显示 177
7.2 使用迷你图在单元格中分析数据 179
7.2.1 创建迷你图的方法 179
7.2.2 更改迷你图的类型 180
7.2.3 设置迷你图的外观效果 181
第8章 透过图表直观查看数据分析结果 183
8.1 揭开图表的神秘面纱 184
8.1.1 用图表展示数据的意义 184
8.1.2 掌握图表与数据之间存在的关系 186
8.1.3 数据演变成图表的5个阶段 188
8.1.4 了解图表的基本组成部分 189
8.2 利用图表展现数据的必会操作 191
8.2.1 创建一个完整图表的步骤 191
8.2.2 图表数据的编辑 197
8.2.3 图表元素的设置 203
8.3 优化图表的技巧 209
8.3.1 用图片让数据分析呈现更形象 210
8.3.2 直观区分图表中的正负数 212
8.3.3 断裂折线图的处理方法 215
8.3.4 自动显示图表中的值数据 217
8.4 数据分析中的特殊图表制作 220
8.4.1 制作甘特图 220
8.4.2 制作对称条形图 226
第9章 更专业地用图表展示数据 231
9.1 根据需要处理细节数据 232
9.1.1 在图表下方添加数据来源 232
9.1.2 处理图表中的冗余数据 235
9.1.3 使用脚注添加说明 237
9.1.4 将数据大的图形截断展示 238
9.1.5 处理数值坐标轴中的符号 240
9.2 图表的美化原则 242
9.2.1 图表各组成部分的文字使用要协调 242
9.2.2 不要为了好看而让图表变得花哨 245
9.2.3 关键数据要突出显示出来 248
9.2.4 慎用三维立体效果 253
9.3 常见图表类型的规范制作要求 255
9.3.1 柱形图的分类和数据系列不要太多 255
9.3.2 分类标签多而长条形图 257
9.3.3 排序数据源使条形图数据展示更直观 258
9.3.4 多折线的情况下分开做多个图表 259
9.3.5 巧妙处理饼图中的较小扇区 260
第10章 后一步:撰写数据分析报告 263
10.1 数据分析报告概述 264
10.1.1 数据分析报告快速入门 264
10.1.2 了解数据分析报告的种类 266
10.1.3 制作数据分析报告的工具 269
10.1.4 数据分析报告的生成 271
10.2 数据分析报告的组成 273
10.2.1 数据分析报告的开篇 274
10.2.2 数据分析报告的正文 278
10.2.3 数据分析报告的结尾 281
前言
关于本书
在这个信息爆炸的时代,我们每天都在与数据打交道,而且这些数据都在直接或者间接地影响着我们的生活和工作,特别是在市场现状的调查、行业发展趋势的预测、公司运营决策的制定、生产数据的预测、新产品的研发等领域,更加需要基于科学、严谨的数据分析得到的数据结果,来为决策者制定决策提供可靠的数据来源。
随着大数据时代的到来和发展,数据分析从业人员的需求量也在不断增大,虽然许多人想要从事数据分析工作,但是碍于数据分析技术的繁多与学习难度,终都止步于这个大门外。有一部分人即使已经涉足或者从事了数据分析工作,但是对于整个数据分析的过程或许还存在迷惑的地方。
其实数据分析并没有那么难,只要依照初的数据分析目的,运用正确的数据分析方法论和数据分析方法,逐步进行就可以完成数据分析工作。虽然数据分析的方法和技术很多,但是Excel作为强大的数据分析工具,几乎可以完成大部分的数据分析任务。对于初、中级的数据分析师而言,已经足够。
为了让更多的人了解什么是数据分析,并且快速入门,我们依照数据分析的整个过程和思路,精心编写了本书。
特点 说明
典型案例 本书在创作过程中侧重于实践方面的讲述,摒弃“假、大、空”的套话,
快速精通 并提供了许多典型案例和实操内容,通过案例分析和讲解辅助读者了解
数据分析技术的应用,让读者快速精通数据分析工作各个环节的重点和必会知识
全程图解 本书包含大量的图片、表格和图示,步步详解各种数据分析方法和数据分析技术的
步步详解 实战应用,以帮助读者更快且更熟练地掌握数据分析技术
本书结构
本书作为一本数据分析入门的实用工具书,按照数据获取→数据处理→数据分析→数据呈现→数据报告的线索,为读者详细描绘了数据分析的完整流程以及整个数据分析工作中涉及的各种方法、方法论以及Excel技术和注意事项。全书共分为10章,主要内容可分为以下3个部分。
章节安排 主要内容 作用
第1~3章 本部分讲解数据分析概述、数据分析行业发展、 这部分作为本书的开篇内容,为读者详细介绍了
数据分析人才的培养、认识商业数据分析师、 有关数据分析的基础知识,让读者对数据分析快速入门
了解数据分析的流程以及了解数据分析方法论和
数据分析方法
第4~7章 本部分介绍数据分析过程中数据源的准备、加工处理、 这部分内容全面介绍了整个数据分析工作中的实战操作,
各种数据分析技术以及数据结果简单的呈现方式 掌握这些内容可以完成基本的数据分析核心过程
第8~10章 本部分介绍如何用透视功能查看数据分析结果、 这部分内容为本书的提升内容,通过对这部分内容的学习,
用更专业的图表展示数据以及数据分析报告的 可以让读者掌握数据分析结果的展示技巧以及数据分析报告的
撰写技巧和注意事项 撰写技巧,从而更好、更完整地完成数据分析工作
本书读者
本书作为数据分析入门的实用书籍,能帮助想要涉足数据分析行业的读者快速入门,也可以帮助初涉数据分析工作的工作人员更专业地完成工作。此外,对于有过数据分析工作经验的初、中级数据分析师巩固和提升数据分析技术也有一定的指导作用。由于编者经验有限,书中难免会有疏漏和不足之处,恳请专家和读者不吝赐教。
本书作者
本书由杨群编著,参与本书编写的人员有邱超群、罗浩、林菊芳、马英、邱银春、罗丹丹、刘畅、林晓军、周磊、蒋明熙、甘林圣、丁颖、蒋杰、何超等,在此对大家的辛勤工作表示衷心的感谢!由于编者经验有限,书中难免会有疏漏和不足之处,恳请专家和读者不吝赐教。
第2章 深入认识数据分析
本章要点
◆
了解数据形成过程与数据处理
◆
理解字段、记录和数据表
◆
认识Excel处理的数据类型
◆
步:明确数据分析的目的和思路
◆
第二步:获取需要分析的数据
◆
第三步:对收集的数据进行处理
◆
第四步:分析数据,获得有用信息
◆
第五步:选择合适的数据呈现方式
◆
第六步:撰写数据分析结果报告
◆
平均数指标
◆
频数与频率指标
学习目标
通过对第1章的学习,清楚了数据分析这个行业及其相应的职位,那么到底数据分析师如何来分析数据?作为零基础的新手而言,应该从哪里开始入门?在这章及本书的后面章节,都将围绕整个数据分析流程以及初级的数据分析方法来带领大家快速上手。
知识要点 学习时间 学习难度
充分理解数据 30分钟 ★★★
掌握数据分析的流程 50分钟 ★★★★★
认识数据分析的误区 20分钟 ★★
了解基本的数据分析指标 30分钟 ★★★★
2.1 充分理解数据
数据是数据分析工作主要操作的元素,因此,有必要对数据进行一个全面的认识,这样才能从各种繁杂的信息中快速提炼出有用的数据。
2.1.1 了解数据形成过程与数据处理
从狭义上来说,数据就是数字,但是从广义上来说,数据是具有一定意义的文字、字母、数字符号的组合、图形、图像、视频及音频等,也是客观事物的属性、数量、位置及其相互关系的抽象表示。那么数据是怎么形成的呢?通常,人们把客观存在的事物以数据的形式保存到计算机中,需要经历从现实世界→信息世界→数据世界这3个过程。
(1) 现实世界。现实世界是客观的、人们头脑之外的世界。它由事物和事物之间的联系组成。将现实世界信息化,就可以进入信息世界。
(2) 信息世界。信息世界是现实世界在人们头脑中的反映,人们把它用文字或符号记载下来。在信息世界中,与数据库技术相关的术语有实体、属性、码、域、实体型、实体集和联系等。信息世界数据化之后,就可以进入数据世界。
(3) 数据世界。数据世界又称为机器世界。信息世界的信息在机器世界中以数据形式存储,在这里,每一个实体用记录表示,相应于实体的属性用数据项(又称字段)来表示,现实世界中的事物及其联系用数据模型来表示。
从3个过程中可以看到,信息是客观事物转变为数据的重要过程,二者之间也是不可分离的:信息依赖数据来表达,数据则生动具体地表达出信息。
对从信息中提取出来的数据进行处理,实际就是对数据进行管理,即对数据进行分类、组织、编码、存储、检索和维护。在计算机系统中,数据管理通常使用数据库管理系统完成,而在信息化的当今社会,数据管理主要是通过数据库技术来完成的。
数据库技术是信息系统的一个核心技术,它是一门综合学科,涉及操作系统、数据结构、算法设计、程序设计和数据管理等多方面知识,它的不断发展使得人们可以科学地组织存储数据、高效地获取和处理数据。
从第1章也可以了解到,作为一个合格的数据分析师,需要掌握的数据处理软件技能有很多,其实大多数数据分析利用Excel进行已经绰绰有余了,因此在本书中主要研究利用Excel功能来完成数据处理需要掌握的各种技术。当然,如果你要在数据分析师的道路上越走越远,你所掌握的就应越多,如你懂Hadoop,那么就可能离大数据更近一点。
2.1.2 理解字段、记录和数据表
信息以数据的形式终得以保存下来,其中离不开字段、记录和数据表这3个组成部分,下面从数据分析的角度来理解这3个概念。
字段。字段是事物或现象的某种特征,如“姓名”“性别”“籍贯”和“居住地址”等都是字段。
记录。记录是事物或现象某种特征的具体表现,如姓名可以是张三、李四和王五,性别可以是男性或者女性。
数据表。将字段和记录组织在一起形成的关系结构就是数据表。
从概念中可以看到,记录、字段和数据表是一个有机的整体,三者之间相互依赖才得以存在。
在Excel表格中,表的每一列称为一个字段,一个记录可以包含若干个互不相同的字段,字段在记录中的先后顺序不影响数据的实际意义。表的每一行数据称为一个记录,一个表可以包含多条互不相同的记录,记录在表中的先后顺序不影响数据的实际意义,如图2-1所示。
图2-1
表格是我们经常看到的,但是从数据分析的角度出发,为了方便后期的数据分析操作,在设计数据表时,还需要注意以下几点。
(1) 在Excel中的行必须是标题,即全部是字段名称,且不能存在重复字段。
(2) 从第二行开始,都是记录行。
(3) 无论是标题行还是记录行,都不能存在合并单元格的情况。
(4) 数据表的结构要以一维结构存在,不能设置为二维结构。
其实一维表和二维表在表格的外观结构上来看没有什么区别,都是行为标题行,第二行还是为记录行,的区别是表格的每一列的字段是否是一个独立的参数。如果每一列都是独立的参数那就是一维表,如果某些列中每一列都是同类参数那就是二维表。下面来看图2-2所示表格。
图2-2
在图2-2中,左表就是一个典型的二维表,右表是标准的一维表,因为左侧表格中,1月、2月和3月都是属于针对月份来进行描述的,因此属于同种参数。一般情况下,通常制作的表格都是按照二维结构来进行存储的,主要是因为这种结构简单清晰,便于查看,但是不利于数据分析,此时就需要将二维结构的表格转化为一维表格,要达到这一目的,在Excel中可以利用数据透视表功能来实现,有关数据透视表的具体使用方法将在本书的第6章进行详细介绍。
2.1.3 认识Excel处理的数据类型
Excel可处理的数据类型有多种,如文本、数值、日期和时间及货币数据等,要想看到Excel可以处理哪些类型的数据,直接选择任意一个单元格,单击鼠标右键,在弹出的快捷菜单中选择“设置单元格格式”命令,在打开的“设置单元格格式”对话框的“数字”选项卡的“分类”列表框中即可查看到,如图2-3所示。
图2-3
从图2-3中可以看到Excel能够处理的数据类型有很多,但是终都可归结为如
图2-4所示的几种类型,而且在这几种类型中,部分数据之间还存在相互的转化关系,如将数值数据添加上货币符号就转化为货币数据等。
图2-4
评论
还没有评论。