描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787302646259
适合新手快速上手:本书首先从认识一个Python程序开始,介绍 Python程序的构成、编程环境搭建与程序编写规范,以及Python 的数据类型、运算符、程序结构与数据结构,然后介绍了数据可 视化的热门工具Matplotlib与Pyecharts,并给出超过30余种常用 见图形的绘制技巧,很适合从未接触过Python编程的读者快速上 手。
可视化流程全解析:本书从数据准备到数据清洗、整理,再到数 据呈现和展示,各部分分别介绍相关概念和工具的使用技巧,并 结合丰富案例进行步骤阐述,可以帮助建立数据可视化整体思路 ,也能够尽快提升基本的实操技能。
工具与项目相结合:书中既介绍了数据可视化常用工具,包括 Pandas、Matplotlib与Pyecharts,又给出了项目案例,可以帮助 读者解决实际工作中遇到的数据可视化问题,提升职场竞争力。
配套资源丰富:本书还提供了源代码、PPT和教学视频和练习题, 方便读者上机演练和随时随时观看学习,从而大幅提升学习效率 。
第 1 篇 Python数据可视化基础
第 1 章 搭建Python开发环境 3
1.1 集成开发工具Anaconda 3
1.1.1 什么是Anaconda 3
1.1.2 安装Anaconda 4
1.2 常用代码开发工具 6
1.2.1 简单易用的Spyder 7
1.2.2 功能强大的JupyterLab 9
1.2.3 高效流行的PyCharm 10
1.3 认识Python程序 13
1.3.1 一个简单的Python程序 14
1.3.2 Python的常量和变量 15
1.3.3 编写Python程序的注意事项 15
1.4 包管理工具pip 16
1.5 本章小结 18
第 2 章 Python编程基础 19
2.1 Python数据类型 19
2.1.1 数字 19
2.1.2 字符串 20
2.1.3 列表 21
2.1.4 元组 23
2.1.5 集合 24
2.1.6 字典 26
2.2 Python运算符和优先级 28
2.2.1 Python运算符 28
2.2.2 运算符的优先级 33
2.3 Python语法基础 35
2.3.1 条件语句:if及if嵌套 35
2.3.2 循环语句:while与for 36
2.3.3 格式化:format与% 38
2.4 Python的函数 39
2.4.1 函数的概念及使用 40
2.4.2 数据分析中的常用函数 41
2.5 本章小结 44
第 3 章 Pandas数据整理与清洗 45
3.1 Pandas的概念与数据结构 45
3.1.1 初识Pandas 45
3.1.2 Pandas的数据结构 46
3.2 数据的读取 48
3.2.1 读取本地离线数据 49
3.2.2 读取Web在线数据 50
3.2.3 读取常用数据库的数据 51
3.2.4 读取Hadoop集群数据 53
3.3 数据的索引 54
3.3.1 set_index()函数:创建索引 54
3.3.2 unstack()函数:层次化索引 56
3.3.3 swaplevel()函数:调整索引 57
3.4 数据的切片 57
3.4.1 提取一列或多列数据 57
3.4.2 提取一行或多行数据 58
3.4.3 提取指定区域的数据 59
3.5 数据的删除 60
3.5.1 删除一行或多行数据 60
3.5.2 删除一列或多列数据 61
3.5.3 删除指定的列表对象 62
3.6 数据的排序 62
3.6.1 按行索引排序数据 62
3.6.2 按列索引排序数据 63
3.6.3 按一列或多列排序数据 64
3.6.4 按一行或多行排序数据 65
3.7 数据的聚合 65
3.7.1 level参数:指定列聚合数据 65
3.7.2 groupby()函数:分组聚合 66
3.7.3 agg()函数:更多聚合指标 67
3.8 数据透视 68
3.8.1 pivot_table()函数:数据透视 68
3.8.2 crosstab()函数:数据交叉 71
3.9 数据合并 71
3.9.1 merge()函数:横向合并 72
3.9.2 concat()函数:纵向合并 74
3.10 本章小结 75
第 4 章 Python数据可视化库 76
4.1 Matplotlib 76
4.1.1 Matplotlib库简介 76
4.1.2 Matplotlib可视化案例 76
4.2 Pyecharts 78
4.2.1 Pyecharts库简介 78
4.2.2 Pyecharts可视化案例 78
4.3 Seaborn 79
4.3.1 Seaborn库简介 79
4.3.2 Seaborn可视化案例 79
4.4 Bokeh 81
4.4.1 Bokeh库简介 81
4.4.2 Bokeh可视化案例 81
4.5 HoloViews 83
4.5.1 HoloViews简介 83
4.5.2 HoloViews可视化案例 83
4.6 Plotly 84
4.6.1 Plotly库简介 84
4.6.2 Plotly可视化案例 85
4.7 NetworkX 86
4.7.1 NetworkX简介 86
4.7.2 NetworkX可视化案例 87
4.8 其他可视化库 88
4.8.1 Altair 88
4.8.2 Pygal 89
4.9 动手练习 90
第 2 篇 Matplotlib数据可视化
第 5 章 Matplotlib图形参数设置 95
5.1 Matplotlib主要参数配置 95
5.1.1 线条设置 95
5.1.2 坐标轴设置 98
5.1.3 图例的设置 99
5.2 绘图参数文件及主要函数 101
5.2.1 修改绘图参数文件 101
5.2.2 绘图主要函数简介 103
5.3 Matplotlib参数配置案例 104
5.4 动手练习 105
第 6 章 Matplotlib基础绘图 106
6.1 绘制直方图 106
6.1.1 直方图的参数 106
6.1.2 案例:每日利润额的数值分布 107
6.2 绘制折线图 109
6.2.1 折线图的参数 109
6.2.2 案例:每周商品销售业绩分析 109
6.3 绘制条形图 111
6.3.1 条形图的参数 111
6.3.2 案例:不同省份利润额的比较 112
6.4 绘制饼图 113
6.4.1 饼图的参数 114
6.4.2 案例:不同类型商品销售额比较 115
6.5 绘制散点图 116
6.5.1 散点图的参数 116
6.5.2 案例:销售额与利润额的关系 117
6.6 绘制箱形图 118
6.6.1 箱形图的参数 118
6.6.2 案例:区域销售业绩比较分析 120
6.7 动手练习 122
第 7 章 Matplotlib高级绘图 123
7.1 树形图及应用案例 123
7.1.1 树形图的适用场景 123
7.1.2 案例:不同省份销售额的比较分析 124
7.2 误差条形图及应用案例 125
7.2.1 误差条形图的适用场景 125
7.2.2 案例:门店业绩考核达标情况分析 125
7.3 火柴杆图及应用案例 127
7.3.1 火柴杆图的函数及其应用场景 127
7.3.2 案例:不同省份送货准时性分析 127
7.4 甘特图及应用案例 128
7.4.1 甘特图及其应用场景 129
7.4.2 案例:企业信息化项目进度管理 129
7.5 自相关图及应用案例 132
7.5.1 自相关图及其应用场景 132
7.5.2 案例:股票价格的自相关分析 133
7.6 图形整合及应用案例 135
7.6.1 图形整合函数 135
7.6.2 案例:区域销售额与利润额分析 137
7.7 动手练习 139
第 3 篇 Pyecharts数据可视化
第 8 章 Pyecharts图形参数配置 143
8.1 全局配置项 143
8.1.1 基本元素配置项 143
8.1.2 坐标轴配置项 151
8.1.3 原生图形配置项 154
8.2 系列配置项 159
8.2.1 样式类配置项 159
8.2.2 标记类配置项 161
8.2.3 其他类配置项 165
8.3 多样化的视图呈现 166
8.3.1 生成HTML文件 166
8.3.2 生成图片 167
8.3.3 在Jupyter Notebook环境下运行 168
8.3.4 在JupyterLab环境中运行 168
8.4 动手练习 169
第 9 章 Pyecharts基础绘图 170
9.1 绘制折线图 170
9.1.1 折线图及其参数配置 170
9.1.2 案例:各门店销售业绩比较分析 171
9.2 绘制条形图 173
9.2.1 条形图及其参数配置 173
9.2.2 案例:各省市商品订单数量分析 175
9.3 绘制箱形图 177
9.3.1 箱形图及其参数配置 177
9.3.2 案例:不同类型商品的收益分析 178
9.4 涟漪散点图 179
9.4.1 涟漪散点图的参数配置 179
9.4.2 案例:不同收入等级客户价值分析 180
9.5 K线图 182
9.5.1 K线图的参数配置 182
9.5.2 案例:企业股票价格趋势分析 183
9.6 双坐标轴图 185
9.6.1 双坐标轴图的介绍 185
9.6.2 案例:区域销售业绩及数量分析 185
9.7 动手练习 187
第 10 章 Pyecharts高级绘图 189
10.1 日历图 189
10.1.1 日历图的参数 189
10.1.2 案例:企业股票每日交易量分析 190
10.2 漏斗图 192
10.2.1 漏斗图的参数 192
10.2.2 案例:华东地区各省市利润额分析 192
10.3 仪表盘 194
10.3.1 仪表盘的参数 194
10.3.2 案例:企业2022年销售业绩完成率 195
10.4 环形图 196
10.4.1 环形图的参数 196
10.4.2 案例:不同教育群体的购买力分析 197
10.5 雷达图 198
10.5.1 雷达图的参数 198
10.5.2 案例:不同区域销售业绩的比较 199
10.6 旭日图 202
10.6.1 旭日图的属性 202
10.6.2 案例:绘制我的家庭树旭日图 203
10.7 主题河流图 205
10.7.1 主题河流图的属性 205
10.7.2 案例:不同类型商品销售情况分析 205
10.8 词云 207
10.8.1 词云的属性 207
10.8.2 案例:商品类型关键词词云 207
10.9 玫瑰图 209
10.9.1 玫瑰图的属性设置 209
10.9.2 案例:不同职业群体的购买力分析 209
10.10 平行坐标系 211
10.10.1 平行坐标系的属性设置 211
10.10.2 案例:地区利润增长率比较分析 211
10.11 动手练习 213
第 4 篇 数据可视化案例
第 11 章 案例1:空气质量状况分析 217
11.1 案例背景及数据爬取 217
11.1.1 案例背景介绍 217
11.1.2 案例数据爬取 218
11.2 历年数据总体分析 220
11.2.1 历年AQI总体比较分析 220
11.2.2 历年季度AQI趋势分析 223
11.2.3 历年空气污染物分析 224
11.3 2022年空气质量分析 226
11.3.1 空气质量等级分析 226
11.3.2 每月AQI数据分析 228
11.3.3 每周AQI数据分析 230
11.3.4 每日AQI数据分析 231
11.4 污染物数据高级分析 233
11.4.1 6种污染物相关分析 233
11.4.2 PM2.5与PM10回归分析 234
11.4.3 PM2.5与PM10残差分析 235
11.5 案例小结 236
第 12 章 案例2:人口现状及趋势分析 237
12.1 人口总数及结构分析 237
12.1.1 人口总数趋势分析 237
12.1.2 人口男女性别分析 239
12.1.3 人口年龄结构分析 241
12.2 人口增长率数据分析 244
12.2.1 人口增长率趋势分析 244
12.2.2 人口增长率相关分析 246
12.2.3 人口增长率回归分析 247
12.3 人口抚养比数据分析 249
12.3.1 人口抚养比趋势分析 249
12.3.2 人口抚养比相关分析 252
12.3.3 人口抚养比回归分析 253
12.4 案例小结 255
第 13 章 案例3:网络平台商品评论可视化分析 256
13.1 项目案例背景 256
13.2 商品评论总体分析 257
13.2.1 月度商品评论数及得分分析 257
13.2.2 不同尺寸的商品评论数及得分分析 259
13.2.3 不同颜色的商品评论数及得分分析 261
13.3 商品评论文本分析 263
13.3.1 中文Jieba分词概述 263
13.3.2 商品评论关键词分析 263
13.3.3 商品评论关键词词云 266
13.4 案例小结 268
附录A 搭建大数据开发环境 269
A.1 集群的安装及网络配置 269
A.1.1 集群软件及其版本 269
A.1.2 集群网络环境配置 271
A.2 集群案例数据集简介 273
A.2.1 数据字段说明 273
A.2.2 数据导入说明 274
A.2.3 运行环境说明 275
A.3 集群节点参数配置 276
A.3.1 Hadoop的参数配置 276
A.3.2 Hive的参数配置 278
A.3.3 Spark的参数配置 280
A.3.4 集群的启动与关闭 281
研究表明,人类大脑处理图形的速度要比文字快几万倍,如何将海量的数据转换成可视化的图形是数据分析的必修课。Matplotlib和Pyecharts是Python中常用的两个可视化库,其功能强大,可以方便地绘制折线图、条形图、柱形图、散点图等基础图形,还可以绘制复杂的图形,如日历图、树形图、聚类图等。
Matplotlib是Python数据可视化库的泰斗,尽管已有十多年的历史,但仍然是Python社区中使用广泛的绘图库,它的设计与MATLAB非常相似,提供了一整套和MATLAB相似的命令API,适合交互式制图,还可以将它作为绘图控件,嵌入其他应用程序中。
Pyecharts是一款将Python与Echarts相结合的数据可视化工具,可以高度灵活地配置,轻松搭配出精美的视图。其中Echarts是百度开源的一个数据可视化库,而Pyecharts将Echarts与Python进行有机对接,方便在Python中直接生成各种美观的图形。
本书首先介绍大数据可视化分析的一些基础知识和主要技术,然后通过实际案例重点讲解Matplotlib和Pyecharts在数据可视化分析过程中的使用方法及技巧,还提供了大量实际项目案例,希望能够帮助读者掌握大数据可视化技术,提升职场竞争力。
本书内容
本书分4篇,共13章,各章内容概述如下:
第1篇(第1~4章)介绍Python数据可视化基础。
第1章介绍Python环境的安装,包括如何搭建代码开发环境,以及pip包管理工具。
第2章介绍Python编程基础知识,包括数据类型、基础语法、常用高阶函数等。
第3章介绍Pandas数据处理,包括数据读取、索引、切片、聚合、透视、合并等。
第4章介绍Python主要的数据可视化库,如Matplotlib、Pyecharts、Seaborn、Bokeh等。
第2篇(第5~7章)介绍Matplotlib数据可视化。
第5章介绍Matplotlib的图形参数设置,如线条、坐标轴、图例及其参数配置等。
第6章介绍使用Matplotlib绘制一些基础图形,如直方图、折线图、饼图、散点图等。
第7章介绍使用Matplotlib绘制一些高级图形,如树形图、误差条形图,以及图形整合等。
第3篇(第8~10章)介绍Pyecharts数据可视化。
第8章介绍Pyecharts的图形参数配置,如全局配置项、系列配置项和运行环境。
第9章介绍使用Pyecharts绘制一些常用图形,如折线图、条形图、箱形图、K线图等。
第10章介绍使用Pyecharts绘制一些高级图形,如日历图、仪表盘、环形图、词云等。
第4篇(第11~13章)介绍数据可视化案例。
第11章利用Python软件对近几年来上海市的空气质量数据进行可视化分析。
第12章从人口总数、增长率、抚养比等方面,对我国的人口现状和趋势进行分析。
第13章通过Python爬取京东商品的用户评论数据,并进行评论文本的可视化分析。
本书特色
本书编者拥有十余年大数据分析和挖掘从业经验,本书内容大部分是实际工作经验的分享,其中涉及大量可视化经验和案例,有较大参考价值。
依据数据可视化流程进行讲解,首先介绍Python基础,然后介绍Pandas数据预处理技术,再介绍Matplotlib和Pyecharts可视化工具,最后讲解了几个可视化项目,循序渐进,从入门到实践,既适合初学者入门,也适合对可视化图形和工具不熟悉的从业者掌握知识和提升技能。
本书以某电商企业数据可视化为例,书中给出了大量可视化案例,介绍了各种可视化图形的绘制方法和技巧,读者可以依照本书提供的实例和相应的数据进行演练,边学边练,高效掌握,并且能够解决实际工作中遇到的问题。
本书提供了完整的数据资源(数据基本存储在MySQL数据库中)和教学视频,读者可以使用本书的数据资源进行练习,遇到学习上的问题,还可以扫码观看教学视频,从而大幅提升学习效率。
读者对象
本书适用于互联网、电商、咨询等行业的数据分析人员以及媒体、网站等数据可视化用户,可供高等院校相关专业的学生以及从事大数据可视化的研究者参考使用,也可作为Python软件培训和自学用书。
截至2023年5月,Matplotlib的版本为3.7.0,Pyecharts的版本为2.0.2,本书正是基于以上版本编写的,全面而详细地介绍了Matplotlib和Pyecharts在数据可视化分析中的应用。
配书资源
为方便读者学习本书,本书还提供了教学视频、源代码和PPT课件,其中教学视频扫描各章的二维码即可直接观看。源代码和PPT课件可以扫描以下二维码获取。
如果你在学习和资源下载的过程中遇到问题,可以发送邮件至[email protected],邮件主题写“Python数据可视化之Matplotlib与Pyecharts实战”。
由于编者水平所限,书中难免存在疏漏之处,请广大读者批评指正。
编 者
2023年8月
评论
还没有评论。