描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787302577584丛书名: 大数据与人工智能技术丛书
本书配套资源丰富,包括教学大纲、教学课件、电子教案、程序源码、教学进度表,作者还为本书精心录制了600分钟的微课视频。
本书从Python数据分析的基础知识入手,结合大量的数据分析示例,系统地介绍了数据分析与可视化方法,带领读者逐步掌握Python数据分析的相关知识,提高解决实际问题的能力。 本书共13章,主要内容包括数据分析与可视化概述、Python编程基础、NumPy数值计算基础、Pandas统计分析基础、Pandas数据载入与预处理、Matplotlib数据可视化基础、Seaborn可视化、pyecharts可视化、时间序列数据分析、SciPy科学计算、统计与机器学习、图像数据分析和综合案例实战等。 本书可作为各类高等院校数据科学与大数据、软件工程和计算机科学与技术等专业的教材,也可作为Python数据分析初学者和爱好者的参考书。
第1章数据分析与可视化概述
1.1数据分析
1.2数据可视化
1.3数据分析与可视化常用工具
1.4为何选用Python进行数据分析与可视化
1.5Python数据分析与可视化常用类库
1.6Jupyter Notebook的安装和使用
1.6.1Jupyter Notebook的安装
1.6.2Jupyter Notebook的使用
1.7本章小结
1.8本章习题
第2章Python编程基础
2.1Python语言基本语法
2.1.1基础数据类型
2.1.2变量和赋值
2.1.3运算符和表达式
2.1.4字符串
2.1.5流程控制
2.2内置数据类型
2.2.1列表
2.2.2元组
2.2.3字典
2.2.4集合
2.3函数
2.3.1函数的定义
2.3.2lambda函数
2.4文件操作
2.4.1文件处理过程
2.4.2数据的读取方法
2.4.3读取CSV文件
2.4.4文件写入与关闭
2.5本章小结
2.6本章习题
2.7本章实训
第3章NumPy数值计算基础
3.1NumPy多维数组
3.1.1创建数组对象
3.1.2ndarray对象属性和数据转换
3.1.3生成随机数
3.1.4数组变换
3.2数组的索引和切片
3.2.1一维数组的索引
3.2.2多维数组的索引
3.3数组的运算
3.3.1数组和标量间的运算
3.3.2ufunc函数
3.3.3条件逻辑运算
3.4数组读/写
3.4.1读/写二进制文件
3.4.2读/写文本文件
3.4.3读取CSV文件
3.5NumPy中的数据统计与分析
3.5.1排序
3.5.2重复数据与去重
3.5.3常用统计函数
3.6本章小结
3.7本章习题
3.8本章实训
第4章Pandas统计分析基础
4.1Pandas中的数据结构
4.1.1Series
4.1.2DataFrame
4.1.3索引对象
4.1.4查看DataFrame的常用属性
4.2Pandas索引操作
4.2.1重建索引
4.2.2更换索引
4.3DataFrame数据的查询与编辑
4.3.1DataFrame数据的查询
4.3.2DataFrame数据的编辑
4.4Pandas数据运算
4.4.1算术运算
4.4.2函数应用和映射
4.4.3排序
4.4.4汇总与统计
4.5数据分组与聚合
4.5.1数据分组
4.5.2数据聚合
4.5.3分组运算
4.6数据透视表
4.6.1透视表
4.6.2交叉表
4.7Pandas可视化
4.7.1线形图
4.7.2柱状图
4.7.3直方图和密度图
4.7.4散点图
4.8本章小结
4.9本章习题
4.10本章实训
第5章Pandas数据载入与预处理
5.1数据载入
5.1.1读/写文本文件
5.1.2读/写Excel文件
5.1.3JSON数据的读取与存储
5.1.4读取数据库文件
5.2合并数据
5.2.1merge数据合并
5.2.2concat数据连接
5.2.3combine_first合并数据
5.3数据清洗
5.3.1检测与处理缺失值
5.3.2检测与处理重复值
5.3.3检测与处理异常值
5.3.4数据转换
5.4数据标准化
5.4.1离差标准化数据
5.4.2标准差标准化数据
5.5数据变换与数据离散化
5.5.1类别型数据的哑变量处理
5.5.2连续型变量的离散化
5.6本章小结
5.7本章习题
5.8本章实训
第6章Matplotlib数据可视化基础
6.1Matplotlib简介
6.2Matplotlib绘图基础
6.2.1创建画布与子图
6.2.2添加画布内容
6.2.3绘图的保存与显示
6.3设置Pyplot的动态rc参数
6.3.1全局参数定制
6.3.2rc参数设置
6.3.3绘图的填充
6.3.4在绘图中显示公式
6.3.5文本注解
6.4Pyplot中的常用绘图
6.4.1折线图
6.4.2散点图
6.4.3直方图
6.4.4饼图
6.4.5箱线图
6.4.6概率图
6.4.7雷达图
6.4.8流向图
6.4.9绘图中的表格设置
6.4.10极坐标图
6.5词云
6.5.1安装相关的包
6.5.2词云生成过程
6.5.3词云生成示例
6.6本章小结
6.7本章习题
6.8本章实训
第7章Seaborn可视化
7.1Seaborn简介
7.2风格设置
7.2.1Seaborn绘图设置
7.2.2Seaborn 主题设置
7.2.3设置绘图元素比例
7.3Seaborn中的常用绘图
7.3.1直方图和密度曲线图
7.3.2散点图
7.3.3箱线图
7.3.4散点图矩阵
7.3.5小提琴图
7.3.6柱状图
7.3.7多变量图
7.3.8回归图
7.3.9关系类图
7.3.10热力图
7.4本章小结
7.5本章习题
7.6本章实训
第8章pyecharts可视化
8.1pyecharts简介
8.2pyecharts的使用方法
8.3pyecharts常用图表
8.3.1柱状图
8.3.2饼图
8.3.3漏斗图
8.3.4散点图
8.3.5K线图
8.3.6仪表盘
8.3.7词云
8.3.8组合图表
8.3.9桑基图
8.3.10平行坐标图
8.3.11图
8.3.12地图
8.4本章小结
8.5本章习题
8.6本章实训
第9章时间序列数据分析
9.1日期和时间数据类型
9.1.1datetime构造
9.1.2数据转换
9.2时间序列基础
9.2.1时间序列构造
9.2.2索引与切片
9.3日期范围、频率和移位
9.3.1日期范围
9.3.2频率和移位
9.4时期
9.4.1时期基础
9.4.2频率转换
9.4.3时期数据转换
9.5重采样、降采样和升采样
9.5.1重采样
9.5.2降采样
9.5.3升采样
9.6时间序列的平稳性检验
9.6.1时序图检验
9.6.2自相关图检验
9.6.3构造统计量检验
9.7本章小结
9.8本章习题
9.9本章实训
第10章SciPy科学计算
10.1SciPy中的常数与特殊函数
10.1.1SciPy的constants模块
10.1.2SciPy的special模块
10.2SciPy中的线性代数基本运算
10.2.1基本的矩阵运算
10.2.2线性方程组求解
10.2.3行列式的计算
10.2.4范数
10.2.5特征值分解
10.2.6奇异值分解
10.3SciPy中的优化
10.3.1方程求解及求极值
10.3.2数据拟合
10.4SciPy中的稀疏矩阵处理
10.4.1稀疏矩阵的存储
10.4.2稀疏矩阵的运算
10.5SciPy中的图像处理
10.5.1图像平滑
10.5.2图像旋转和锐化
10.6信号处理
10.6.1数据重采样
10.6.2信号的卷积
10.6.3信号的时频分析
10.7本章小结
10.8本章习题
10.9本章实训
第11章统计与机器学习
11.1Scikitlearn的主要功能
11.2回归分析
11.2.1一元线性回归方法
11.2.2逻辑回归
11.3分类
11.3.1决策树规约
11.3.2KNN算法
11.3.3支持向量机
11.3.4朴素贝叶斯分类
11.4聚类
11.4.1KMeans聚类
11.4.2层次聚类
11.4.3基于密度的聚类
11.5主成分分析
11.6本章小结
11.7本章习题
11.8本章实训
第12章图像数据分析
12.1OpenCV简介与导入
12.1.1OpenCV简介
12.1.2Python中OpenCV的安装与导入
12.2cv2图像处理基础
12.2.1cv2的基本方法与属性
12.2.2cv2图像处理示例
12.3应用尺度不变特征变换
12.4使用加速鲁棒特征检测
12.5图像降噪
12.6本章小结
12.7本章习题
12.8本章实训
第13章综合案例
13.1职业人群体检数据分析
13.2股票数据分析
13.3红酒数据分析
随着互联网的飞速发展,人们在互联网上的行为产生了海量数据,对这些数据的存储、处理与分析带动了大数据技术的发展。其中,数据分析与可视化技术可以帮助人们在庞大的数据之间进行相关分析,找到有价值的信息和规律,使得人们对世界的认识更快、更便捷。在数据科学领域,Python语言由于简单易用、第三方库强大的特点,深受数据分析人员的青睐。
因此,本书从Python数据分析的基础知识入手,结合大量的数据分析示例,系统地介绍了数据分析和可视化的原理与方法,带领读者逐步掌握Python数据分析的相关知识,提高解决实际问题的能力。
本书特色
(1) 内容全面,讲解系统。
(2) 给出了数据分析环境的安装和配置步骤。
(3) 详细介绍了利用Python进行数据分析与可视化的方法。
(4) 提供了多个有较高应用价值的项目案例,有很强的实用性。
(5) 配套资源丰富,方便教学和学习。
本书内容
第1章数据分析与可视化概述,主要介绍数据分析与可视化的基本内容、数据分析与数据挖掘的关系、数据分析与可视化常用的工具、Python数据分析与可视化的主要库、Jupyter Notebook的安装以及基本使用方法。
第2章Python编程基础,主要介绍Python语言的基本语法、内置数据类型、函数以及文件操作。
第3章NumPy数值计算基础,主要介绍数组及其索引、数组运算、数组读写及常用的统计与分析方法。
第4章Pandas统计分析基础,主要介绍Pandas中的数据结构、索引操作、数据查询与编辑、分组汇总聚合、透视表以及Pandas的简单绘图。
第5章Pandas数据载入与预处理,主要针对数据预处理阶段的需求,介绍使用Pandas载入数据、合并数据、数据清洗、数据标准化及数据转换的典型方法。
第6章Matplotlib数据可视化基础,主要介绍Pyplot绘图的基本语法、常用参数设置和各类常用图形的绘制。
第7章Seaborn可视化,主要介绍Seaborn可视化中的风格与主题设置及常见绘图的基本用法。
第8章pyecharts可视化,主要介绍pyecharts的安装与导入,绘图的主要过程以及柱状图、饼图、K线图、仪表盘、词云、平行坐标图、桑基图、地图及组合图表的绘制方法。
第9章时间序列数据分析,主要介绍时间序列数据分析的基本方法,包括Pandas中日期型数据,日期的范围、频率,时期的操作以及平稳序列的基本检验方法。
第10章SciPy科学计算,主要介绍SciPy中的常数和特殊函数、线性代数运算、优化、稀疏矩阵处理、简单的图像处理及信号处理等内容。
第11章统计与机器学习,主要介绍Scikitlearn库的主要功能、典型的回归分析、分类、聚类算法以及主成分分析方法。
第12章图像数据分析,主要介绍OpenCV的导入、图像的基本操作、SIFT和SURF特征点的提取及图像的降噪。
第13章综合案例,介绍了三个综合案例,针对职业人群体检数据、股票数据和红酒数据,结合前面章节介绍的数据分析和数据可视化技术,进行数据分析。
与第1版相比,第2版有如下调整:
对数据分析与可视化内容强化了理论讲解与系统性说明;
补充了Jupyter Notebook的安装、Pandas数据查询、Pandas数据库文件和JSON数据读取、时间序列的平稳性检验、SciPy中的信号处理以及回归分析等内容;
优化了部分示例代码,补充了雷达图、流向图、平行坐标图、极坐标图、关系类图、热力图和地图等绘图方法;
增加了数据分析案例与各章习题。
本书配套资源
教学大纲、教学课件、电子教案、程序源码、在线教程、教学进度表。
600分钟的视频讲解。
资源下载提示
课件等资源: 扫描封底的“课件下载”二维码,在公众号“书圈”下载。
素材(源码)等资源: 扫描目录上方的二维码下载。
在线作业: 扫描封底作业系统二维码,登录网站在线做题及查看答案。
视频等资源: 扫描封底刮刮卡中的二维码,再扫描书中相应章节中的二维码,可以在线学习。
本书由魏伟一、李晓红和高志玲共同编写。
由于作者水平有限,书中难免存在疏漏和不足之处,敬请读者批评指正。
编者2021年3月
评论
还没有评论。