描述
开 本: 128开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787121422003
从数据思维到数据分析及挖掘算法
每个算法均有Python代码实现
可加入读者交流群,与作者互动
《数据分析与挖掘算法:Python实战》是一本介绍数据分析相关算法的学习指南,主要包括数据分析及数据挖掘相关概念介绍、数据思维及各种数据分析算法的原理及实现方法。
《数据分析与挖掘算法:Python实战》的每个数据分析算法都介绍了数学原理、Python代码实现以及实战案例,内容丰富、容易理解。
本书共9章,第1章介绍了数据挖掘与数据分析、机器学习之间的关系;第2 章介绍了数据分析人员应该具备的数据思维,包括数据思维认知、数据挖掘“定律”;第3~9章介绍了各种数据分析算法的原理、实现方法及实战案例,其中包括逻辑回归、决策树、朴素贝叶斯、聚类分析、关联规划、人工神经网络、集成学习。
《数据分析与挖掘算法:Python实战》适合从事数据分析工作的读者自学,也可作为产品经理、运营人员、市场人员和对数据分析感兴趣的读者的参考用书。
第1章 数据分析概述 1
1.1 什么是数据挖掘 2
1.2 数据挖掘与数据分析的关系 6
1.3 数据挖掘与机器学习的关系 8
1.4 机器学习算法简介 13
第2章 数据思维 19
2.1 数据思维认知 21
2.2 数据思维认知的主观性与客观性 26
2.3 数据挖掘“定律” 29
第3章 逻辑回归 37
3.1 逻辑回归基础:从线性回归到逻辑回归 38
3.2 逻辑回归函数构建 41
3.3 逻辑回归问题求解 46
3.4 逻辑回归模型评估 49
3.5 Python代码实现 55
第4章 决策树 65
4.1 决策树基础 66
4.2 决策树算法 70
4.3 Python代码实现 86
第5章 朴素贝叶斯 95
5.1 概率论基础 96
5.2 从贝叶斯公式到朴素贝叶斯分类 100
5.3 Python代码实现 106
第6章 聚类分析 113
6.1 聚类分析基础 115
6.2 聚类算法 121
6.3 Python代码实现 128
第7章 关联规则 137
7.1 关联规则基础 140
7.2 关联规则算法 143
7.3 Python代码实现 147
第8章 人工神经网络 151
8.1 人工神经网络基础 153
8.2 BP(误差逆传播前馈)神经网络 158
8.3 Python代码实现 164
第9章 集成学习 169
9.1 集成学习基础 170
9.2 集成学习算法 174
参考资料 181
对机器学习进行研究能使我们成为更好的数据科学家和问题解决者。本书从数据分析理论出发,以编程实现为落脚点,后从哲学层面对数据思维进行探讨,进而将思维“定律”与业务相结合。具体到编程层面,本书选择的工具是Python,因为它足够简单且实用,甚至在整个数据科学领域,Python基本都可以说是稳坐工具中的“头把交椅”。
笔者拥有多年大数据从业经验,穿梭于业务与“数据工作”之间,见证了业务与数据的“相爱相杀”。业务诉求是通过数据分析和数据挖掘技术实现的,由此,笔者将相对零散的技术进行了归纳与提炼。写书的过程也是知识沉淀与梳理及重新认识的过程,笔者心存感恩。
本书共9章,第1章对数据分析相关概念、概念间的关系及数据分析流程进行了总览和概述,并对后面章节所论述的机器学习算法的作用和应用领域进行了简单介绍。第2章对业务和数据的“相爱相杀”进行了阐述,包括数据思维认知以及数据挖掘“定律”。第3章是对逻辑回归从理论到实践的论述与讲解,包括模型的评估(此模型的评估原理的代码也适合本书后面介绍的决策树、朴素贝叶斯等有监督学习模型)。第4章是对决策树从理论到实践的论述与讲解,包括ID3、C4.5以及CART。第5章是对朴素贝叶斯从理论到实践的论述与讲解,包括多项式模型(MultinomialNB)、高斯模型(GaussianNB)和伯努利模型(BernoulliNB)。第6章是对聚类分析从理论到实践的论述与讲解,包括基于划分的K-means算法、K-mediods算法和基于密度的DBSCAN算法。第7章是对关联规则从理论到实践的论述与讲解,包括Apriori等算法。第8章是对人工神经网络从理论到实践的论述与讲解,包括BP(误差逆传播)等算法。第9章对集成学习进行了理论论述与讲解,包括Bagging、随机森林等算法。
评论
还没有评论。