描述
开 本: 16开纸 张: 铜版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787568049351丛书名: 普通高等院校数据科学与大数据技术专业“十三五”规划教材
章 绪论 6
1.1数据科学概述 6
1.2 数据科学的建模流程 8
1.3 Python语言开发环境与库入门 12
1.3.1 开发环境 12
1.3.2 Python基本语法 15
1.3.3 Python常用库和功能 16
1.4本书内容介绍 19
第二章 回归模型 21
2.1概述 21
2.2线性回归 22
2.2.1 一元线性回归 22
2.2.2 多元线性回归 25
2.3线性回归案例 28
2.3.1儿童体表面积预测 28
2.3.2波士顿房价因素分析 32
附录:scikit-learn库中的LinearRegression 34
2.4逻辑回归 35
2.4.1 逻辑回归模型 35
2.4.2 逻辑回归方程中回归系数的估计及含义 37
2.4.3 逻辑回归方程的统计检验 38
2.5逻辑回归案例 40
2.5.1考试成绩预测 40
2.5.2鸢尾花分类 42
附录:scikit-learn库中的LogisticsRegression 44
第三章 聚类模型 46
3.1概述 46
3.1.1聚类分析概述 46
3.1.2基于距离的聚类相似度 49
3.2 K-means聚类 50
3.2.1 K-means聚类算法 50
3.2.2 K-means聚类实例 51
3.2.3 K-means聚类的优缺点 56
3.3 密度聚类 56
3.3.1 DBSCAN密度定义 56
3.3.2 DBSCAN聚类算法 56
3.3.3 DBSCAN聚类的优缺点 57
3.4 层次聚类 57
3.4.1系统聚类 58
3.4.2 DIANA算法 64
3.4.3 层次聚类算法的优缺点 67
3.5 案例 67
3.5.1 一个二维数据集聚类 67
3.5.2一个居民家庭情况案例 69
3.5.3一个医疗建设评价案例 75
附录:scikit-learn库中的KMeans 77
第四章 关联规则 80
4.1 概述 80
4.1.1 问题概述 80
4.1.2 关联规则概述 80
4.1.3 关联分析的基本概念 81
4.2 Apriori算法 84
4.3 基于Apriori算法的改进算法 88
4.4 FP-Growth算法 90
4.5 关联规则案例 94
4.5.1一个销售记录的关联分析案例 94
4.5.2商品购买记录分析 98
4.5.3电影推荐 100
第五章 决策树 104
5.1概述 104
5.1.1 决策树基本算法 104
5.1.2 CLS算法 105
5.1.3 信息熵 106
5.2 ID3算法 107
5.2.1基本思想 107
5.2.2 ID3算法应用实例 109
5.3 C4.5算法 112
5.3.1 基本思想 112
5.3.2 基于信息增益率建模的决策树 113
5.4 CART算法 114
5.4.1 基本思想 114
5.4.2 基于CART算法建模的决策树 115
5.5 决策树的剪枝 117
5.6 案例 121
5.6.1泰坦尼克号乘客幸存预测 121
5.6.2乳腺癌诊断 125
附录:scikit-learn库中的DecisionTreeClassifier 129
第六章 支持向量机 132
6.1概述 132
6.2线性支持向量机 132
6.2.1 硬间隔线性支持向量机 133
6.2.2 软间隔线性支持向量机 135
6.3非线性支持向量机 138
6.3.1特征空间硬间隔支持向量机 140
6.3.2特征空间软间隔支持向量机 141
6.4 支持向量机的求解和多分类问题 142
6.4.1 支持向量机的求解 142
6.4.2 多分类问题 142
6.5新闻文本分类案例 144
附录:scikit-learn库中的SVM 147
第七章 贝叶斯网络 150
7.1概述 150
7.1.1 贝叶斯网络定义 150
7.1.2 贝叶斯网络的知识推理模式 151
7.1.3 贝叶斯网络建立的主要步骤 151
7.1.4贝叶斯网络的结构学习 152
7.1.5 贝叶斯网络的参数学习 153
7.1.6 主要贝叶斯网络模型 156
7.2 朴素贝叶斯网络 156
7.3 TAN贝叶斯网络 162
7.4 无约束贝叶斯网络 167
7.5 朴素贝叶斯进行垃圾邮件过滤 170
附录 scikit-learn库中的Naive-Bayes分类 174
第八章 深度学习 176
8.1概述 176
8.1.1 深度学习的发展历史 176
8.1.2 神经网络的基本模型 176
8.2多层感知机 180
8.2.1感知机 180
8.2.2多层感知机 184
8.3卷积神经网络 190
8.3.1基本网络结构 191
8.3.2反向传播训练算法 192
8.3.3 AlexNet网络结构 193
8.4循环神经网络 194
8.4.1基本网络结构 195
8.4.2反向传播训练算法 195
8.4.3长短时间记忆单元 196
8.5 构建卷积神经网络模型对CIFAR图片数据集分类 197
附录:TensorFlow基本用法 203
参考文献 207
评论
还没有评论。