描述
开 本: 128开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787300258256丛书名: 21世纪统计学系列教材
1.1什么是数据挖掘
1.2数据挖掘的结果
1.3数据挖掘能做什么
1.4数据挖掘方法的特点
1.5数据挖掘的典型应用
1.6R语言入门
1.7RStudio简介
1.8本章函数列表
第2章R的数据组织和整理
2.1R的数据对象
2.2向量的创建和访问
2.3矩阵的创建和访问
2.4数据框的创建和访问
2.5数组和列表的创建和访问
2.6数据对象的相互转换
2.7导入外部数据和保存数据
2.8R语言程序设计基础
2.9R语言数据整理和程序设计综合应用
2.10本章函数列表
第3章R的数据可视化
3.1绘图基础
3.2单变量分布特征的可视化
3.3多变量联合分布特征的可视化
3.4变量间相关性的可视化
3.5GIS数据的可视化
3.6文本词频数据的可视化
3.7本章函数列表
第4章R的近邻分析:数据预测
4.1近邻分析:K近邻法
4.2基于变量重要性的加权K近邻法
4.3基于观测相似性的加权K近邻法
4.4本章函数列表
第5章R的决策树:数据预测
5.1决策树算法概述
5.2分类回归树的生长过程
5.3分类回归树的剪枝
5.4分类回归树的R函数和应用示例
5.5建立分类回归树的组合预测模型
5.6随机森林
5.7本章函数列表
第6章R的人工神经网络:数据预测
6.1人工神经网络概述
6.2BP反向传播网络
6.3BP反向传播网络的R函数和应用示例
6.4本章函数列表
第7章R的支持向量机:数据预测
7.1支持向量分类概述
7.2线性可分问题下的支持向量分类
7.3广义线性可分问题下的支持向量分类
7.4线性不可分问题下的支持向量分类
7.5多分类的支持向量分类
7.6支持向量回归
7.7R的支持向量机及应用示例
7.8本章函数列表
第8章R的一般聚类:揭示数据内在结构
8.1聚类分析概述
8.2基于质心的聚类模型:KMeans聚类
8.3基于质心的聚类模型:PAM聚类
8.4基于联通性的聚类模型:层次聚类
8.5基于统计分布的聚类模型:EM聚类
8.6本章函数列表
第9章R的特色聚类:揭示数据内在结构
9.1BIRCH聚类
9.2SOM网络聚类
9.3基于密度的聚类模型:DBSCAN聚类
9.4本章函数列表
第10章R的关联分析:揭示数据关联性
10.1简单关联规则及其测度
10.2Apriori算法及应用示例
10.3Eclat算法及应用示例
10.4简单关联分析的应用示例
10.5序列关联分析及SPADE算法
10.6本章函数列表
第11章R的模式甄别:诊断异常数据
11.1模式甄别方法和评价概述
11.2模式甄别的无监督侦测方法及应用示例
11.3模式甄别的有监督侦测方法及应用示例
11.4模式甄别的半监督侦测方法及应用示例
11.5本章函数列表
第12章R的网络分析初步
12.1网络的定义、表示及构建
12.2网络节点重要性的测度
12.3网络子群构成特征研究
12.4网络整体特征刻画
12.5主要网络类型及特点
12.6本章函数列表R语言数据挖掘
,在保持内容框架不变的基础上,对各章节文字进行了全面梳理和规范,使得全书通篇文字表述更加一致、完整和严谨。
第二,为使读者更易理解原理,对第4章加权K近邻法的距离和相似度变换过程进行了更加详尽的讲解,调整了旁置法的表述;调整了第5章分类树生长过程异质性下降测度公式的书写形式,更加详尽地论述了对交叉验证的剪枝过程,增加了对随机森林输出结果的说明;统一了神经网络中权值、误差的数学书写;对EM聚类过程进行了更加详尽的讲解。
第三,增加了Rstudio简介。
本书可作为高等院校数据科学和大数据技术本科专业,以及其他相关专业本科生和研究生的学习教材,同时也可作为商业企业、科研机构、政府管理部门等相关数据分析人员的阅读参考书。请读者到中国人民大学经管图书在线(http://www.rdjg.com.cn)网站,下载本书案例数据和R程序代码。
特别感谢中国人民大学出版社对本书出版的大力支持,感谢王珏、刘茜、王艳红、周天旺、要卓、陈笑语等同学对本书的贡献。书中不妥和错误之处,望读者不吝指正。
评论
还没有评论。