描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787302510802
如今,以互联网大数据分析为基础的人工智能,如机器学习、商业智能、数据挖掘、文本挖掘、数据可视化等领域都渴求强大、高效的数据科学工具,这种渴求让R大放异彩。R 系统本身就是一个开放的系统,除了传统的数据统计分析/绘图等软件包,现在更增加了机器学习、数据和文本挖掘、大数据分析等相关的诸多程序包,让R语言在这些领域成为“光彩夺目”的明星。
如果你对上述热门的领域之一感兴趣,并且想将R引入你的工作或研究中,那么本书就是一本快速参考指南。本书也可以作为完全不懂 R 软件及数据分析的读者自学R语言的*本读物。
本书适合没有程序设计经验、想要接触R语言的人以及对统计、机器学习、数据挖掘、文本挖掘、大数据分析有兴趣的人阅读。
第1章 R简介 1
1.1 开始使用R软件 1
1.2 R对象 4
1.2.1 向量 4
1.2.2 数组 5
1.2.3 矩阵 7
1.2.4 数据框 9
1.2.5 因子 11
1.2.6 列表 11
1.2.7 对象转换 12
第2章 数据的读取与写入 14
2.1 数据的读取 14
2.2 数据的写入与数据集 17
2.3 RData 格式数据的写入与读取 18
2.4 读取 SQL Server 数据库的数据 19
第3章 流程控制及自定义函数 20
3.1 条件执行 20
3.2 循环控制 22
3.3 自定义函数 25
第4章 绘图功能及基本统计 27
4.1 高级绘图 27
4.2 低级绘图 30
4.3 交互式绘图 31
4.4 图形参数 32
4.5 基本统计 34
第5章 相关程序包的介绍 39
5.1 机器学习 39
5.2 数据挖掘 40
5.3 社交网络分析及文本挖掘 40
5.4 大数据分析 41
5.5 程序包的介绍 41
第6章 监督式学习 51
6.1 决策树 51
6.2 支持向量机 61
6.3 人工神经网络 65
6.4 组合方法 70
6.4.1 随机森林 70
6.4.2 推进法 71
第7章 无监督式学习 72
7.1 层次聚类法 72
7.2 K 平均聚类算法 75
7.3 模糊C平均聚类算法 77
7.4 聚类指标 83
第8章 进化式学习 86
8.1 基因算法 86
8.2 人工蜂群算法 92
第9章 混合式学习 95
9.1 使用 C50 和 ABCoptim 程序包范例 95
9.2 使用基因算法来调整人工神经网络参数的范例 97
第10章 关联规则 107
10.1 关联规则简介 107
10.2 Apriori 算法 108
第11章 社交网络分析和文本挖掘 117
11.1 社交网络分析 117
11.2 文本挖掘 122
第12章 图形化数据分析工具 125
12.1 导入数据 126
12.1.1 处理数据集 130
12.1.2 设置变量 131
12.2 探索和测试数据 131
12.3 转换数据 135
12.4 建立、评估和导出模型 137
第13章 大数据分析 (R Hadoop) 141
13.1 Hadoop 简介 141
13.2 R Hadoop 142
第14章 SparkR 大数据分析 170
14.1 dplyr 数据处理程序包 172
14.2 SparkR 数据处理 175
14.3 SparkR 与 SQL Server 181
14.4 SparkR 与 Cassandra 184
14.5 Spark Standalone 模式 186
14.6 SparkR 数据分析 189
附录A 下载和安装 R 197
附录B 安装RStudio Desktop 203
附录C 安装ODBC 209
附录D 指令及用法 214
附录E 在虚拟机上安装 R Hadoop 218
附录F 在虚拟机上安装 SparkR 247
参考文献 272
随着 R 软件的流行及普及化,许多学者和专家转而使用 R 作为研究与开发的工具。R软件有 Windows、UNIX、Linux及Apple MacOS等不同操作系统的免费版本,更有一万种以上免费程序包可供使用,所以学习R软件是睿智的选择。
本书内容共有14章,前4章先介绍 R 软件的基本操作和应用,第5章对本书所使用的程序包做完整的介绍,包含 R 软件在机器学习(Machine Learning)、数据挖掘(Data Mining)、文本挖掘(Text Mining)及大数据(Big Data)分析的相关程序包,第6~9章介绍各类学习算法,第10~12章介绍关联规则、网络社群分析及文本挖掘、图形化数据分析工具,后两章介绍 Hadoop 和 Spark 大数据分析。
本书是作者多年来从事教学的心血结晶,适合作为大专院校信息类相关科系的教材,同时书中范例的程序代码丰富,也可作为练习的补充教材。本书的撰写以完全不懂R软件及数据分析的读者为对象,对于有意愿自学的读者而言,本书也是一本不错的入门参考书。
本书配套范例程序可从下面的网址(注意区分数字和字母大小写)下载或扫描右边的二维码获取:
https://pan.baidu.com/s/17b-xnYfhICguW4wSz8pWXA
如果下载有问题,请联系[email protected],邮件主题为“零基础学R语言数据分析:从机器学习、数据挖掘、文本挖掘到大数据分析”。
本书的撰写虽已力求完美,但难免会有疏漏之处,欢迎各位读者指教。
李仁钟、李秋缘
2018年6月
评论
还没有评论。