描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787302491163
《精通Oracle R Enterprise大数据 在Oracle数据库中充分利
用R的强大功能》指导你高效管理企业大数据,顺畅运行复杂流
程。本书简明实用,分步讲解如何创建和执行大规模预测性分析
并保持卓越性能。通过本书的学习,你将能分析和准备数据、准
确建立业务流程模型、生成精密图形、编写和部署功能强大的脚
本,并能将Oracle R Enterprise功能有效地运用于APEX应用程序、
OBIEE仪表板以及Apache Hadoop系统。
主要内容
● 安装、配置和管理Oracle R Enterprise
● 建立连接并将数据移到数据库
● 创建Oracle R Enterprise包和函数
● 使用R语言处理Oracle Database中的数据
● 使用ODM、ORE和其他算法构建模型
● 开发和部署R脚本以及使用R脚本库
● 执行嵌入式R脚本,使用ORE SQL API函数
● 使用Oracle R Advanced Analytics for Hadoop映射和操纵数据
● 在Oracle Data Miner、OBIEE和其他应用程序中使用ORE
目 录
第1章
Oracle R Enterprise简介 1
1.1 本书的目标 3
1.2 Oracle Advanced Analytics
选件 4
1.3 Oracle R Enterprise(Oracle R
企业版) 5
1.4 利用Oracle R Enterprise易于
部署R 7
1.5 Oracle的R技术 9
1.6 客户如何使用Oracle R
Enterprise和Oracle Advanced
Analytics 10
1.7 小结 11
第2章
安装Oracle R Enterprise 13
2.1 安装的先决条件 13
2.2 设置Oracle Database 14
2.3 安装Oracle R Enterprise 15
2.3.1 Oracle R Enterprise的
软件包 15
2.3.2 安装前的要求 16
2.3.3 在Oracle
Database Server
上的安装 17
2.3.4 安装客户端 22
2.4 验证ORE的安装 25
2.5 安装RStudio 26
2.6 使用Oracle的预制应用 27
2.6.1 预制应用Oracle
Database
Developer
27
2.6.2 预制应用Oracle
OBIEE
Sample
App 28
2.6.3 预制应用Oracle
Big Data
Lite
29
2.7 小结 29
第3章
Oracle R Enterprise入门 31
3.1 创建和管理到数据库的ORE
连接 31
3.1.1 使用ore.connect创建ORE
连接 32
3.1.2 使用ore.sync同步数据 33
3.1.3 使用ore.attach将对象加入
搜索空间 35
3.2 执行SQL命令 36
3.3 在Oracle Database中处理
数据 36
3.4 在数据库中存储数据 40
3.4.1 使用ore.creat函数建表 40
3.4.2 使用ore.drop函数删除表 40
3.4.3 ore.create函数和ore.drop
函数组合使用的示例 41
3.5 在数据库自带的R Datastore中
存储ORE对象 41
3.6 断开与数据库的连接 46
3.7 小结 46
第4章
透明层
47
4.1 透明层概述 47
4.2 探寻ORE透明层背后的
真相 50
4.3 小结 53
第5章
Oracle R Enterprise程序包 55
5.1 Oracle R Enterprise程序包 55
5.2 探索ORE包函数和程序包
版本 57
5.3 ORE设置和选项 59
5.4 获得ORE的帮助 61
5.5 ORE演示脚本 62
5.6 小结 66
第6章
探索数据 67
6.1 探索性数据分析(EDA) 68
6.2 数据抽样 73
6.3 数据聚合 78
6.4 数据转换 80
6.4.1 派生属性 80
6.4.2 分块属性 81
6.4.3 组合数据 82
6.5 数据排序 82
6.6 小结 83
第7章
使用ODM算法建立模型 85
7.1 Oracle Data Mining(Oracle
数据挖掘)
86
7.1.1 ORE中可用的ODM算法 87
7.1.2 利用OREdm软件包在Oracle
中进行自动数据准备 87
7.2 使用OREdm软件包建立模型
和对数据进行评分 88
7.2.1 属性重要性 88
7.2.2 关联规则分析 89
7.2.3 决策树 92
7.2.4 支持向量机 94
7.2.5 朴素贝叶斯 98
7.2.6 广义线性模型 99
7.2.7 聚类
100
7.3 保存数据挖掘模型 101
7.4 小结 103
第8章
利用ORE和其他算法建立
模型 105
8.1 什么算法是可用的? 106
8.2 为建模而准备数据 106
8.3 使用ORE算法建立模型 107
8.3.1 广义线性模型 108
8.3.2 线性和逐步回归模型 109
8.3.3 神经网络 111
8.3.4 随机森林 112
8.4 使用R软件包和算法构建
模型 113
8.5 使用ore.predict优化数据库自
带的评分过程 115
8.6 小结 117
第9章
在用户定义的R脚本库中
生成R脚本 119
9.1 使用R脚本库 120
9.2 创建和删除R脚本
120
9.3 授予和撤消用户定义的R
脚本的特权 122
9.4 管理R Script Repository 123
9.5 使用SQL API创建脚本 123
9.5.1 创建一个R脚本 124
9.5.2 删除一个脚本 126
9.5.3 授予和撤消访问权限 126
9.5.4 用户定义的R脚本的数据
字典视图 127
9.6 小结 127
第10章
嵌入式R执行 129
10.1 通过R接口使用嵌入式R
执行 129
10.1.1 如何使用ore.doEval
函数 130
10.1.2 如何使用ore.tableApply
函数 132
10.1.3 如何使用ore.groupApply
函数 134
10.1.4 如何使用ore.rowApply
函数 135
10.1.5 如何使用ore.indexApply
函数 136
10.1.6 并行执行嵌入式R
函数 137
10.2 通过SQL接口使用嵌入式
R执行 138
10.2.1 如何使用rqEval
SQL
函数 138
10.2.2 如何使用SQL
函数rqTableEval
140
10.2.3 如何使用SQL
函数“rqGroupEval”
144
10.2.4 如何使用SQL函数
rqRowEval
146
10.3 小结 147
第11章
针对Hadoop的Oracle R
Advanced Analytics 149
11.1 连接到Apache Hive上并处理
数据 152
11.2 使用ORCH管理Map-Reduce
作业 155
11.3 通过ORAAH使用Spark 157
11.4 小结 158
第12章
通过Oracle Data Mining
使用ORE 159
12.1 Oracle Data Mining 160
12.2 Oracle Data Miner 164
12.3 通过SQL Node来包含R
脚本 165
12.4 使用R节点 167
12.5 小结 168
第13章
在APEX和OBIEE中使用
ORE 171
13.1 Oracle APEX 171
13.1.1 在APEX应用程序中
包含ORE脚本 173
13.1.2 向APEX应用程序中
添加R图形 175
13.2 Oracle
Business Intelligence 177
13.2.1 设置OBIEE以便能
使用ORE
178
13.2.2 在OBIEE
RPD中使用
R脚本 180
13.2.3 在仪表板上呈现由R
脚本产生的结果 180
13.3 小结 182
第14章
针对Oracle DBA的
ORE 183
14.1 在数据库中创建一个新的
ORE模式 183
14.2 在Oracle R Enterprise中
安装新的R软件包 184
14.2.1 在数据库服务器上安装新
的R软件包 185
14.2.2 在客户机上安装新
软件包 186
14.3 ORE的全局变量和选项 187
14.4 使用ore.parallel特性 189
14.5 卸载Oracle R Enterprise 189
14.5.1 从Oracle
Database服务
器中卸载Oracle
R
Enterprise
190
14.5.2 从客户端卸载Oracle
R Enterprise 191
14.6 小结 192
前 言
高级分析和Big Data的世界正处于不断发展中——不断发展出新产品来帮助我们管理各种形式和规模的数据。公司要面对的一个挑战是处理它们日益增长的数据量(volumes)并提取有意义和有用的信息。
R语言是一种开源语言,已经诞生20多年了。我们已经看到,R语言在全世界几乎每个行业中都得到广泛传播,与之相随的每年数以千计的毕业生进入市场。这使得组织可培养数据分析师并让他们从事分析数据的工作。尽管R语言有许多优点,但它仍有大量的局限。局限主要集中在这种语言随当今大部分组织所面对的典型数据量而调整的能力方面。
而在Oracle R Enterprise中,Oracle已经克服了R语言的这些局限。 Oracle已经获得了R语言并将它集成到Oracle Database中。这样一来便解决了任何可扩展性问题和性能问题。Oracle R Enterprise能使R脚本并行执行,并将数据库服务器用作计算引擎以便允许极大量的数据在给定时间内得到处理。通过将R语言集成到Oracle Database中,你便可以使用SQL和PL/SQL(数据库的主要编程语言)来执行脚本并处理结果。这种集成,再结合SQL语言,使你可以很容易地把分析和图片包含到产品环境或前端应用中。任何能够调用和处理SQL的编程语言现在都可以运行脚本并处理结果。
《精通Oracle R Enterprise大数据》的目标读者有三类。类是数据科学家,他们使用R语言进行分析和高级分析工作。随着数据集的增长,他们将Oracle R Enterprise用作Oracle Database和数据库服务器的接口。《精通Oracle R Enterprise大数据》将帮助他们理解如何使用Oracle R Enterprise及如何结合其他产品来使用Oracle R Enterprise。第二类包括 SQL和Oracle Business
Intelligence的开发者。这类用户有一种不断增长的需求:将使用R得到的分析结果并集成到他们的应用和分析仪表盘(analytic dashboard)中。这些开发者可使用Oracle R Enterprise所携带的SQL API函数(function)来很容易地把用户定义的R脚本集成到工作流、应用程序和仪表盘中。第三类用户包括那些使用分析、Big Data和高级分析等的多重角色人员。这些用户利用Oracle Database、Hadoop、R语言、SQL、PL/SQL、APEX以及各种高级分析工具进行工作。《精通Oracle R Enterprise大数据》包含Oracle R Enterprise如何被这三类用户中的每一类使用的细节。
通过《精通Oracle R Enterprise大数据》,你可以学到并理解:
l
如何安装Oracle R
Enterprise。
l
如何设置和配置Oracle Database
schemas以便使用Oracle R Enterprise。
l
透明层是什么以及如何能利用它来无缝地使用数据库中的数据。
l
如何利用Oracle Database中的数据来访问、使用、转换和抽样数据。
l
Oracle R Enterprise的不同成分和这个产品所携带的附加的高级分析算法。
l
如何利用R来使用数据库中的Oracle Data
Mining算法。
l
如何在Hadoop上使用Oracle R Advanced Analytics来进行分析以及如何使用Spark-enabled算法。
l
如何利用Oracle Data
Miner GUI工具来使用Oracle R Enterprise和用户定义的R脚本。
l
如何把用户定义的R添加到诸如Oracle APEX 和OBIEE之类的应用程序中。
l 为了支持Oracle R Enterprise,数据库管理员需要执行什么任务。
《精通Oracle R
Enterprise大数据》大部分章节都列举了丰富的示例。为节省时间以及避免输入错误,《精通Oracle R Enterprise大数据》提供了一组代码文件,每章的代码都放在一个单独文件中。
可从McGraw-Hill
Professional网站www.mhprofessional.com下载压缩文件。只需要输入书名或ISBN (1259585166),然后单击《精通Oracle R
Enterprise大数据》主页的Downloads & Resources选项卡即可。另外,扫描《精通Oracle R Enterprise大数据》封底的二维码也可获得代码文件。
评论
还没有评论。