fbpx

[email protected]

购物车

 查看订单

  • 我的帐户
东东购 | EasternEast
  • 中文书店
    • 畅销排行榜
      • 小说 畅销榜
      • 童书 畅销榜
      • 外语畅销榜
      • 管理畅销榜
      • 法律畅销榜
      • 青春文学畅销榜
    • 热门分类
      • 社会小说
      • 成功/励志 畅销榜
      • 人物传记
      • 大陆原创
      • 绘本童书
      • 影视小说
    • 文学推荐
      • 文集
      • 戏剧
      • 纪实文学
      • 名家作品
      • 民间文学
      • 中国现当代随笔
    • 新书热卖榜
      • 小说 新书热卖榜
      • 青春文学 新书热卖榜
      • 童书 新书热卖榜
      • 管理 新书热卖榜
      • 成功/励志 新书热卖榜
      • 艺术 新书热卖榜
  • 精选分类
    • 小说
    • 保健养生
    • 烹饪/美食
    • 风水/占卜
    • 青春文学
    • 童书
    • 管理
    • 成功/励志
    • 文学
    • 哲学/宗教
    • 传记
    • 投资理财
    • 亲子家教
    • 动漫/幽默
    • 法律 Legal
    • 经济 Economics
    • 所有分类
  • 关于东东
  • 帮我找书
搜索
首页计算机/网络数据库大数据原理与技术

大数据原理与技术

大数据原理与技术

作者:黄史浩 出版社:人民邮电出版社 出版时间:2018年01月 

ISBN: 9787115458711
年中特卖用“SALE15”折扣卷全场书籍85折!可与三本88折,六本78折的优惠叠加计算!全球包邮!
trust badge

EUR €37.99

类别: 数据库 SKU:5d84b70d5f9849104541ddca 库存: 缺货
  • 描述
  • 评论( 0 )

描述

开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787115458711丛书名: ICT认证系列丛书

编辑推荐

本书则是华为公司针对华为ICT学院大数据方向的在读学生,专门组织合作伙伴和华为公司内部员工开发的标准化教材,这套教材的目的在于循序渐进地帮助华为ICT学院大数据方向的学生掌握大数据技术的基本原理与应用场景,能够在面对真实的业务场景时,独立完成大数据平台的搭建、维护及故障的处理。

 

内容简介

本书是华为ICT学院大数据技术官方教材,旨在帮助学生进一步学习大数据的基本概念、技术原理,以及大数据平台的搭建和使用。 本书从大数据的概念和特征开始讲起,首先让读者对大数据有一个感性的认识;接下来结合大数据平台的各个功能模块,详细介绍大数据的存储、处理、分析、可视化等原理和操作;对大数据在各种行业中的应用加以叙述,让读者更加充分地感受到大数据应用的价值。 除华为ICT学院的学生之外,本书同样适合正在备考HCNA-Big Data认证,或者正在参加HCNA-Big Data技术培训的学员进行阅读和参考。其他有志进入ICT行业的人员和大数据技术爱好者也可以通过阅读本书,加深自己对大数据技术的理解。

作者简介

多年的Hadoop大数据平台企业业务应用实践,具有丰富的Hadoop平台运维,开发与分析实战经验 2. 主导过多个大型大数据项目的开发,如维达国际大数据平台、中国商品进出口交易中心ETL日志分析大数据平台 3、多年大数据与数据挖掘等IT领域技术培训经验,丰富的课程设计和授课经验。

目  录

第1章 大数据概述 0

1.1 大数据的概念与价值 2

1.1.1 什么是大数据 2

1.1.2 大数据的来源 4

1.1.3 大数据有什么价值 5

1.1.4 如何挖掘企业大数据的价值 6

1.2 大数据的关键技术 7

1.2.1 大数据采集、预处理与存储管理 7

1.2.2 大数据分析与挖掘 8

1.2.3 数据可视化 9

1.3 大数据产业 9

1.3.1 数据提供 9

1.3.2 技术提供 9

1.3.3 服务提供 10

1.4 大数据应用场景 10

1.5 本章总结 11

练习题 12

第2章 Hadoop大数据处理平台 14

2.1 Hadoop平台概述 16

2.1.1 Hadoop简介 16

2.1.2 Hadoop的特性 17

2.1.3 Hadoop应用现状 17

2.1.4 Hadoop版本及相关平台 18

2.2 Hadoop生态系统 18

2.2.1 Hadoop存储系统(HDFS&HBase) 18

2.2.2 Hadoop计算框架(MapReduce&YARN) 19

2.2.3 Hadoop数据仓库(Hive) 20

2.2.4 Hadoop数据转换与日志处理(Sqoop&Flume) 20

2.2.5 Hadoop应用协调与工作流(ZooKeeper&Oozie) 20

2.2.6 大数据安全技术(Kerberos&LDAP) 21

2.2.7 大数据即时查询与搜索(Impala&Solr) 21

2.2.8 大数据消息订阅(Kafka) 21

2.3 Hadoop安装部署 22

2.3.1 Hadoop规划部署 22

2.3.2 Hadoop的安装方式 23

2.4 华为FusionInsight HD安装部署 26

2.4.1 FusionInsight HD简介 26

2.4.2 FusionInsight HD集成设计 28

2.4.3 FusionInsight HD安装部署 33

2.4.4 FusionInsight HD重要参数配置 41

2.5 本章总结 42

练习题 43

第3章 大数据存储技术(HDFS) 44

3.1 概述 46

3.1.1 分布式文件系统的概念与作用 47

3.1.2 HDFS概述 47

3.2 HDFS的相关概念 48

3.2.1 块 48

3.2.2 NameNode 49

3.2.3 Secondary NameNode 50

3.2.4 DataNode 51

3.3 HDFS体系架构与原理 52

3.3.1 HDFS体系架构 52

3.3.2 HDFS的高可用机制 52

3.3.3 HDFS的目录结构 54

3.3.4 HDFS的数据读写过程 57

3.4 HDFS接口及其在FusionInsight HD编程中的实践 58

3.4.1 HDFS常用Shell命令 59

3.4.2 HDFS的Web界面 60

3.4.3 HDFS的Java接口及应用实例 62

3.5 本章总结 67

练习题 67

第4章 大数据离线计算框架(MapReduce & YARN) 70

4.1 MapReduce技术原理 72

4.1.1 MapReduce概述 73

4.1.2 Map函数与Reduce函数 73

4.2 YARN技术原理 74

4.2.1 YARN的概述与应用 74

4.2.2 YARN的架构 75

4.2.3 MapReduce的计算过程 76

4.2.4 YARN的资源调度 78

4.3 FusionInsight HD中MapReduce的应用 78

4.3.1 WordCount实例分析 78

4.3.2 MapReduce编程实践 79

4.4 本章总结 85

练习题 86

第5章 大数据数据库(HBase) 88

5.1 HBase概述 90

5.1.1 HBase简介 90

5.1.2 HBase与关系型数据库的区别 91

5.1.3 HBase的应用场景 92

5.2 HBase的架构原理 92

5.2.1 HBase的数据模型 92

5.2.2 表和Region 93

5.2.3 HBase的系统架构与功能组件 94

5.2.4 HBase的读写流程 96

5.2.5 HBase的Compaction过程 97

5.3 FusionInsight HD中HBase的编程实践 98

5.3.1 FusionInsight HD中HBase的常用参数配置 98

5.3.2 HBase的常用Shell命令 100

5.3.3 HBase常用的Java API及应用实例 103

5.4 本章总结 118

练习题 118

第6章 大数据数据仓库(Hive) 120

6.1 Hive概述 122

6.1.1 Hive简介和应用 122

6.1.2 Hive的特性 123

6.1.3 Hive与传统数据仓库的区别 124

6.2 Hive的架构和数据存储 124

6.2.1 Hive的架构原理 124

6.2.2 Hive的数据存储模型 127

6.2.3 HiveQL编程 128

6.3 FusionInsight HD中Hive应用实践 132

6.3.1 FusionInsight HD中Hive的常用参数配置 132

6.3.2 加载数据到Hive 133

6.3.3 使用HiveQL进行数据分析 135

6.4 本章总结 139

练习题 139

第7章 大数据数据转换(Sqoop与Loader) 142

7.1 Sqoop概述 144

7.1.1 Sqoop简介与应用 145

7.1.2 Sqoop的功能与特性 145

7.1.3 Sqoop与传统ETL的区别 146

7.2 FusionInsight HD中Loader的应用实践 146

7.2.1 FusionInsight HD中Loader与Sqoop的对比 147

7.2.2 FusionInsight HD中Loader的参数配置 148

7.2.3 使用Loader进行数据转换 149

7.2.4 Loader的常用Shell命令 150

7.2.5 Loader应用实践 152

7.3 本章总结 153

练习题 154

第8章 大数据日志处理(Flume) 156

8.1 Flume概述 158

8.1.1 Flume简介与应用 158

8.1.2 Flume的功能与特性 161

8.1.3 Flume与其他主流开源日志收集系统的区别 162

8.2 FusionInsight HD中Flume的应用实践 162

8.2.1 FusionInsight HD中Flume的常用参数配置 163

8.2.2 Flume常用的Shell命令 164

8.2.3 Flume与Kafka结合进行日志处理 165

8.3 本章总结 168

练习题 169

第9章 大数据实时计算框架(Spark) 170

9.1 Spark概述 172

9.1.1 Spark的概述与应用 173

9.1.2 Scala语言介绍 174

9.1.3 Spark生态系统组件 174

9.1.4 Spark与Hadoop的对比 175

9.2 Spark技术架构 176

9.2.1 Spark的运行原理 176

9.2.2 RDD概念与原理 177

9.2.3 Spark的三种部署方式 181

9.2.4 使用开发工具测试Spark 182

9.3 FusionInsight HD中Spark应用实践 183

9.3.1 运行Spark Shell 183

9.3.2 进行Spark RDD操作 184

9.3.3 使用Spark客户端工具运行Spark程序 185

9.4 Spark Streaming 188

9.4.1 Spark Streaming的设计思想 188

9.4.2 Spark Streaming的应用实例 189

9.5 Spark SQL 191

9.5.1 Spark SQL的功能 191

9.5.2 FusionInsight HD中Spark SQL的应用实例 192

9.6 Spark MLlib 193

9.6.1 机器学习简介 193

9.6.2 Spark MLlib的功能 194

9.7 Spark GraphX 194

9.7.1 图计算简介 194

9.7.2 Spark GraphX功能简介 195

9.8 本章总结 195

练习题 196

第10章 大数据流计算 198

10.1 流计算概述 200

10.1.1 静态数据和流数据 201

10.1.2 流计算的概念 201

10.1.3 MapReduce和流计算 202

10.1.4 流计算框架 202

10.2 流计算的处理流程 203

10.2.1 数据实时采集 203

10.2.2 数据实时计算 203

10.2.3 数据实时查询 203

10.3 Streaming流计算 204

10.3.1 Streaming简介 204

10.3.2 Streaming的特点 206

10.3.3 Streaming在FusionInsight HD上的应用实践 208

10.3.4 Spark Streaming与Streaming的差异 212

10.4 本章总结 213

练习题 213

第11章 数据可视化 216

11.1 可视化概述 218

11.1.1 数据可视化简介 219

11.1.2 数据可视化的重要性 219

11.1.3 可视化的发展历程 219

11.1.4 数据可视化的过程 221

11.2 可视化工具 222

11.2.1 入门级工具(Excel) 222

11.2.2 普通工具(R语言) 222

11.2.3 高级工具(Tableau和QlikView) 223

11.3 可视化的典型应用 223

11.3.1 可视化在医学上的应用 223

11.3.2 可视化在工程中的应用 224

11.3.3 可视化在互联网的应用 225

11.4 本章总结 225

练习题 226

第12章 大数据行业应用 228

12.1 大数据在金融行业的应用 230

12.2 大数据在电信行业的应用 232

12.3 大数据在公安系统的应用 236

12.4 大数据在互联网行业的应用 237

12.5 本章总结 237

练习题 238

术语表 240

参考文献 252

抢先评论了 “大数据原理与技术” 取消回复

评论

还没有评论。

相关产品

加入购物车

大数据时代的统计学思维:让你从众多数据中找到真相 大数据时代统计学思维、大数据统计分析 数据可视化 大数据分析 数据库

EUR €43.99
评分 5.00 / 5
阅读更多
缺货

SQL必知必会(第4版)

EUR €20.99
加入购物车

MySQL技术内幕:InnoDB存储引擎(第2版)(畅销书全新升级,第1版广获好评,专家撰写,国内外数据库专家联袂推荐,基于MySQL 5.6,从存储引擎内核角度对InnoDB的核心实现和工作机制进行深入剖析)

EUR €48.99
阅读更多
缺货

数据库系统概念(原书第6版)(数据库系统方面的经典教材,被国外许多知名大学采用。决战大数据时代!IT技术人员不得不读!)

EUR €58.99

东东购的宗旨是服务喜爱阅读中文书籍的海外人民,提供一个完善的购书平台,让国人不论何时何地都能沉浸在书香之中,读着熟悉的中文字,回忆着家乡的味道。


安全加密结账 安心网络购物 支持Paypal付款

常见问题

  • 货物配送
  • 退换货政策
  • 隐私政策
  • 联盟营销

客户服务

  • 联系东东
  • 关于东东
  • 帮我找书
  • 货物追踪
  • 会员登入

订阅最新的优惠讯息和书籍资讯

选择币别

EUR
USD
CAD
AUD
NZD
NOK
GBP
CHF
SEK
CNY
UAH
ILS
SAR
MXN
KRW
MYR
SGD
HUF
TRY
JPY
HKD
TWD
facebookinstagram
©2020 东东购 EasternEast.com

限时特卖:用“SALE15”优惠券全场书籍85折!可与三本88折,六本78折的优惠叠加计算。 忽略