描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787121367069丛书名: 网络工程师教育丛书
第一章 绪论 (1)
概述 (1)
第一节 大数据的概念 (1)
何谓大数据 (2)
大数据结构类型 (6)
大数据的作用和影响 (8)
练习 (9)
第二节 大数据分析和计算 (9)
大数据分析计算的意义 (10)
大数据计算的特点 (11)
大数据计算系统架构 (12)
练习 (16)
第三节 大数据技术体系 (17)
大数据技术栈 (17)
大数据计算支撑技术 (20)
Hadoop生态系统 (28)
练习 (30)
第四节 Hadoop平台构建 (30)
Hadoop 集群配置 (30)
Hadoop的安装与运行 (32)
练习 (39)
本章小结 (39)
第二章 大数据采集和预处理 (41)
概述 (41)
第一节 大数据采集 (41)
大数据采集的基本概念 (42)
大数据采集的技术和方法 (45)
大数据采集工具的设计 (48)
练习 (50)
第二节 互联网数据采集 (51)
基于网络爬虫的数据采集 (51)
系统日志采集 (59)
日志数据采集示例 (63)
练习 (67)
第三节 大数据清洗 (68)
数据质量问题 (68)
大数据清洗的对象 (70)
大数据清洗的基本方法 (71)
日志文件数据清洗示例 (73)
练习 (75)
第四节 大数据采集和预处理工具 (76)
Apache Flume (76)
Splunk Forwarder (83)
国内常见的大数据处理软件 (84)
练习 (86)
本章小结 (86)
第三章 大数据存储与管理 (88)
概述 (88)
第一节 分布式存储系统 (89)
集中式存储 (89)
分布式存储 (90)
练习 (95)
第二节 Hadoop分布式文件系统(HDFS) (96)
HDFS的相关概念 (96)
HDFS的系统架构 (100)
HDFS的存储机制 (102)
HDFS的数据读写过程 (104)
HDFS应用编程 (106)
练习 (114)
第三节 非关系数据库(NoSQL) (115)
NoSQL概述 (115)
NoSQL的技术基础 (118)
NoSQL的数据存储类型 (120)
典型的NoSQL工具 (125)
练习 (132)
第四节 分布式数据库HBase (132)
HBase系统结构 (133)
HBase数据模型与存储 (138)
HBase数据读写 (144)
HBase应用编程 (145)
练习 (152)
本章小结 (153)
第四章 大数据分析与计算 (156)
概述 (156)
第一节 大数据分析 (156)
何谓大数据分析 (157)
大数据分析的类别 (158)
大数据分析的基本方法 (160)
练习 (166)
第二节 大数据挖掘 (167)
数据关联分析 (168)
数据聚类分析 (169)
数据分类与预测 (177)
练习 (181)
第三节 大数据处理系统(MapReduce/Spark) (182)
MapReduce (182)
Spark (191)
练习 (202)
第四节 Spark应用示例 (203)
Spark配置及运行 (203)
Spark的Scala编程 (208)
Spark的主要应用场景 (210)
练习 (211)
本章小结 (211)
第五章 大数据可视化 (214)
第一节 可视化基础知识 (214)
数据可视化 (215)
大数据可视化 (217)
大数据可视化设计 (220)
练习 (222)
第二节 可视化分析研发资源与工具 (222)
信息图表工具 (223)
时间线工具 (225)
地图工具 (226)
可视化分析研发资源与编程语言 (227)
练习 (229)
第三节 大数据可视化应用 (229)
基于Web的数据可视化 (229)
文本数据可视化 (234)
社交网络可视化 (235)
练习 (236)
本章小结 (237)
第六章 大数据应用 (239)
第一节 大数据查询 (239)
大数据查询分析引擎 (239)
基于Spark的大数据实时查询 (245)
大数据查询实例及其技术发展 (248)
练习 (249)
第二节 大数据应用与发展 (249)
大数据的社会价值 (249)
大数据应用场景 (252)
大数据应用发展趋势 (257)
练习 (259)
第三节 大数据隐私与安全 (259)
大数据应用中的安全 (260)
大数据安全技术 (261)
大数据安全与隐私保护措施 (264)
练习 (265)
本章小结 (265)
附录A 课程测验 (267)
附录B 术语表 (270)
参考文献 (278)
人类已进入互联网时代,以物联网、云计算、移动互联网和大数据为代表的新一轮信息技术革命,正在深刻地影响和改变经济社会各领域。随着信息技术的发展,网络已经融入社会生活的方方面面,与人们的日常生活密不可分。我国已成为网络大国,网民数量位居世界第一;但我国要成为网络强国,推进网络强国建设,迫切需要大量的网络工程师人才。然而据估计,我国每年网络工程师缺口约20万人,现有网络人才远远无法满足建设网络强国的需求。
为适应网络工程技术人才教育、培养的需要,电子工业出版社组织本领域专家学者和工作在一线的网络专家、工程师,按照网络工程师所应具备的知识、能力要求,参考新的网络工程师考试大纲(2018年审定通过),共同修订、编撰了这套《网络工程师教育丛书》。
本丛书全面规划了网络工程师应该掌握的技术,架构了一个比较完整的网络工程技术知识体系。丛书的编写立足于计算机网络技术的最新发展,以先进性、系统性和实用性为目标:
? 先进性——?全面地展示近年来计算机网络技术领域的新成果,做到知识内容的先进性。例如,对软件定义网络(SDN)、三网融合、IPv6、多协议标签交换(MPLS)、云计算、云存储、大数据、物联网、移动互联网等进行介绍。
? 系统性——?加强学科基础,拓宽知识面,各册内容之间密切联系、有机衔接、合理分配、重点突出,按照“网络基础→局域网→城域网与广域网→TCP/IP基础→网络互连与互联网→网络安全与管理→大数据技术→网络设计与应用”的进阶式顺序分为8册,形成系统的知识结构体系。
? 实用性——?注重工程能力的培养和知识的应用。遵循“理论知识够用,为工程技术服务”的原则,突出网络系统分析、设计、实现、管理、运行维护和安全方面的实用技术;书中配有大量网络工程案例、配置实例和实验示例,以提高读者的实践能力;每章还安排有针对性的练习和近年网络工程师考试题,并对典型试题和练习给出解答提示,以帮助读者提高应试能力。
本丛书从一开始就搭建了一个真实的、接近网络工程实际的网络,丛书各册均基于这个实例网络的拓扑和IP地址进行介绍,逐步完成对路由器、交换机、客户端和服务器的配置、应用设计等,灵活、生动地展现各种网络技术。
本丛书在编写时力求文字简洁,通俗易懂,图文并茂;在内容编排上既系统全面,又切合实际;在知识设计上层次分明、由浅入深,读者可根据自己的需要选择相应的图书进行学习,然后逐步进阶。
鉴于网络技术仍在不断地飞速发展,本丛书将根据需要和读者要求适时更新、完善。热忱欢迎广大读者多提宝贵意见和建议。联系方式:[email protected]。
电子工业出版社
前 言
人类信息社会正在从IT(Information Technology)时代快步进入DT(Data Technology)时代,数据科学与大数据技术以惊人的速度迅猛发展。以大数据为核心研究对象,利用大数据的方法解决具体行业应用问题,成为DT时代的核心。数据科学与大数据技术属于新兴的交叉学科,它以统计学、数学、计算机为三大支撑性学科,以生物、医学、环境科学、经济学、社会学、管理学等为应用拓展性学科,由此构架自己的学科领域;其知识体系涵盖了数据采集、分析、处理、数据挖掘算法、计算机编程语言,以及相关软件开发应用等。大数据作为继云计算、物联网之后IT 行业的又一颠覆性技术,备受人们的关注和青睐。
随着大数据时代的到来,社会急需大批数据科学与大数据技术专业人才。本书编写的目的,就是为培养运用大数据思维洞见数据价值的技术人才提供大数据技术入门指导,为读者架起一座通向“大数据知识空间”的桥梁。在内容取舍上,本书秉承凝练大数据技术的宗旨,着重阐释大数据的基本概念、原理、大数据分析计算及其应用技术,搭建起知识框架,以便形成对大数据知识体系及其应用领域的概括性认识,为读者在大数据领域的继续“深耕细作”奠定基础。
本书紧紧围绕“构建知识体系、阐释工作原理、引导实践应用”的指导思想,对大数据知识体系进行系统梳理,做到面向应用、有序组织,结构合理、层次清楚,并借助可视化图表深入剖析大数据技术及其应用。全书内容分为6章,包括绪论、大数据采集和预处理、大数据存储与管理、大数据分析与计算、大数据可视化和大数据应用,每章配有练习、本章小结及小测验,以便于理解掌握重要知识点。
本书可为数据科学与大数据技术、计算机网络和通信领域的教学、科研和工程设计提供参考,适用范围较广;既可以用作数据科学与大数据技术专业教材、网络工程师教育培训,或者作为本科和高职院校相关课程的教材或参考书,也可供大数据技术、网络技术人员和管理人员以及网络爱好者阅读参考。
本书由刘化君、吴海涛、毛其林、顾洪、刘枫编著。其中,刘化君执笔编写第1章并负责全书的修改定稿,吴海涛执笔编写第4章及第5章部分初稿并负责全书内容的审定,毛其林执笔编写第2、3章及第6章第3节初稿,顾洪编写第5、6章部分初稿,刘枫执笔编写其余章节有关内容。在编写过程中,得到了许多同志的支持和帮助,参考了大量国内外的教材、专著、论文以及互联网文献资料,在此一并表示衷心感谢!
由于数据科学与大数据技术、计算机网络技术发展很快,囿于作者理论水平和实践经验,书中可能存在不妥之处,恳请广大读者不吝赐教,以便再版时予以订正。
编著者
2019年1月8日
评论
还没有评论。