描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787111557012丛书名: 大数据技术丛书
内容简介
本书第1章介绍ApacheKylin的历史、技术原理和产品定位,帮助用户了解何时和为何使用Kylin。第2章通过一个具体的案例快速入门,讲解Kylin核心概念、Cube建模和SQL连接查询这些基本使用。第3、4章讲解增量构建和进一步的流式构建,是大多数案例典型配置。第5、6章是针对查询和可视化、Cube调优的两个专门章节,适合较高级的用户。第7章是一系列有行业特点的具体案例分析,贯穿之前的所有概念。第8、9章讲ApacheKylin的扩展和企业级高级功能,技术性较强,会有较多的代码示例。第10章讲运维管理,从安装配置、监控维护到常见的问题和修复。全书后两章谈ApacheKylin开源社区和项目发展规划。
目 录
推荐序推荐序二推荐序三推荐序四前言第1章Apache Kylin概述1.1背景和历史1.2ApacheKyin的使命1.3 ApacheKylin的工作原理1.3.1维度和度量简介1.3.2 Cube和Cuboid1.3.3工作原理 。1.4 ApacheKylin的技术架构1.5 ApacheKylin的主要特点1.5.1标准SQL接口1.5.2支持超大数据集1.5.3亚秒级响应1.5.4可伸缩性和高吞吐率1.5.5 BI及可视化工具集成1.6与其他开源产品比较1.7小结第2章快速入门2.1核心概念2.1.1数据仓库、OLAP与BI2.1.2维度和度量2.1.3事实表和维度表2.1.4 Cube、Cuboid和Cube Segment2.2在Hive中准备数据2.2.1星形模型2.2.2维度表的设计2.2.3 Hive表分区2.2.4了解维度的基数2.2.5 SampleData2.3设计Cube2.3.1导入Hive表定义2.3.2创建数据模型2.3.3创建CubP 2.4构建Cube第3章增量构建第4章流式构建第5章查询和可视化第6章Cube优化第7章应用案例分析第8章扩展Apache Kyin第9章Apache Kyin的企业级功能第10章运维管理第11章参与开源第12章Apache Kyin的未来
前 言
“麒麟出没,必有祥瑞。” ——中国古谚语“于我而言,与Apache Kylin团队一起合作使Kylin通过孵化成为项目是非常激动人心的,诚然,Kylin在技术方面非常振奋人心,但同样令人兴奋的是Kylin代表了亚洲国家,特别是中国,在开源社区中越来越高的参与度。” -Ted Dunning Apache孵化项目副总裁,MapR首席应用架构师今天,随着移动互联网、物联网、AI等技术的快速兴起,数据成为了所有这些技术背后重要,也是有价值的“资产”。如何从数据中获得有价值的信息?这个问题驱动了相关技术的发展,从初的基于文件的检索、分析程序,到数据仓库理念的诞生,再到基于数据库的商业智能分析。而现在,这一问题已经变成了如何从海量的超大规模数据中快速获取有价值的信息,新的时代、新的挑战、新的技术必然应运而生。 在数据分析领域,大部分的技术都诞生在国外,特别是美国,从初的数据库,到以Hadoop为首的大数据技术,再到今天各种DL( Deep Learning)、AI,等等。但我国拥有着世界上独一无二的“大”数据,多的人口、多的移动设备、活跃的应用市场、复杂的网络环境等,应对这些挑战,我们需要有自己的核心技术,特别是在基础领域的突破和研发方面。今天,以Apache Kylin为首的各种来自中国的先进技术不断涌现,甚至在很多方面都大大超越了国外的其他技术,这一点也彰显了中国的技术实力。 自Hadoop选取大象伊始,上百个项目,以动物居之者为多,而其中唯有Apache Kylin(麒麟)来自中国,在众多项目中分外突出。在全球的开源基金会-Apache软件基金会(Apache Software Foundation,ASF)的1 60多个项目中,Apache Kylin是一个来自中国的开源项目,与Apache Hadoop、Apache Spark、Apache Kafka、Apache Tomcat、?Apache Struts、Apache Maven等项目一起以The Apache Way构建了开源大数据领域的国际社区,并拓展了生态系统。 大数据与传统技术的区别就在于数据的体量对查询带来的巨大挑战。从早使用大数据技术来做批量处理,到现在越来越多地需要大数据平台也能够如传统数据仓库技术一样支持交互式分析。随着数据量的不断膨胀,数据平民化的不断推进,低延迟、高并发地在Hadoop之上提供标准SQL查询的能力成为必须要攻破的技术难题。而Apache Kylin的诞生正是基于这个背景,并成功地完成了很多人认为不可能实现的突破。Apache Kylin初诞生于eBay中国研发中心(坐落于上海浦东新区的德国中心),在2013年9月底,eBay中国研发中心的技术人员开始对此进行POC并组建团队,经过一年的艰苦开发和测试,于2014年9月30日使其正式上线,并在第二天(2014年10月1日)正式开源。 在这个过程中,使用何种技术,如何进行架构,如何突破那些看似无法完成的挑战,整个开发团队和用户一起经历了一段艰难的历程。今天呈现出的Apache Kylin已经经历了上千亿乃至上万亿规模数据量的分析请求,以及上百家公司的实际生产环境的检验,成为各个公司大数据分析平台不可替代的重要部分。本书将从Apache Kylin的架构和设计、各个模块的使用、与第三方的整合、二次开发及开源实践等方面进行讲解,为各位读者呈现核心的设计理念和哲学、算法和技术等。 Apache Kylin社区的发展不易,自2014年10月开源到今天已有两年,从初的几个人发展到今天的几十个贡献者,国内外上百家公司在正式使用,连续两年获得InfoWorld BossieAwards开源大数据工具奖。来自核心团队、贡献者、用户、导师、基金会等的帮助和无私的奉献铸就了这个活跃的社区,也使得Apache Kylin得以在越来越多的场景下发挥作用。 现在,由Apache Kylin核心团队撰写了本书,相信能更好地将相关的理论、设计、技术、架构等展现给各位朋友,希望能够让更多的朋友更加充分地理解Kylin的优点和使用的场景,更多地挖掘出Kylin的潜力。同时也希望本书能够鼓励并吸引更多的人参与Kylin项目和开源项目,影响更多人贡献更多的项目和技术到开源世界来。 韩卿Apache Kylin联合创建者及项目委员会主席2016年10月
评论
还没有评论。