描述
开 本: 16开纸 张: 轻型纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787121351129
自2015年以来,“大数据时代”已成为最热门的名词之一。大数据在企业决策中扮演着越来越重要的角色,各个行业都不约而同地提出了大数据的口号,与大数据相关的新名词、新产品不断涌现,“统计分析和数据挖掘”跻身最受欢迎的求职技能行列,数据分析师的薪酬待遇也远远超过平均薪资水平。与数据分析技能之火爆相对应的是数据分析人才的缺失。麦肯锡公司的研究报告表明,截至2018年,全球面临150万数据分析人才方面的缺口。这意味着,有150万的其他行业从业人员将有可能把握住机会,转型为令人艳羡的数据分析师。
全面的数据改革迫在眉睫,但如何真正落实大数据的应用,仍然是一个富于争议的话题。数据分析行业内部面临着相同的困境,在大数据时代,新的数据分析方法层出不穷,原有的数据分析方法也在不断完善,这些都导致数据分析师这一工作发生了令人措手不及的变化。为了帮助新的从业人员尽快熟悉数据分析这一工作,以及帮助原有的数据分析师尽快完成转型,本书精心选择了32个流行的数据分析算法,并佐以案例,供大家了解大数据时代下数据分析行业的最新动态。
?本书特色
1. 条理清晰,内容翔实,全面介绍了大数据时代下的数据分析算法体系
数据分析处于统计学、人工智能、模式识别、机器学习等多个领域的交叉处。本书分为8章,每章都有独立的主题,涵盖了数据分析所涉及的大部分学科。同时,本书不同章之间存在紧密的关联,揭示了不同学科之间的异同,以及它们是如何丰富数据分析的内涵并影响数据分析学科发展的轨迹的。通过阅读本书,读者将站在制高点,一览大数据时代下不同数据分析算法是如何彼此关联而构成完整体系的。
2.语言通俗易懂,内容由易到难,适合各层次的读者学习
本书语言诙谐有趣,对每个数学公式都不厌其烦地举例讲解,即使毫无高等数学基础的读者也能够读懂本书所讲解的内容。同时,本书严格按照由易到难的学习规律编写,从较为简单的经典数据分析方法写起,逐渐过渡到较为晦涩的模式识别、机器学习等内容,通过阅读本书,读者将从一个“数据分析小白”迅速进阶为基础扎实、能独当一面的数据分析师。本书的内容涵盖了每个算法的原理、公式、适用场景和优缺点。无论是数据分析菜鸟,还是有一定经验的数据分析师,本书都能够帮助你拓展、加深对数据分析的认识。
3.案例丰富精彩,应用贴近实际,满足读者的多重需求
本书为每个算法都配备了一个精心选择(兼顾时效性)的商业案例,这些案例横跨十几个行业,将大数据时代为人称道的经典案例一网打尽,满足了读者的三大需求:首先,结合案例能将算法讲解得更加清楚,加深读者对算法的认识;其次,这些案例展示了数据分析在各行各业的最新应用,读者能够通过它们切实感受到数据分析的魅力,激发读者学习数据分析的热情;最后,这些案例涉及多个领域,不仅能够迎合从事不同领域工作的读者的口味,也能够让读者了解数据分析在不同领域的现状,从而帮助读者选择进一步深入学习的方向。
?第2版说明
第2版在第1版的基础上,对每章的综述部分内容进行了扩充,增加了诸如现实进展、应用初窥、算法类型介绍、技术发展历程等内容。以便读者能够更加充分地了解这些算法及其落地应用的前世今生,清晰地把握算法是如何提出的、如何迭代的,以及如何应用在解决实际问题当中。此外,为了保证本书的时效性。第2版还修正和补充了一些新的案例和数据,添加了2015—2018年数据挖掘/数据分析领域中的一些新的进展和新的成果。这些努力的目的都是力图使本书变得更加丰富和形象化,引起读者对数据挖掘和数据分析相关方面的兴趣。此外,鉴于作者水平有限,可能存在谬误之处,希望您在阅读本书之时,带有一些批判的眼光,给予指正和批评。
?本书内容及体系结构
第1章 经典的探索性数据分析案例
本章介绍了4种最基本的数据分析方法,分别是数据收集、数据可视化、异常值分析和对比分析。通过学习这4种数据分析方法,读者将对数据分析师的工作内容有一个初步的了解,使读者能够完成初级的数据分析任务。
第2章 经典的相关分析与回归分析案例
本章的主题是相关分析和回归分析。这两种分析方法经典、古老而有效,至今仍被广泛应用。其中,相关分析能够为回归分析做准备,回归分析又从侧面验证了相关分析结果的正确性。本章涉及1种最常见的相关分析方法和3种最常见的回归分析方法,通过阅读本章,读者将获得解决小数据样本下的一大类数据分析问题的能力。
第3章 经典的降维数据分析案例
本章介绍了粗糙集算法、因子分析、最优尺度分析、PCA降维算法等4种降维算法。本章是小数据分析和大数据分析交界的一章,这4种降维算法既可以为小数据分析服务,也可以为大数据分析服务。本章展示了降维分析与相关分析、回归分析的关联,加深了读者对小数据分析的理解,并为读者打开了大数据分析的大门。
第4章 经典的模式识别案例
本章感兴趣的问题是模式识别问题。模式识别算法研究的是如何让机器像人一样认识世界,它运用了较多的数学知识,并借助编程方法来实现。图像分析、遗传算法、决策树、K均值是本章关心的主题,本章选取了与数据分析关系最密切的案例,旨在使读者了解模式识别与数据分析的区别与联系。
第5章 经典的机器学习案例
本章关心的内容是机器学习,机器学习学科致力于让机器拥有和人类一样的思考能力。通过阅读本章的语义搜索、顺序分析、文本分析、协同过滤4个算法,读者将发现机器学习更多的是从机器的角度来思考问题,这要求读者拥有更深入的编程思维方式,以便于更好地实现机器学习算法。
第6章 经典的深度学习案例
本章是对上一章的延伸,介绍了支持向量机、两种神经网络和RBM算法。深度学习是一个很大的命题,本章仅选取了与数据分析最相关的部分。另外,除向读者介绍4种深度学习算法以外,还向读者指明了机器学习未来的发展方向,这将同样影响到数据分析未来的发展。
第7章 经典的数据挖掘案例
本章介绍了判别分析、购物篮分析、马尔可夫链、AdaBoost元4种算法,实质上是对以上6章的查漏补缺。大数据时代加速了各个学科的融合,数据科学家借鉴了不同学科知识后创造出的数据分析算法也就具有了多种学科的特质。本章将这些“混血”算法集合起来,向读者展示了数据分析最多变的一面。
第8章 经典的商业智能分析案例
本章是对数据分析的升华和总结,在真正的数据分析项目中,数据分析师总是会运用多种数据分析方法来构建模型,本章所介绍的案例就是这样运用多种方法构建模型的例子。同时,本章还进一步辨析了数据分析和数据挖掘的异同,并隐含了作者对所有读者的寄语,读完本章后,读者就能对大数据时代下的数据分析有一个全面深入的认识了。
?本书读者对象
? 刚刚入行的数据分析人员;
? 统计学、管理学、金融学、计算机技术与科学等专业的学生;
? 想要提高数据分析能力的数据分析师;
? 希望转行做数据分析的从业人员;
? 想要增加对数据分析的了解的主管人员;
? 其他对数据分析感兴趣的读者。
评论
还没有评论。