Name: 深入浅出数据科学
SKU: 5c23ac11421aa985877aa25a
Price: 43.99 EUR
Availability: InStock

描述

开本: 16开纸张: 胶版纸包装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787115481269

编辑推荐

《深入浅出数据科学》的目的是帮助你掌握数学、编程和商业分析的综合技能。通过本书，你将能够自信地提出并解答复杂的数据问题，从抽象和原始的统计信息发掘并完善可执行的想法。通过将数学和计算机编程技能相结合，你将踏上成为数据科学家的激动人心的旅程。本书介绍了数据科学的全过程，包括数据准备、数据清洗，以及如何选择有效的数据挖掘策略和技巧，从而深入理解数据科学的方方面面。你将学到数学和统计学的核心知识，以及数据科学家和分析师经常使用的代码。你将了解机器学习，学会用常见的统计学模型分析稠密数据集，创建有说服力的可视化图表，并和他人交流分析结果。从本书你将学习到： ·理解数据科学的五个核心步骤 ·聪明地使用你的数据，仔细地处理它 ·填平数学和计算机编程之间的鸿沟 ·学会概率论、微积分，以及使用统计模型处理数据，得出切实有效的结果 ·生成并评估简单的机器学习模型 ·通过分析模型有效性指标，决定机器学习模型的质量 ·通过数据可视化向他人分享见解 ·理解机器学习模型，并使用机器学习模型进行预测，解决自己的问题

内容简介

数据科学家是目前热门的职业之一。本书全面介绍了成为合格数据科学家所需的知识、技能和工作流程，是一本内容全面的实用性技术图书。本书分为13章，其中第1～3章介绍数据科学；第4～8章介绍数学知识，包括统计学和概率论；第9章介绍数据可视化；第10～12章介绍机器学习；第13章介绍案例。各个章节内容均由浅入深，同时通过案例和Python代码，使读者掌握实战技能。本书适合有志于成为数据科学家的师生或业界新手，同时也适合经验丰富的职场老手参考。

作者简介

作者简介 Sinan Ozdemir是一名数据科学家、创业者和教育工作者。Sinan的学术生涯在约翰?霍普金斯大学（The Johns Hopkins University）渡过，主修数学专业。随后他从事教育事业，曾经在约翰?霍普金斯大学和General Assembly公司举办多次数据科学讲座。在此之后，他创立了旨在通过人工智能技术和数据科学力量帮助企业销售团队的创业公司Legion Analytics。译者简介张星辰，北京荣之联科技股份有限公司BI 技术顾问，毕业于重庆邮电大学，具有5年数据相关工作经验，熟悉商业智能和数据可视化，通过了微软数据科学专业认证。中文版审校人鲜思东，重庆邮电大学教授，硕士生导师，复杂系统智能分析与决策重庆市高校重点实验室副主任，中国商业统计学会理事。现任国际期刊《Advancements in Case Studies》编辑，担任《Knowledge-Based Systems》和《IEEE Transactions on Systems、Man and Cybernetics: Systems》等多个国际期刊的审稿人。洪贤斌，西交利物浦大学、英国利物浦大学机器学习方向博士生，苏州谷歌开fa者社区组织者。

目　　录

第 1章如何听起来像数据科学家 1

1.1　什么是数据科学　3

1.1.1　基本的专业术语　3

1.1.2　为什么是数据科学　4

1.1.3　案例：西格玛科技公司　4

1.2　数据科学韦恩图　5

1.2.1　数学　7

1.2.2　计算机编程　8

1.2.3　为什么是Python　9

1.2.4　领域知识　13

1.3　更多的专业术语　14

1.4　数据科学案例　15

1.4.1　案例：自动审核政府文件　16

1.4.2　案例：市场营销费用　17

1.4.3　案例：数据科学家的岗位描述　18

1.5　总结　21

第　2章数据的类型　23

2.1　数据的“味道”　23

2.2　为什么要进行区分　24

2.3　结构化数据和非结构化数据　24

2.4　定量数据和定性数据　28

2.4.1　案例：咖啡店数据　28

2.4.2　案例：世界酒精消费量　30

2.4.3　更深入的研究　32

2.5　简单小结　33

2.6　数据的4个尺度　33

2.6.1　定类尺度　34

2.6.2　定序尺度　35

2.6.3　定距尺度　37

2.6.4　定比尺度　41

2.7　数据是旁观者的眼睛　42

2.8　总结　43

第3章　数据科学的5个步骤　44

3.1　数据科学简介　44

3.2　5个步骤概览　45

3.2.1　提出有意思的问题　45

3.2.2　获取数据　45

3.2.3　探索数据　45

3.2.4　数据建模　46

3.2.5　可视化和分享结果　46

3.3　探索数据　46

3.3.1　数据探索的基本问题　47

3.3.2　数据集1：Yelp点评数据　48

3.3.3　数据集2：泰坦尼克　56

3.4　总结　60

第4章　基本的数学知识　61

4.1　数学学科　61

4.2　基本的数学符号和术语　62

4.2.1　向量和矩阵　62

4.2.2　算术符号　65

4.2.3　图表　68

4.2.4　指数/对数　69

4.2.5　集合论　71

4.3　线性代数　74

4.4　总结　78

第5章　概率论入门：不可能，还是不太可能　79

5.1　基本的定义　79

5.2　概率　80

5.3　贝叶斯VS频率论　81

5.4　复合事件　84

5.5　条件概率　86

5.6　概率定理　87

5.6.1　加法定理　87

5.6.2　互斥性　88

5.6.3　乘法定理　88

5.6.4　独立性　89

5.6.5　互补事件　89

5.7　再进一步　91

5.8　总结　92

第6章　高等概率论　93

6.1　互补事件　93

6.2　重温贝叶斯思想　94

6.2.1　贝叶斯定理　94

6.2.2　贝叶斯定理的更多应用　97

6.3　随机变量　100

6.3.1　离散型随机变量　101

6.3.2　连续型随机变量　110

6.4　总结　113

第7章　统计学入门　114

7.1　什么是统计学　114

7.2　如何获取数据　115

7.3　数据抽样　118

7.3.1　概率抽样　118

7.3.2　随机抽样　119

7.3.3　不等概率抽样　120

7.4　如何描述统计量　120

7.4.1　测度中心　120

7.4.2　变异测度　121

7.4.3　变异系数　125

7.4.4　相对位置测度　126

7.5　经验法则　132

7.6　总结　134

第8章　高等统计学　135

8.1　点估计　135

8.2　抽样分布　139

8.3　置信区间　142

8.4　假设检验　145

8.4.1　实施假设检验　146

8.4.2　单样本t检验　147

8.4.3　I型错误和II型错误　151

8.4.4　分类变量的假设检验　151

8.5　总结　155

第9章　交流数据　156

9.1　为什么交流数据很重要　156

9.2　识别有效和无效的可视化　157

9.2.1　散点图　157

9.2.2　折线图　159

9.2.3　条形图　160

9.2.4　直方图　162

9.2.5　箱形图　163

9.3　当图表和统计在说谎　166

9.3.1　相关性VS因果关系　166

9.3.2　辛普森悖论　168

9.3.3　如果相关性不等于因果关系，那什么导致了因果关系　169

9.4　语言交流　170

9.4.1　关键在于讲故事　170

9.4.2　正式场合的注意事项　170

9.5　为什么演示、如何演示和演示策略　171

9.6　总结　172

第　10章机器学习精要：你的烤箱在学习吗　173

10.1　什么是机器学习　173

10.2　机器学习并不完美　175

10.3　机器学习如何工作　176

10.4　机器学习的分类　176

10.4.1　监督学习　177

10.4.2　无监督学习　182

10.4.3　强化学习　183

10.5　统计模型如何纳入以上分类　186

10.6　线性回归　186

10.6.1　增加更多预测因子　191

10.6.2　回归指标　193

10.7　Logistic回归　199

10.8　概率、几率和对数几率　201

10.9　哑变量　206

10.10　总结　210

第　11章树上无预言，真的吗　212

11.1　朴素贝叶斯分类　212

11.2　决策树　220

11.2.1　计算机如何生成回归树　221

11.2.2　计算机如何拟合分类树　222

11.3　无监督学习　226

11.3.1　无监督学习的使用场景　226

11.3.2　K均值聚类　227

11.3.3　如何选择的K值，并对簇进行评价　233

11.4　特征提取和主成分分析　235

11.5　总结　246

第　12章超越精要　247

12.1　偏差-方差权衡　247

12.1.1　偏差导致的误差　248

12.1.2　方差导致的误差　248

12.1.3　两种的偏差-方差权衡情况　255

12.1.4　偏差-方差如何组成误差函数　256

12.2　K层交叉验证　257

12.3　网格搜索算法　261

12.4　集成技术　266

12.4.1　随机森林　268

12.4.2　随机森林VS决策树　273

12.5　神经网络　274

12.6　总结　279

第　13章案例　280

13.1　案例1：基于社交媒体预测股票价格　280

13.1.1　文本情感分析　280

13.1.2　探索性数据分析　281

13.1.3　超越案例　294

13.2　案例2：为什么有些人会对配偶撒谎　295

13.3　案例3：初试TensorFlow　301

13.4　总结　311

媒体评论

这是一本集数据思维、基础数学理论、数据科学方法论、主流机器学习技术、数据交流与可视化、应用案例和实操代码于一体的数据科学百宝书，既适合初学者由浅入深地从初学到登堂入室，也适合老鸟系统化地梳理知识结构、查缺补漏。一个数据科学家所需的技能是商业洞见、数据模型思维和工程能力三位一体的结合，这一点在本书中有体现。 ——重庆农村商业银行，金融创新部大数据中心总监，孙光辉本书详细地解读了“数据科学”背后的概率论、统计学原理，这不仅对理解时下火热的“人工智能”等领域有直接帮助，而且对各行各业的从业者

抢先评论了 “深入浅出数据科学” 取消回复

还没有评论。

深入浅出数据科学

数据科学百宝书数据科学入门的概念手册和实用手册让数据科学的学习有趣又自然集数据思维、概率统计基础、主流机器学习技术、应用案例和实操Python代码于一体

作者:[美] 斯楠·奥兹德米尔（Sinan Ozdemir）出版社:人民邮电出版社出版时间:2018年10月

ISBN: 9787115481269

年中特卖用“SALE15”折扣卷全场书籍85折！可与三本88折，六本78折的优惠叠加计算！全球包邮!

描述

抢先评论了 “深入浅出数据科学” 取消回复

评论

深入浅出数据科学

数据科学百宝书 数据科学入门的概念手册和实用手册 让数据科学的学习有趣又自然 集数据思维、概率统计基础、主流机器学习技术、应用案例和实操Python代码于一体

作者:[美] 斯楠·奥兹德米尔（Sinan Ozdemir） 出版社:人民邮电出版社 出版时间:2018年10月

ISBN: 9787115481269

年中特卖用“SALE15”折扣卷全场书籍85折！可与三本88折，六本78折的优惠叠加计算！全球包邮!

描述

抢先评论了 “深入浅出数据科学” 取消回复

评论

相关产品

数据结构与算法：Python语言描述

基于Python的大数据分析基础及实战

数据结构教程（C#语言描述）（高等学校数据结构课程系列教材）

SQL必知必会(第4版)

数据科学百宝书数据科学入门的概念手册和实用手册让数据科学的学习有趣又自然集数据思维、概率统计基础、主流机器学习技术、应用案例和实操Python代码于一体

作者:[美] 斯楠·奥兹德米尔（Sinan Ozdemir）出版社:人民邮电出版社出版时间:2018年10月