描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787121364587
《谁说菜鸟不会数据分析》系列自面世以来赢得众多有分量的行业奖项,影响几十万读者
Python篇系“小蚊子数据分析”团队精心打磨的又一力作
沈浩教授、《数据化管理》作者黄成明、《统计之美》作者李舰博士、张文彤博士、“路人甲TM”等专家力荐
《谁说菜鸟不会数据分析(Python篇)》从解决工作实际问题出发,提炼总结工作中Python 常用的数据处理、数据分析实战方法与技巧。本书力求通俗易懂地介绍相关知识,在不影响学习理解的前提下,尽可能地避免使用晦涩难懂的Python
编程、统计术语或模型公式。
《谁说菜鸟不会数据分析(Python篇)》定位是带领Python 数据分析初学者入门,并能解决学习、工作中大部分的问题或需求。入门后如还需要进一步进阶学习,可自行扩展阅读相关书籍或资料,学习是永无止境的,正所谓“师傅领进门,修行在个人”。
第1 章 数据分析概况 /1
1.1 数据分析定义(What) /2
1.2 数据分析作用(Why) /4
1.3 数据分析步骤(How) /5
1.3.1 明确分析目的和思路 /6
1.3.2 数据收集 /7
1.3.3 数据处理 /9
1.3.4 数据分析 /9
1.3.5 数据展现 /10
1.3.6 报告撰写 /10
1.4 数据分析的三大误区 /12
1.5 常用的数据分析工具 /13
1.5.1 Excel /13
1.5.2 SPSS /14
1.5.3 R语言 /15
1.5.4 Python语言 /16
第2 章 Python 概况 /17
2.1 Python简介 /18
2.2 Python特点 /19
2.3 Python模块 /20
2.3.1 函数 /20
2.3.2 模块 /24
2.4 Python使用场景 /27
2.5 Python 2与Python
3 /28
2.6 Python与数据科学 /29
2.7 Anaconda简介 /30
2.8 安装Anaconda /31
2.8.1 下载Anaconda /31
2.8.2 安装Anaconda /33
2.9 使用Anaconda /37
2.9.1 PyCharm 与Spyder
/37
2.9.2 Anaconda 开始菜单 /38
2.9.3 Spyder 工作界面简介 /39
2.9.4 项目管理 /40
2.9.5 代码提示 /43
2.9.6 变量浏览 /44
2.9.7 图形查看 /44
2.9.8 帮助文档 /45
第3 章 编程基础 /47
3.1 数据类型 /48
3.1.1 数值型 /48
3.1.2 字符型 /50
3.1.3 逻辑型 /56
3.2 赋值和变量 /57
3.2.1 赋值和变量 /57
3.2.2 变量命名规则 /58
3.3 数据结构 /59
3.3.1 列表 /59
3.3.2 字典 /63
3.3.3 序列 /66
3.3.4 数据框 /72
3.3.5 四种数据结构的区别 /80
3.4 向量化运算 /81
3.5 for 循环 /83
3.6 Python 编程注意事项 /87
第4 章 数据处理 /90
4.1 数据导入与导出 /91
4.1.1 数据导入 /91
4.1.2 数据导出 /99
4.2 数据清洗 /100
4.2.1 数据排序 /101
4.2.2 重复数据处理 /102
4.2.3 缺失数据处理 /106
4.2.4 空格数据处理 /109
4.3 数据转换 /110
4.3.1 数值转字符 /110
4.3.2 字符转数值 /112
4.3.3 字符转时间 /113
4.4 数据抽取 /115
4.4.1 字段拆分 /116
4.4.2 记录抽取 /121
4.4.3 随机抽样 /127
4.5 数据合并 /130
4.5.1 记录合并 /130
4.5.2 字段合并 /133
4.5.3 字段匹配 /135
4.6 数据计算 /140
4.6.1 简单计算 /140
4.6.2 时间计算 /141
4.6.3 数据标准化 /142
4.6.4 数据分组 /144
第5 章 数据分析 /148
5.1 对比分析 /149
5.2 基本统计分析 /152
5.3 分组分析 /155
5.4 结构分析 /158
5.5 分布分析 /159
5.6 交叉分析 /162
5.7 RFM 分析 /164
5.8 矩阵分析 /173
5.9 相关分析 /176
5.10 回归分析 /178
5.10.1 回归分析简介 /178
5.10.2 简单线性回归分析 /180
5.10.3 多重线性回归分析 /185
第6 章 数据可视化 /189
6.1 数据可视化简介 /190
6.1.1 什么是数据可视化 /190
6.1.2 数据可视化常用图表 /190
6.1.3 通过关系选择图表 /191
6.2 散点图 /192
6.3 矩阵图 /203
6.4 折线图 /210
6.5 饼图 /215
6.6 柱形图 /217
6.7 条形图 /222
《谁说菜鸟不会数据分析》系列图书自上市以来,已拥有数十万读者与粉丝,口口相传,成为职场人士案头必备的参考用书。同时非常荣幸地获得书刊发行业协会授予的“全行业优秀畅销品种”称号,这离不开广大读者的厚爱与支持。有读者告诉我们,每次阅读都会有新的体会与收获,这让我们很开心。
随着云计算、互联网、电子商务和物联网的飞速发展,世界已经逐步迈入大数据时代。数据分析、机器学习等数据科学技术也相应流行起来,主流的数据科学技术,都将Python 作为主要的计算工具。Python 越来越被大家熟悉和认可,成为数据分析师的新宠儿,特别是在互联网行业。
市面上Python 数据分析的相关书籍基本上多数由IT 人员编写,写作角度相对侧重技术层面,很多基础知识点和编写的代码并无详细介绍,并且在数据分析思维体系方面相对薄弱,学习门槛非常高,让非IT 专业朋友学起来较为痛苦。
鉴于此,本书作者于2015 年开始提炼总结工作中Python 常用的数据处理、数据分析实战方法与技巧,并录制成了视频课程《Python 数据分析实战》,发布于网易云课堂。课程上线后,受到了大量学员的支持与肯定。同时,课程上线后,根据热心学员的宝贵反馈意见,对课程不断进行升级更新。
通过《Python 数据分析实战》视频课程的录制、升级过程中,沉淀了大量的Python 数据分析实战教学经验。同时大量的学员与读者不断来信咨询希望早日出版《谁说菜鸟不会数据分析(Python篇)》。经过两年时间的打磨,这本书终于与读者见面了。
整个写作过程是艰辛的,但是也很有成就感。
本书从解决工作实际问题出发,提炼总结工作中Python 常用的数据处理、数据分析实战方法与技巧。本书与其他《谁说菜鸟不会数据分析》系列图书一样,力求通俗易懂地介绍相关知识,在不影响学习理解的前提下,尽可能地避免使用晦涩难懂的Python 编程、统计术语或模型公式,如需了解相关的知识,可查阅相关的书籍或资料。
本书的定位是带领Python数据分析初学者入门,并能解决学习、工作中大部分的问题或需求。入门后如还需进一步进阶学习,可自行扩展阅读相关书籍或资料,学习是永无止境的,正所谓“师傅领进门,修行在个人”。
本书结构
本书以数据分析主要流程为主线,介绍如何用Python 进行数据分析。
第1 章 数据分析概况:主要通过3W 模型介绍数据分析相关知识,让读者了解与认识数据分析。
第2 章 Python 概况: 主要介绍了什么是Python,Python 的特点,Python 的函数与模块,Python 的使用场景,以及Anaconda
的安装与使用,让读者了解与认识Python。
第3 章 编程基础:主要介绍了Python 进行数据分析所需要的编程基础,包括数据类型、赋值和变量、数据结构、向量化运算、for 循环,让读者对Python 在数据分析方面的使用有基本的了解与认识。
第4 章 数据处理:主要介绍了在Python 中如何使用Pandas 进行数据处理操作,包括数据导入与导出、数据清洗、数据转换、数据抽取、数据合并、数据计算,让读者能够使用Python 进行常用的数据处理操作。
第5 章 数据分析:主要介绍了在Python 中如何使用Pandas、sklearn 进行相关的数据分析操作,包括描述统计分析、分组分析、结构分析、分布分析、交叉分析、RFM 分析、矩阵分析、相关分析、回归分析等常用分析方法,让读者能够使用Python进行常用的数据分析操作。
第6 章 数据可视化:主要介绍了在Python 中如何使用matplotlib.pyplot 进行常用的数据可视化图形绘制,包括散点图、矩阵图、折线图、饼图、柱形图、条形图,让读者能够使用Python 进行常用的数据可视化图形绘制。
本书主要基于Python 3 进行介绍,故部分方法可能在Python 2 中无法实现。
适合人群
★ 需要提升自身竞争力的职场新人。
★ 从事咨询、研究、分析等专业人士。
★ 在市场营销、产品运营、项目管理、开发运维等工作中需要进行数据分析的
人士。
案例数据下载
本书配套案例数据下载方式:
(1)扫码关注微信订阅号:小蚊子数据分析(wzdata),回复“1”或“Python篇”获取案例数据下载链接
(2)http://blog.sina.com.cn/xiaowenzi22
致谢
感谢广大读者与学员的支持,让笔者下定决心写这本书。在此要衷心感谢成都道然科技有限责任公司的姚新军先生,感谢他的提议和在写作过程中的支持。感谢参与本书优化的朋友:王斌、李伟、范霈璐、李萍、王晓、景小艳、余松。非常感谢本书的插画师朴提的辛苦劳动,您的作品也让本书增色不少。
感谢沈浩、张文彤、路人甲、黄成明、阿橙、许树淮、肖骁、严婷、刘志军、崔庆才、齐德胜、数据小人、郑来轶、李舰、gashero、肖凯、郑跃平等书评作者,感谢他们在百忙之中抽空阅读书稿,撰写书评,并提出宝贵意见。
最后,要感谢两位作者的家人,感谢他们默默无闻的付出,没有他们的理解与支持,同样也没有本书。
尽管我们对书稿进行了多次修改,仍然不可避免地会有疏漏和不足之处,敬请广大读者批评指正,我们会在适当的时间进行修订,以满足更多人的需要。
本书更是为非专业人士提供了应用Python
进行数据处理的入门途径。在示例和引用的第三方库方面,本书更靠近入门者的习惯,而非专家习惯,使得入门数据分析的过程更加平滑而减少挫折,同时也避免了很多入门者常见的学了Python
却不知道怎么用的难题。在努力降低入门门槛的同时,也没有避开一些常见的难点,比如数据清洗和多种输入输出文件类型的支持,使得本书避免成为一本纯入门的书籍。
——gashero,Python
技术专家
本书将Python
数据分析相关的模块和分析理论相结合,深入浅出地向读者阐述数据分析方法论,无论是对刚入门的业界新手,还是有经验的职场人士,都是工作学习中不可多得的一位良师益友。
——阿橙,“Python
中文社区”微信公众号主理人
Python
现在已经成为数据分析的一大利器,本书从实战出发讲解了一系列使用Python 进行数据分析的必备知识点,书中案例附有详细的案例图示和代码说明,以帮助读者更好地学习和理解。
——崔庆才,《Python
3 网络爬虫开发实战》作者
读完本书,你会发现数据分析的乐趣,它并不是那么枯燥,数据背后的故事简直是太有意思了。从此你将发现:无论是新闻媒体,还是企业报表中的数字将不再孤独,因为他们在那里,在和你说着话!祝愿大家早日练就一颗数据分析的“芯”!
——黄成明,《数据化管理》作者,数据化管理顾问及培训师
由浅入深、循循善诱,是一本真正站在数据分析角度的Python
书籍。
——李舰,《统计之美》作者,统计之都核心成员
这是一本对初学者非常友好的书,它将带你开启数据分析之旅。
——刘志军,“Python
之禅”微信公众号主理人
两年前开始学习数据分析,因为《谁说菜鸟不会数据分析》而入门,这本书对我的影响非常大。书中的各种数据分析案例生动形象,让初学者学习起来没有丝毫的压力。《谁说菜鸟不会数据分析(Python
篇)》这本书仍然延续了系列书的风格,对于希望入门数据分析、想系统学习数据分析方法论的同学来说是一本非常值得一读的书。
——路人甲,“路人甲TM”微信公众号主理人
这是一本非常适合初学者入门的书,书中既讲解了数据分析的思路和统计学的基础知识,又提供了丰富的案例,将方法与应用紧密联系起来,还有详细的可实现的代码供读者练习。另外,这本书不仅可以作为初学者入门之选,其函数涉及之全面、参数介绍之详细,完全可以作为日常学习工作中的工具书来随时查看,是一本数据分析师的“必备宝典”!
——齐德胜,中国气象局华风集团- 华风象辑研发副总监
当谈到用数据解决问题时,我经常用这样的语言去诠释:“如果你不能量化它,你就不能理解它,如果不理解它,就不能控制它,不能控制它,也就不能改变它”。数据无处不在,信息时代的主要特征就是“数据处理”,数据分析正以我们从未想象过的方式影响着日常生活。
在知识经济与信息技术时代,每个人都面临者如何有效地吸收、理解和利用信息的挑战。那些能够有效利用工具从数据中提炼信息、发现知识的人,*终往往成为各行各业的强者!
这本书向我们清晰又友好地介绍了数据分析方法、技巧与工具,欢迎来读一读这本书,或许会给你带来更大的惊喜!
——沈浩教授,中国传媒大学新闻学院博士生导师,
中国传媒大学调查统计研究所所长,
大数据挖掘与社会计算实验室主任,
中国市场研究协会会长
数据分析用Python,学分析工具Python,用好本书就够了,基础知识、方法、流程、案例,应有尽有。
——数据小人,腾讯高级数据分析师,连续创业者
市面上有很多面对初学者的Python
书籍,大多数偏向于介绍语言本身。很多时候学完了语言却不清楚下一步应该做什么,这种情况下就需要有一本能面向具体应用场景,又不是那么厚重的书来带领大家入门。本书把数据分析的细节掰开讲透,一步步地讲清楚了各参数的含义,非常细致和有章法。对于希望从Excel 迁移到Python
的数据分析用户来讲,这是一本不错的入门读物。
——肖凯,蚂蚁金服数据技术专家
Python
语言用途广泛,很容易让初学者迷失方向。本书是新手数据分析师的指路标,Python 数据分析入门,请从这本书设定的学习路径开始。
——肖骁,58 同城数据分析师
俗话说万事开头难,入门一门新的编程语言也是一件令人头痛的事。但是这本书既简洁又全面,并且简单易懂的方式重新组织了整个知识体系,让小白的python
入门之路更加平坦。这应该是每一位Python 小白入门的*本书。
——许树淮,东风本田发动机有限公司 市场数据分析师
这本书基于工作中常用的数据分析实战方法与案例,通过结合Excel、Sql 等实现类比,通俗易懂地介绍Python
的实现方法逻辑,大大降低了学习门槛,本书堪称Python 数据分析入门不二之选!
——严婷,猎聘网 数据分析师
统计学是一门很难,但是很有趣,更很有用的工具学科。懂得如何使用他的人总是乐在其中,而尚未入门的人则畏之如虎。国内讲述统计学理论,以及讲述统计软件操作的书籍可谓汗牛充栋,但是多数流于理论,疏于应用和实践指导。存在着明显未被满足的读者需求。
近年来随着信息技术的普及,各行各业的业务数据自动化趋势愈来愈明显,使得数据分析的需求开始从统计专业人士向各行业人员全面扩展。在此背景之下,一本能够深入浅出,从实际应用的角度介绍基本统计分析知识的书就变得很有必要。
本书在理论和实践的平衡方面做了很有价值的尝试,基于很为普及的5W2H、PEST等数据分析方法论为指导,深入浅出的介绍了如何满足具体工作中的常见统计分析需求,对于需要应用统计分析,但是又未接受过这方面系统培训的读者来说,本书应当是一本非常合适的数据分析入门教材。
——张文彤博士,上海昊鲲企业管理咨询有限公司合伙人
此书秉承《谁说菜鸟不会数据分析》系列图书的特点,结构有层次、内容全面、通俗易懂,一步步引导你走进数据分析的世界、手把手教你如何使用Python
进行数据处理、数据分析和数据呈现。针对数据分析新人,是一本从了解数据分析到自己动手操作、逐步递进的好图书。
——郑来轶,数据分析网创始人,JollyChic
数据分析总监
迈入大数据时代后,就理论研究和实践创新而言,Python
都已成为重要的数据分
析工具。本书通过完整的结构、清晰的构思、严谨的逻辑、生动的语言,为初学者设
计了一条学习和使用Python 的有效路径。
——郑跃平,中山大学政务学院助理教授
评论
还没有评论。