描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787302649045
《Python数据分析与可视化项目实战》专注于Python数据分析与可视化的实战指导,打破了传统的理论框架,注重实践和项目实战,适合有一定编程基础、想要深入学习数据分析和可视化的读者。
在内容设计上,采用了循序渐进的方式,逐步引导读者掌握数据分析和可视化的技能。每章以一个具体的项目示例为主线,详细讲解相关的理论知识和基本技巧,并提供实用的代码示例。读者在阅读过程中可以通过实际操作来加深对书中知识的理解和掌握。
书中每个项目案例都选取了具有代表性和实用性的主题,包括股票市场走势预测、城市自行车共享需求预测、电商客户数据分析等,这些项目案例不仅让读者理论与实践相结合,更让读者从不同领域的数据问题中受益良多,将理论知识应用于实际项目中。
《Python数据分析与可视化项目实战》由浅入深地讲解了使用Python语言实现大型商业案例项目数据分析的知识,几乎覆盖了当今主流的数据分析行业。全书共9章,分别讲解了电影产业市场数据分析和可视化系统,电商客户数据分析和可视化系统,房产信息数据分析和可视化系统,城市智能交通数据分析和可视化系统,NBA球星技术统计信息数据分析和可视化系统,股票数据分析和可视化系统,民宿信息数据分析和可视化系统,足球数据可视化分析和机器学习预测系统,网络舆情数据分析和可视化系统等。 《Python数据分析与可视化项目实战》适用于已经了解Python语言基础语法,希望进一步提高自己Python开发水平的读者,同时还可以作为大专院校相关专业的师生用书和培训机构的教材。
第1章 电影产业市场数据分析和可视化系统(Flask FastAPI Vue Echarts) 1
1.1 电影产业介绍 2
1.2 电影市场的需求分析 2
1.2.1 市场需要高质量作品 2
1.2.2 国内电影市场的变化 3
1.3 系统架构 3
1.4 准备数据 4
1.5 后端数据分析模块 5
1.5.1 后端系统配置 5
1.5.2 注册FastAPI访问 6
1.5.3 URL错误处理 9
1.5.4 后端数据分析 11
1.5.5 后端主文件 15
1.5.6 日志处理 16
1.6 前端数据可视化模块 18
1.6.1 前端系统配置 18
1.6.2 前台主页 19
1.6.3 电影时长占比图 28
1.6.4 电影上映年份趋势图 33
1.6.5 各国及地区电影出产量统计图 37
1.6.6 电影类别排行统计图 41
1.6.7 电影语言使用统计图 46
1.6.8 各国及地区电影评分展示统计图 52
第2章 电商客户数据分析和可视化系统(Jupyter Notebook Scikit-Learn Matplotlib Pandas) 59
2.1 电商行业发展介绍 60
2.1.1 国内电商市场现状分析 60
2.1.2 电商行业发展趋势介绍 60
2.2 需求分析 61
2.2.1 电商的商业模式 61
2.2.2 核心指标需求分析 62
2.2.3 指标体系需求分析 63
2.2.4 数据分析方法 65
2.2.5 电商平台“人”的指标思维导图 66
2.3 系统架构 66
2.4 准备数据 67
2.5 数据分析 68
2.5.1 数据清洗 68
2.5.2 数据分析 73
2.5.3 数据建模 78
第3章 房产信息数据分析和可视化系统(网络爬虫 MySQL pylab实现) 85
3.1 背景介绍 86
3.1.1 行业发展现状 86
3.1.2 房地产行业市场调查 86
3.2 需求分析 87
3.3 系统架构 87
3.4 系统设置 88
3.4.1 选择版本 88
3.4.2 保存日志信息 89
3.4.3 设置创建的文件名 89
3.4.4 设置爬取城市 91
3.4.5 处理区县信息 93
3.4.6 处理日期和时间 95
3.5 破解反爬机制 95
3.5.1 定义爬虫基类 96
3.5.2 浏览器用户代理 97
3.5.3 在线IP代理 98
3.6 爬虫爬取信息 99
3.6.1 设置解析元素 99
3.6.2 爬取二手房信息 99
3.6.3 爬取楼盘信息 103
3.6.4 爬取小区信息 107
3.6.5 爬取租房信息 110
3.7 数据可视化 115
3.7.1 爬取数据并保存到数据库 115
3.7.2 可视化济南市房价最贵的4个小区 120
3.7.3 可视化济南市主要地区的房价均价 121
3.7.4 可视化济南市主要地区的房源数量 123
3.7.5 可视化济南市各区的房源数量所占百分比 124
第4章 城市智能交通数据分析和可视化系统(Pandas Matplotlib Numpy) 127
4.1 背景介绍 128
4.2 需求分析 128
4.2.1 城市交通存在的问题 128
4.2.2 智能交通建设的必要性 129
4.2.3 项目目标 130
4.3 系统架构 131
4.4 从CSV文件读取数据 132
4.4.1 读取并显示CSV文件中的前3条骑行数据 132
4.4.2 读取并显示CSV文件中指定列的数据 134
4.4.3 用统计图可视化CSV文件中的数据 135
4.4.4 选择指定数据 136
4.5 日期相关操作 142
4.5.1 统计每个月的骑行数据 142
4.5.2 展示某街道前5天的骑行数据信息 143
4.5.3 统计周一到周日每天的数据 145
4.5.4 使用Matplotlib图表可视化展示统计数据 146
第5章 NBA球星技术统计信息数据分析和可视化系统(网络爬虫 Referer反爬 JSON Matplotlib Pandas) 149
5.1 背景介绍 150
5.1.1 NBA介绍 150
5.1.2 NBA的全球化 150
5.2 需求分析 151
5.3 系统架构 151
5.4 球员特征可视化 152
5.4.1 爬取球员得分信息 152
5.4.2 球员数据聚类分析 155
5.5 球员数据可视化雷达图 161
5.5.1 分析季后赛杜兰特的数据 161
5.5.2 分析季后赛库里的数据 166
5.6 球星命中数据信息可视化 167
5.6.1 绘制篮球场 168
5.6.2 爬取球星库里的投篮信息:Referer反爬 171
5.6.3 库里投篮信息的可视化 174
5.6.4 杜兰特投篮信息的可视化 175
第6章 股票数据分析和可视化系统(网络爬虫 Selenium TuShare Matplotlib Scikit-Learn) 177
6.1 背景介绍 178
6.2 需求分析 178
6.2.1 股票历史数据分析的目的与意义 178
6.2.2 股票数据分析 179
6.3 系统架构 179
6.4 爬取股票实时涨幅榜信息 180
6.4.1 准备Selenium环境 180
6.4.2 爬取数据 181
6.4.3 获取指定股票所属行业信息 182
6.4.4 获取涨幅榜和跌幅榜信息 183
6.4.5 将涨幅榜前10和跌幅榜前10股票数据保存到Excel文件 184
6.5 AI选股系统 186
6.5.1 准备TuShare 186
6.5.2 跟踪热点板块 187
6.5.3 数据建模和评估分析 199
第7章 民宿信息数据分析和可视化系统(网络爬虫 Django Echarts可视化) 219
7.1 背景介绍 220
7.2 系统架构 221
7.3 爬虫爬取信息 221
7.3.1 系统配置 221
7.3.2 Item处理 222
7.3.3 具体爬虫 223
7.3.4 破解反爬字体加密 232
7.3.5 下载器中间件 235
7.3.6 保存爬虫信息 239
7.4 数据可视化 244
7.4.1 数据库设计 244
7.4.2 登录验证表单 247
7.4.3 视图显示 248
第8章 足球数据可视化分析和机器学习预测系统(Matplotlib Pandas Seaborn Scikit-Learn实现) 259
8.1 欧洲足球五大联赛 260
8.2 系统架构 261
8.3 准备数据 261
8.4 数据可视化分析 262
8.4.1 事件收集 262
8.4.2 射门数据可视化 266
8.4.3 球队和球员数据可视化 268
8.4.4 联赛数据可视化 275
8.4.5 巴塞罗那队的进球数据百分比饼图 279
8.4.6 红牌和黄牌数据可视化 280
8.4.7 进球数据可视化 285
8.4.8 梅西和C罗的数据可视化 292
8.4.9 五大联赛的球员数量可视化 295
8.5 比赛预测 296
8.5.1 读取数据 296
8.5.2 清洗数据 299
8.5.3 逻辑回归算法 300
8.5.4 梯度提升模型 301
8.5.5 随机森林 302
8.5.6 深度学习 303
第9章 网络舆情数据分析和可视化系统(Scikit-Learn Tornado Celery FastAPI Pandas Vue) 305
9.1 系统介绍 306
9.1.1 舆情数据分析的意义 306
9.1.2 舆情热度分析 306
9.2 架构设计 307
9.2.1 模块分析 307
9.2.2 系统架构 308
9.3 微博爬虫 309
9.3.1 系统配置 309
9.3.2 批量账号模拟登录 309
9.3.3 爬取信息 311
9.4 系统后端 322
9.4.1 系统配置 322
9.4.2 数据结构设计 323
9.4.3 数据处理 327
9.4.4 微博话题分析 334
9.5 系统前端 341
9.5.1 API导航 341
9.5.2 博文详情 342
互联网的飞速发展带来了海量信息,而海量信息的背后对应的则是海量数据。如何从这些海量数据中获取有价值的信息来供人们学习和工作使用,这就不得不用到大数据挖掘和分析技术。数据可视化分析作为大数据技术的核心一环,其重要性不言而喻。
随着云时代的来临,数据可视化分析技术将具有越来越重要的战略意义。大数据已经渗透到每一个行业和业务领域,逐渐成为重要的生产要素,人们对于海量数据的运用预示着新一轮生产率增长浪潮的到来。数据可视化分析技术将帮助企业在合理时间内攫取、管理、处理、整理海量数据,为企业经营决策提供积极的帮助。数据可视化分析作为数据存储和挖掘分析的前沿技术,已广泛应用于物联网、云计算、移动互联网等战略性新兴产业。虽然数据可视化分析目前在国内还处于初级阶段,但是其商业价值已经显现出来,有实践经验的数据可视化分析人才更是成为各企业争夺的对象。为了满足对数据可视化分析人才日益增长的需求,很多大学开始尝试开设数据可视化分析课程。
本书的特色
1.内容编排以实际项目为主导
本书以实际项目为基础,通过一系列的数据分析和可视化项目,帮助读者将理论知识转化为实际应用。每个项目都提供了详细的代码和数据,读者可以通过实际操作来巩固所学的知识。
2.商业项目,新颖并具代表性
本书9个大型商业项目的实现过程,几乎覆盖了当今主流的应用领域,这些项目十分新颖,通过学习这几个商业项目,可以帮助读者探索自己的创新解决方案。
3.简洁易懂的讲解风格
本书通过直观、易懂的案例来讲解。读者可以快速地掌握数据分析和可视化的基本概念和技术,并能够应用于实际项目开发中。
4.二维码布局全书,扫码后可以观看讲解视频
本书正文的每一个二级目录都有一个二维码,通过二维码扫描可以观看讲解视频,既包括实例讲解也包括教程讲解,帮助读者快速掌握本书案例。
本书的读者对象
软件工程师;
Python初学者和自学者;
专业数据分析人员;
数据库工程师和管理员;
研发工程师;
大学及中学教育工作者。
致谢
本书由王振丽编著,在编写过程中,得到了清华大学出版社各位编辑的大力支持。正是各位专业人士的耐心和高效,才使本书能够在这么短的时间内出版。另外,也十分感谢我的家人给予的巨大支持。本人水平毕竟有限,书中存在纰漏之处在所难免,诚请读者提出宝贵的意见或建议,以便修订并使之更臻完善。
最后感谢您购买本书,希望本书能成为您编程路上的领航者,祝您阅读快乐!
编 者
评论
还没有评论。