fbpx

[email protected]

购物车

 查看订单

  • 我的帐户
东东购 | EasternEast
  • 中文书店
    • 畅销排行榜
      • 小说 畅销榜
      • 童书 畅销榜
      • 外语畅销榜
      • 管理畅销榜
      • 法律畅销榜
      • 青春文学畅销榜
    • 热门分类
      • 社会小说
      • 成功/励志 畅销榜
      • 人物传记
      • 大陆原创
      • 绘本童书
      • 影视小说
    • 文学推荐
      • 文集
      • 戏剧
      • 纪实文学
      • 名家作品
      • 民间文学
      • 中国现当代随笔
    • 新书热卖榜
      • 小说 新书热卖榜
      • 青春文学 新书热卖榜
      • 童书 新书热卖榜
      • 管理 新书热卖榜
      • 成功/励志 新书热卖榜
      • 艺术 新书热卖榜
  • 精选分类
    • 小说
    • 保健养生
    • 烹饪/美食
    • 风水/占卜
    • 青春文学
    • 童书
    • 管理
    • 成功/励志
    • 文学
    • 哲学/宗教
    • 传记
    • 投资理财
    • 亲子家教
    • 动漫/幽默
    • 法律 Legal
    • 经济 Economics
    • 所有分类
  • 关于东东
  • 帮我找书
搜索
首页教材高职高专教材数据采集与预处理

数据采集与预处理

作者:米洪 张?_ 出版社:人民邮电出版社 出版时间:2019年11月 

ISBN: 9787115519153
年中特卖用“SALE15”折扣卷全场书籍85折!可与三本88折,六本78折的优惠叠加计算!全球包邮!
trust badge

EUR €25.99

类别: 教材 新书热卖榜, 高职高专教材 SKU:5ed1bd885f98491444eff66a 库存: 有现货
  • 描述
  • 评论( 0 )

描述

包 装: 平装国际标准书号ISBN: 9787115519153丛书名: 产教融合信息技术类“十三五”规划教材

编辑推荐
1.基于企业级项目,以任务驱动为主线,便于教师教学,学生理解。
2.配套资源齐全。配备教学大纲、PPT课件、授课计划、习题答案。
3.企业配套资源,院校完善体系结构。 
内容简介
本书以任务驱动为主线,围绕企业级应用进行项目任务设计,主要内容包括数据采集与预处理准备、网络爬虫实践、日志数据采集实践和数据预处理实践,全面地讲述了Scrapy、Flume、Pig、Kettle、Pandas、OpenRefine等技术,以及urllib、Selenium基本库和BeautifulSoup解析库的相关知识与应用案例。
本书内容实用,可操作性强,语言精练、通俗易懂,可作为高等院校计算机应用技术、大数据技术与应用、软件技术、云计算技术与应用等计算机相关专业的教材,也可作为大数据分析、云计算应用领域技术人员的参考用书。
作者简介
米洪,主持省级项目3项;发表北大核心论文5篇;学院交通物联网技术科技创新团队骨干成员;江苏省高等职业院校教师专业带头人访问学者(东南大学);江苏省高校“青蓝工程”优秀中青年骨干教师。
目  录
项目1

数据采集与预处理准备 1

学习目标 1

项目描述 1

任务1 认识数据采集技术,熟悉数据采集平台 1

任务描述 1

任务目标 2

知识准备 2

任务实施 10

任务2 认识数据预处理技术 13

任务描述 13

任务目标 13

知识准备 13

任务实施 19

项目2

网络爬虫实践 24

学习目标 24

项目描述 24

任务1 使用urllib爬取北京公交线路信息 24

任务描述 24

任务目标 25

知识准备 25

任务实施 48

任务2 使用Selenium爬取淘宝网站信息 58

任务描述 58

任务目标 58

知识准备 58

任务实施 69

任务3 使用Scrapy爬取北京公交信息 75

任务描述 75

任务目标 75

知识准备 75

任务实施 78

任务4 创新与拓展 86

任务描述 86

任务目标 86

项目3

日志数据采集实践 87

学习目标 87

项目描述 87

任务1 Flume的安装和配置 87

任务描述 87

任务目标 88

知识准备 88

任务实施 95

任务2 Flume采集数据上传到集群 105

任务描述 105

任务目标 106

知识准备 106

任务实施 110

任务3 创新与拓展 118

任务描述 118

任务目标 118

项目4

数据预处理实践 119

学习目标 119

项目描述 119

任务1 用Pig进行数据预处理 119

任务描述 119

任务目标 120

知识准备 120

任务实施 134

任务2 用Kettle进行数据预处理 137

任务描述 137

任务目标 137

知识准备 137

任务实施 139

任务3 用Pandas进行数据预处理 150

任务描述 150

任务目标 150

知识准备 150

任务实施 153

任务4 用OpenRefine进行数据预处理 155

任务描述 155

任务目标 155

知识准备 155

任务实施 157

任务5 用Flume Interceptor对日志信息进行数据预处理 162

任务描述 162

任务目标 163

知识准备 163

任务实施 167

任务6 创新与拓展 176

任务描述 176

任务目标 176

抢先评论了 “数据采集与预处理” 取消回复

评论

还没有评论。

相关产品

加入购物车

审计案例分析

EUR €31.99
加入购物车

探索式软件测试

EUR €33.99
加入购物车

西方美术史十五讲(第二版)

EUR €38.99
加入购物车

职业指导(第11版)——职业生涯规划教程

EUR €28.99

东东购的宗旨是服务喜爱阅读中文书籍的海外人民,提供一个完善的购书平台,让国人不论何时何地都能沉浸在书香之中,读着熟悉的中文字,回忆着家乡的味道。


安全加密结账 安心网络购物 支持Paypal付款

常见问题

  • 货物配送
  • 退换货政策
  • 隐私政策
  • 联盟营销

客户服务

  • 联系东东
  • 关于东东
  • 帮我找书
  • 货物追踪
  • 会员登入

订阅最新的优惠讯息和书籍资讯

选择币别

EUR
USD
CAD
AUD
NZD
NOK
GBP
CHF
SEK
CNY
UAH
ILS
SAR
MXN
KRW
MYR
SGD
HUF
TRY
JPY
HKD
TWD
facebookinstagram
©2020 东东购 EasternEast.com

限时特卖:用“SALE15”优惠券全场书籍85折!可与三本88折,六本78折的优惠叠加计算。 忽略