Name: 实用机器学习
SKU: 5d874e4d5f98494bcc14f36f
Price: 43.99 EUR
Availability: InStock

描述

开本: 16开纸张: 胶版纸包装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787111569220丛书名: 计算机科学先进技术译丛

产品特色

编辑推荐

随着阿尔法狗在围棋领域高奏凯歌，人工智能领域已成为当前引人注目的风口，而机器学习又是这风口中的风头正劲的热点。本书从实战角度剖析了机器学习的知识原理，读者无需担心遇到难懂的数学公式和推导，就能够将机器学习的知识应用在自己熟悉的领域。《实用机器学习》还包含了三个机器学习真是应用的综合案例，本书所有代码资源都可以通过网络下载，读者还可以登录GITHUB与全球的机器学习爱好者共同交流本书的学习体验。

内容简介

本书介绍了实用机器学习的工作流程，主要从实用角度进行了描述，没有数学公式和推导。本书涵盖了数据收集与处理、模型构建、评价和优化、特征的识别、提取和选择技术、高级特征工程、数据可视化技术以及模型的部署和安装，结合3个真实案例全面、详细地介绍了整个机器学习流程。后，还介绍了机器学习流程的扩展和大数据应用。
本书可以作为程序员、数据分析师、统计学家、数据科学家解决实际问题的参考书，也可以作为机器学习爱好者学习和应用的参考书，还可以作为非专业学生的机器学习入门参考书，以及专业学生的实践参考书。

作者简介

Henrik Brink（亨里克·布林克）是一名数据科学家，对应用机器学习进行工业和学术应用开发有着丰富的经验。
Joseph Richards（约瑟夫W理查兹）也是一位数据科学家，具有应用统计和预测分析方面的专业知识。Henrik和Joseph是Wise.io的联合创立者，Wise.io是一家提供工业机器学习解决方案的开发商。
Mark Fetherolf（马克·弗特罗夫）是数据管理和预测分析公司Numinary Data Science的创始人和总裁。他曾在社会科学研究、化学工程、信息系统性能、容量规划、有线电视和在线广告应用等方面担任统计师和分析数据库开发人员。

目　　录

目录
推荐序
作者序
致谢
译者序
关于本书
作者简介
关于封面插图
第1部分机器学习工作流程
第1章什么是机器学习
1.1理解机器学习
1.2使用数据进行决策
1.2.1传统方法
1.2.2机器学习方法
1.2.3机器学习的五大优势
1.2.4面临的挑战
1.3跟踪机器学习流程：从数据到部署
1.3.1数据集合和预处理
1.3.2数据构建模型
1.3.3模型性能评估
1.3.4模型性能优化
1.4提高模型性能的高级技巧
1.4.1数据预处理和特征工程
1.4.2用在线算法持续改进模型
1.4.3具有数据量和速度的规模化模型
1.5总结
1.6本章术语
第2章实用数据处理
2.1起步：数据收集
2.1.1应包含哪些特征
2.1.2如何获得目标变量的真实值
2.1.3需要多少训练数据
2.1.4训练集是否有足够的代表性
2.2数据预处理
2.2.1分类特征
2.2.2缺失数据处理
2.2.3简单特征工程
2.2.4数据规范化
2.3数据可视化
2.3.1马赛克图
2.3.2盒图
2.3.3密度图
2.3.4散点图
2.4总结
2.5本章术语
第3章建模和预测
3.1基础机器学习建模
3.1.1寻找输入和目标间的关系
3.1.2寻求好模型的目的
3.1.3建模方法类型
3.1.4有监督和无监督学习
3.2分类：把数据预测到桶中
3.2.1构建分类器并预测
3.2.2非线性数据与复杂分类
3.2.3多类别分类
3.3回归：预测数值型数据
3.3.1构建回归器并预测
3.3.2对复杂的非线性数据进行回归
3.4总结
3.5本章术语
第4章模型评估与优化
4.1模型泛化：评估新数据的预测准确性
4.1.1问题：过度拟合与乐观模型
4.1.2解决方案：交叉验证
4.1.3交叉验证的注意事项
4.2分类模型评估
4.2.1分类精度和混淆矩阵
4.2.2准确度权衡与ROC曲线
4.2.3多类别分类
4.3回归模型评估
4.3.1使用简单回归性能指标
4.3.2检验残差
4.4参数调整优化模型
4.4.1机器学习算法和它们的调整参数
4.4.2网格搜索
4.5总结
4.6本章术语
第5章基础特征工程
5.1动机：为什么特征工程很有用
5.1.1什么是特征工程
5.1.2使用特征工程的5个原因
5.1.3特征工程与领域专业知识
5.2基本特征工程过程
5.2.1实例：事件推荐
5.2.2处理日期和时间特征
5.2.3处理简单文本特征
5.3特征选择
5.3.1前向选择和反向消除
5.3.2数据探索的特征选择
5.3.3实用特征选择实例
5.4总结
5.5本章术语
第2部分实际应用
第6章案例：NYC出租车数据
6.1数据：NYC出租车旅程和收费信息
6.1.1数据可视化
6.1.2定义问题并准备数据
6.2建模
6.2.1基本线性模型
6.2.2非线性分类器
6.2.3包含分类特征
6.2.4包含日期-时间特征
6.2.5模型的启示
6.3总结
6.4本章术语
第7章高级特征工程
7.1高级文本特征
7.1.1词袋模型
7.1.2主题建模
7.1.3内容拓展
7.2图像特征
7.2.1简单图像特征
7.2.2提取物体和形状
7.3时间序列特征
7.3.1时间序列数据的类型
7.3.2时间序列数据的预测
7.3.3经典时间序列特征
7.3.4事件流的特征工程
7.4总结
7.5本章术语
第8章NLP高级案例：电影评论情感预测
8.1研究数据和应用场景
8.1.1数据集初探
8.1.2检查数据
8.1.3应用场景有哪些
8.2提取基本NLP特征并构建初始模型
8.2.1词袋特征
8.2.2用朴素贝叶斯算法构建模型
8.2.3tf-idf算法规范词袋特征
8.2.4优化模型参数
8.3高级算法和模型部署的考虑
8.3.1word2vec特征
8.3.2随机森林模型
8.4总结
8.5本章术语
第9章扩展机器学习流程
9.1扩展前需考虑的问题
9.1.1识别关键点
9.1.2选取训练数据子样本代替扩展性
9.1.3可扩展的数据管理系统
9.2机器学习建模流程扩展
9.3预测扩展
9.3.1预测容量扩展
9.3.2预测速度扩展
9.4总结
9.5本章术语
第10章案例：数字显示广告
10.1显示广告
10.2数字广告数据
10.3特征工程和建模策略
10.4数据大小和形状
10.5奇异值分解
10.6资源估计和优化
10.7建模
10.8K近邻算法
10.9随机森林算法
10.10其他实用考虑
10.11总结
10.12本章术语
10.13摘要和结论
附录常用机器学习算法
名词术语中英文对照

前　　言

关于本书《实用机器学习》的读者对象是针对想要把机器学习应用于实际问题的人。它详细阐述了机器学习的主要组成部分：工作流程、算法和工具。关注点是著名算法的实际应用，而不是创建一个算法。构建和使用机器学习模型的每个步骤都有详细描述，并有从简单到中等复杂的实例与之对应。
主要内容第1部分，“机器学习工作流程”介绍基本的机器学习工作流程，并分章节对每个步骤加以介绍。
第1章，“什么是机器学习”介绍机器学习的应用领域和用途。
第2章，“实用数据处理”，详细介绍机器学习流程中的数据处理和准备工作。
第3章，“建模和预测”，介绍构建简单的机器学习模型，并利用应用广泛的算法和库进行预测。
第4章，“模型评估和优化”，深入研究机器学习模型，并对其进行评估和性能优化。
第5章，“基础特征工程”，介绍利用领域知识对原始数据进行提高的常用方法。
第2部分，“实际应用”，介绍模型规模化和从文本、图片和时间序列数据中提取特征的技术，来提高绝大多数现代机器学习的性能。本部分包括3个有完整实例的章节。
第6章，“实例：NYC出租车数据”，这是个完整实例章节，会预测乘客的倾向性行为。
第7章，“高级特征工程”，包含高级特征工程过程，介绍从自然语言的文本、图片和时序序列数据中提取有价值的数据。
第8章，“NLP高级案例：电影评论情感预测”，运用高级特征工程知识预测在线电影评论的情感。
第9章，“扩展机器学习流程”，介绍扩大机器学习系统的数据规模、预测吞吐量和降低预测间隔的技术。
第10章，“案例：数字显示广告”，构建大型数据的模型，预测数字广告点击行为。
如何使用本书如果你是机器学习新手，第1~5章将引导你学习研究和准备数据、特征工程、建模和模型评估过程。Python实例采用流行的数据处理、pandas和Scikit-Learn机器学习库。第6~10章，包括3个实际机器学习案例、高级特征工程和优化的话题。由于学习库封装了大部分的复杂性，因此代码示例可以很容易地应用到你自己的机器学习系统中。
目标读者本书可以使程序员、数据分析师、统计学家、数据科学家和其他专业人士将机器学习应用于实际问题，或者简单地理解它。他们将获得实用数据建模、优化和开发机器学习系统的经验，而没必要了解特定算法的理论推导。机器学习的数学基础是针对感兴趣的人的，某些算法在较高的层次上进行解释，本书提供给那些想深入学习的人，我们的焦点是获得实际结果以解决手头的问题。
代码约定，下载和软件需求本书包含许多示例源代码，或者以编号的清单出现，或者嵌入在正文中，但无论哪种情况，都以固定宽度的这种字体显示，以区别于正常的文本。
源代码使用Python，pandas和Scikit-Learn编写。与章节相应的iPython笔记文件可在GitHub上下载，地址为https://githubcom/brinkar/real-world-machine-learning，也可以通过关注机械工业出版社计算机分社官方微信订阅号“IT有得聊”，输入5位数号“56922”后获得资源下载链接，还可以登录golden-book.com搜索本书并进行下载。
笔记文件（扩展名为ipynb）与章节相对应。样本数据包含在data文件夹中，只要必需的库随iPython一起安装，那么所有的笔记文件都能执行。图形由matplotlib和Seaborn的pyplot模块生成。
在有些情况下，由iPython产生的图形被提取出来作为本书的插图（为了适应打印质量和电子书显示，有些已经做了修改）。

抢先评论了 “实用机器学习” 取消回复

还没有评论。

实用机器学习

央视推荐！用Python从实战角度剖析机器学习，含有3个真实应用案例，不含难懂的数学公式和推导

作者:Henrik Brink, Joseph W. Richards, Mark Fetherolf 出版社:机械工业出版社出版时间:2017年06月

ISBN: 9787111569220

年中特卖用“SALE15”折扣卷全场书籍85折！可与三本88折，六本78折的优惠叠加计算！全球包邮!

描述

抢先评论了 “实用机器学习” 取消回复

评论

实用机器学习

央视推荐！用Python从实战角度剖析机器学习，含有3个真实应用案例，不含难懂的数学公式和推导

作者:Henrik Brink, Joseph W. Richards, Mark Fetherolf 出版社:机械工业出版社 出版时间:2017年06月

ISBN: 9787111569220

年中特卖用“SALE15”折扣卷全场书籍85折！可与三本88折，六本78折的优惠叠加计算！全球包邮!

描述

抢先评论了 “实用机器学习” 取消回复

评论

相关产品

Python编程（第四版）

码农翻身（好玩有趣的编程知识）

Python编程 从入门到实践

21世纪C语言（影印版）

作者:Henrik Brink, Joseph W. Richards, Mark Fetherolf 出版社:机械工业出版社出版时间:2017年06月

Python编程从入门到实践