描述

开本: 16开纸张: 胶版纸包装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787121410895

编辑推荐

一书入手，一步到位！零基础入门迁移学习！

《迁移学习导论》独辟蹊径，从初学者角度出发，以“讲课”的形式，归纳分析各类迁移学习方法，使读者能快速理解迁移学习的本质问题、抓住重点、举一反三、迅速入门。

《迁移学习导论》一大亮点是对“两头“的把握：

一是源头，抓问题和场景，做到“师出有名”，讲清楚针对什么问题、用在哪里；

二是笔头，抓代码与实践，做到“落地结果”，在实战中巩固和深化对技术的理解。

考虑多方位学习的需求，《迁移学习导论》配有实践代码、学习资料、相关笔记和*文章，并持续更新。

内容简介

迁移学习作为机器学习和人工智能领域的重要方法，在计算机视觉、自然语言处理、语音识别等领域都得到了广泛的应用。本书的编写目的是帮助迁移学习及机器学习相关领域的初学者快速入门。全书主要分为背景与概念、方法与技术、扩展与探索及应用与展望四大部分。除此之外，本书还配有相关的代码、数据和论文资料，*限度地降低初学者的学习和使用门槛。

本书适合对迁移学习感兴趣的读者阅读，也可以作为相关课程的配套教材。

作者简介

王晋东
微软亚洲研究院研究员、中国科学院计算技术研究所博士，主要从事迁移学习、机器学习和深度学习方面的研究。研究成果发表在IEEE TNNLS、ACM TIST、CVPR、IJCAI、ACMMM、UbiComp等顶级期刊和会议，获得国家奖学金、中国科学院优秀博士论文奖、中科院计算所所长特别奖学金等。担任国际会议IJCAI 2019的宣传主席、顶级国际期刊会议IEEE TPAMI、TKDE、ICML、NeurIPS、ICLR、CVPR等的审稿人或程序委员会委员。热心知识分享，在知乎的博客文章浏览次数逾700万次。

陈益强
中国科学院计算技术研究所所务委员、研究员、CCF Fellow，主要研究人机交互与普适计算，联邦学习与迁移学习等。
任北京市移动计算与新型终端重点实验室主任、中科院计算所泛在计算系统研究中心主任；曾入选国家“万人计划”科技创新领军人才、科技部中青年科技创新领军人才、北京市科技新星等；国务院特殊津贴专家，东京大学、南洋理工大学兼职教授，IEEE计算智能等6个刊物的编委，IEEE可穿戴与智能交互技术委员会创始委员等。获 IJCAI-FL等人工智能和普适计算领域最佳论文奖 6 项；相关成果获国家科技进步二等奖及中国计算机学会技术发明一等奖等。

目　　录

第一部分背景与概念

第1 章绪论 3

1.1 迁移学习 3

1.2 相关研究领域 6

1.3 迁移学习的必要性 8

1.3.1 大数据与少标注之间的矛盾 8

1.3.2 大数据与弱计算能力的矛盾 8

1.3.3 有限数据与模型泛化能力的矛盾 9

1.3.4 普适化模型与个性化需求的矛盾 9

1.3.5 特定应用的需求 10

1.4 迁移学习的研究领域 11

1.4.1 按特征空间分类 12

1.4.2 按目标域有无标签分类 12

1.4.3 按学习方法分类 12

1.4.4 按离线与在线形式分类 13

1.5 迁移学习的应用 14

1.5.1 计算机视觉 14

1.5.2 自然语言处理 15

1.5.3 普适计算与人机交互 16

1.5.4 医疗健康 17

1.6 学术会议和工业界中的迁移学习 18

第2 章从机器学习到迁移学习 21

2.1 机器学习及基本概念 21

2.2 结构风险最小化 22

2.3 数据的概率分布 23

2.4 概念与符号 25

2.5 迁移学习的问题定义 26

第3 章迁移学习基本问题 29

3.1 何处迁移 30

3.2 何时迁移 32

3.3 如何迁移 32

3.4 失败的迁移：负迁移 33

3.5 完整的迁移学习过程 35

第二部分方法与技术

第4 章迁移学习方法总览 39

4.1 迁移学习总体思路 39

4.2 分布差异的度量 40

4.2.1 百花齐放的迁移学习分布度量 41

4.2.2 分布差异的统一表征 42

4.2.3 分布自适应因子的计算 44

4.3 迁移学习统一表征 45

4.3.1 样本权重迁移法 46

4.3.2 特征变换迁移法 47

4.3.3 模型预训练迁移法 48

4.3.4 小结 48

4.4 上手实践 48

4.4.1 数据准备 49

4.4.2 基准模型构建：KNN 51

4.5 迁移学习理论 53

4.5.1 概念与符号 54

4.5.2 基于H-divergence 的理论分析 54

4.5.3 基于HΔH-distance 的理论分析 55

4.5.4 基于差异距离的理论分析 57

4.5.5 结合标签函数差异的理论分析 58

第5 章样本权重迁移法 59

5.1 问题定义 59

5.1.1 样本权重迁移法的可行性分析 59

5.1.2 形式化定义 60

5.2 基于样本选择的方法 61

5.2.1 基于非强化学习的样本选择法 62

5.2.2 基于强化学习的样本选择法 63

5.3 基于权重自适应的方法 64

5.4 上手实践 66

5.5 小结 68

第6 章统计特征变换迁移法 69

6.1 问题定义 69

6.2 最大均值差异法 70

6.2.1 基本概念 70

6.2.2 基于最大均值差异的迁移方法 72

6.2.3 求解与计算 75

6.2.4 应用与扩展 76

6.3 度量学习法 78

6.3.1 从预定义的距离到可学习的距离 78

6.3.2 度量学习及其形式化 79

6.3.3 基于度量学习的迁移学习 80

6.4 上手实践 81

6.4.1 算法精炼 81

6.4.2 编写代码 82

6.5 小结 84

第7 章几何特征变换迁移法 85

7.1 问题定义 85

7.2 子空间变换法 86

7.3 流形学习法 87

7.3.1 流形学习 87

7.3.2 基于流形学习的迁移学习方法 88

7.4 最优传输法 91

7.4.1 最优传输 91

7.4.2 基于最优传输法的迁移学习方法 92

7.5 上手实践 94

7.6 小结 97

第8 章预训练方法 99

8.1 深度网络的可迁移性 99

8.2 预训练–微调 102

8.3 预训练方法的有效性分析 105

8.4 自适应的预训练方法 106

8.5 重新思考预训练模型的使用 108

8.6 上手实践 110

8.7 小结 113

第9 章深度迁移学习 115

9.1 总体思路 116

9.2 深度迁移学习的网络结构 117

9.2.1 单流结构 118

9.2.2 双流结构 118

9.3 数据分布自适应的深度迁移学习方法 120

9.3.1 边缘分布自适应 120

9.3.2 条件、联合与动态分布自适应 121

9.4 结构自适应的深度迁移学习方法 122

9.4.1 批归一化 123

9.4.2 批归一化用于迁移学习 123

9.4.3 基于多表示学习的迁移网络结构 124

9.5 知识蒸馏 125

9.6 上手实践 127

9.6.1 网络结构 127

9.6.2 损失 129

9.6.3 训练 131

9.6.4 测试 132

9.7 小结 133

第10 章对抗迁移学习 135

10.1 生成对抗网络 135

10.2 对抗迁移学习基本思路 136

10.3 数据分布自适应的对抗迁移方法 137

10.4 基于信息解耦的对抗迁移方法 140

10.5 基于数据生成的对抗迁移方法 141

10.6 上手实践 142

10.6.1 领域判别器 143

10.6.2 分布差异计算 143

10.6.3 梯度反转层 144

10.7 小结 145

第11 章迁移学习热门研究问题 147

11.1 类别不均衡的迁移学习 148

11.2 多源迁移学习 150

11.3 开放集迁移学习 153

11.4 时间序列的迁移学习 154

11.5 联邦迁移学习 158

11.5.1 联邦学习 158

11.5.2 联邦迁移学习 160

11.6 基于因果关系的迁移学习 161

11.6.1 什么是因果关系 161

11.6.2 因果关系与迁移学习 163

11.7 自动迁移学习 168

11.8 在线迁移学习 171

第三部分扩展与探索

第12 章领域泛化 177

12.1 领域泛化问题 177

12.1.1 背景 177

12.1.2 问题定义 179

12.1.3 常用方法 180

12.2 基于数据分布自适应的方法 181

12.2.1 领域无关成分分析DICA 181

12.2.2 深度数据分布自适应 183

12.3 基于解耦的方法 184

12.4 基于集成模型的方法 186

12.5 基于数据生成的方法 187

12.5.1 领域随机法 187

12.5.2 对抗数据生成 188

12.6 基于元学习的方法 190

12.7 小结 191

第13 章元学习 193

13.1 元学习简介 193

13.1.1 问题背景 193

13.1.2 元学习 194

13.2 基于模型的元学习方法 196

13.3 基于度量的元学习方法 198

13.4 基于优化的元学习方法 199

13.5 元学习的应用与挑战 201

13.5.1 应用 201

13.5.2 现存的挑战 202

13.6 小结 202

第14 章迁移学习模型选择 205

14.1 模型选择 205

14.2 基于密度估计的模型选择 206

14.3 迁移交叉验证 207

14.4 小结 208

第四部分应用与展望

第15 章迁移学习的应用 211

15.1 计算机视觉 212

15.2 自然语言处理 214

15.3 语音识别与合成 216

15.4 普适计算与人机交互 218

15.5 医疗健康领域 220

15.6 其他应用 223

15.7 小结 225

第16 章迁移学习前沿 227

16.1 融合人类经验的迁移 227

16.2 迁移强化学习 228

16.3 迁移学习的可解释性 228

16.4 迁移学习系统 229

附录A 231

A.1 常用度量准则 231

A.1.1 常见的几种距离 231

A.1.2 余弦相似度 232

A.1.3 互信息 232

A.1.4 相关系数 232

A.1.5 KL 散度与JS 距离 233

A.1.6 最大均值差异MMD 233

A.1.7 Principal Angle 234

A.1.8 A-distance 234

A.1.9 希尔伯特–施密特独立性系数 234

A.1.10 Wasserstein Distance 234

A.2 迁移学习常用数据集 235

A.2.1 手写体识别图像数据集 235

A.2.2 对象识别数据集 236

A.2.3 图像分类数据集 237

A.2.4 通用文本分类数据集 237

A.2.5 行为识别公开数据集 238

A.3 本书相关资源 238

参考文献 241

前　　言

本书的编写目的是帮助迁移学习领域的初学者快速入门。本书尽可能绕开过于理论化的概念，专注介绍经验方法。除此之外，本书还配有相关的代码、数据和论文资料，最大限度地方便初学者学习。

本书共分四大部分：背景与概念、方法与技术、扩展与探索，以及应用与展望。第一部分为背景与概念，由第1 章到第3 章构成。其中第1 章为绪论，从宏观角度介绍了迁移学习的基本概念及其必要性，并且简单分析了它与已有概念的区别和联系。这一章也介绍了迁移学习的一些应用领域，目的是使读者对迁移学习有较为系统的了解。第2 章从机器学习开始，逐步过渡到迁移学习的概念上。第3 章介绍了迁移学习领域的基本研究问题。第二部分为方法与技术，这是全书最重要的部分，由第4 章到第11 章构成。第4 章以较为严谨的学术风格对迁移学习的基本问题进行了形式化定义，并描述了一个较为完整的迁移学习过程，以及对迁移学习理论分析的一些总结。这一章应该视为余下章节的起点。第5∼8 章对应三大类迁移学习的基本方法：第5 章对应样本权重迁移法，第6 章、第7 章分别介绍基于统计距离和几何特征的特征变换迁移方法，这两章合起来对应特征变换迁移法。由于此类方法的相关工作最为丰硕，因此我们分为两个章节讲述。第8 章则对应基于模型的迁移，特别是在深度模型中的预训练方法。

第9 章和第10 章重点讲述深度迁移学习和对抗迁移学习的基本思路和方法。读者应当注意的是，深度网络中的迁移方法不应当与之前的三大类基本方法割裂开，而应该被视为三种基本方法在深度网络中的具体体现。因此，这也是为什么我们不直接谈深度方法而首先介绍三大类基本方法的原因。第11 章介绍了迁移学习领域若干热门研究问题和相关工作。这些从不同视角出发的问题从各个方面对经典的迁移学习场景进行了扩展，在目前仍然是热门的研究方向。

第三部分为扩展与探索，由第12 章到第14 章构成。所谓扩展，指的是不局限于固定的迁移学习问题，旨在探索迁移学习新方向的一些研究成果。我们重点选择了领域泛化（第12 章）和元学习（第13 章）这两个研究方向进行探究和分析。第14 章则给出了在迁移学习模型选择方面的一些代表工作。

第四部分为应用与展望，由第15 章和第16 章构成。第15 章是迁移学习的应用，介绍了迁移学习在包括计算机视觉、自然语言处理、语音识别、普适计算、医疗健康等领域要解决的问题及应用的方式，向读者展示迁移学习是如何被应用到特定的任务，用以解决该应用的痛点问题的。读者将迁移学习应用于自己的任务时，可以借鉴本章所述的应用及解决方案。第16 章介绍了几个迁移学习的前沿问题。

另外，附录部分提供了一些常用的研究资料，供初学者学习研究。

由于作者水平有限，不足和错误之处，敬请不吝批评指正。

媒体评论

迁移学习旨在利用已有的数据、模型和知识，通过领域相似性和“举一反三”的联想能力，把学到的通用知识适配到新的领域、场景和任务上，它使机器学习拥有更强大的泛化能力。

本书作者长期和我的实验室合作，积累了丰富的科研经验，多年来辛勤地在大众媒体上普及迁移学习的相关知识。在本书中，他们保持了一贯的简明通透的写作风格，用贴近学生群体的语言，将迁移学习的发展历史、基础知识和*进展娓娓道来。同时，本书配有用于实践的源码和数据集，增加了动手练习的环节，提高了趣味性。作为长期耕耘在迁移学习这一人工智能领域的学者和业界首本迁移学习著作（《迁移学习》）的作者，我强力推荐这本书给有志于从事迁移学习研究的同学，更快地入门和学习！
——杨强微众银行首席人工智能官、香港科技大学讲席教授，ACM/AAAI/IEEE Fellow

迁移学习是机器学习的一个重要研究分支，有广泛的应用价值。该书叙述简洁明了、内容丰富详实，对希望了解并应用迁移学习的读者很有帮助！

—— 周志华南京大学教授，ACM/AAAI/IEEE Fellow

迁移学习对于增强训练模型的适应性具有重要意义，受到很多学者的关注。这本书深入浅出、系统性地介绍了主要的迁移学习方法，并结合多个领域的应用进行示例分析，为从事相关技术的研究人员提供了非常有益的参考。

——陶建华博士中国科学院自动化研究所研究员，模式识别国家重点实验室副主任

迁移学习的核心思想中国早已有之，如《周易》云：“引而伸之，触类而长之，天下之能事毕矣也”。如今，迁移学习已成为人工智能的一项核心技术，在计算机视觉、自然语言语音处理、强化学习中得到了广泛的应用。本书语言简洁、内容丰富，相信可以启发读者举一反三、触类旁通，更好地解决手头的问题。

——秦涛博士微软亚洲研究院首席研究经理，中国科技大学兼职教授

迁移学习是机器学习的一个重要领域。在计算机视觉，自然语言处理，语音识别，推荐系统等领域有非常广泛的应用。

陈益强和王晋东两位老师通俗易懂地介绍了迁移学习的来龙去脉——不仅涵盖了基本的理论脉络、具体的方法和技术，还介绍了广泛的应用案例和未来的发展方向和前沿问题，为人工智能初学者提供了一份难得的、快速入门的学习和研究资料。

——汪军伦敦大学学院计算机教授

迁移学习，借用了面向对象编程的概念（模型层面的继承）、是对已训练得到的机器学习模型的高效重用，能很大程度避免资源的重复消耗，是大模型民主化的重要途径之一。

本书详细介绍了迁移学习的概念和技术及*的预训练、知识蒸馏、元学习等研究方向，内容上可谓面面俱到。除此之外，本书的一大亮点，是对“两头”的把握：一是源头，抓问题和场景，做到“师出有名”，讲清楚针对什么问题、用在哪里；二是笔头，抓代码与实践，做到“落地结果”，在实战中巩固和深化对技术的理解。相信这本书能带给读者思考与实践的双重乐趣，在算力爆炸的时代反思机器学习的高效之道！

——陈光北京邮电大学副教授，新浪微博@爱可可-爱生活

抢先评论了 “迁移学习导论” 取消回复

还没有评论。

迁移学习导论

作者:王晋东出版社:电子工业出版社出版时间:2021年05月

ISBN: 9787121410895

年中特卖用“SALE15”折扣卷全场书籍85折！可与三本88折，六本78折的优惠叠加计算！全球包邮!

描述

抢先评论了 “迁移学习导论” 取消回复

评论

迁移学习导论

作者:王晋东 出版社:电子工业出版社 出版时间:2021年05月

ISBN: 9787121410895

年中特卖用“SALE15”折扣卷全场书籍85折！可与三本88折，六本78折的优惠叠加计算！全球包邮!

描述

抢先评论了 “迁移学习导论” 取消回复

评论

相关产品

计算机应用基础（基础模块）（Windows 7+Office 2010）（第2版）(含DVD光盘1张)

统计机器学习导论

计算机程序的构造和解释：原书第2版

计算机组成原理（第五版.立体化教材）

作者:王晋东出版社:电子工业出版社出版时间:2021年05月