描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 是国际标准书号ISBN: 28515501
《深入浅出图神经网络:GNN原理解析》
(1)极验AI &图项目团队倾力之作
(2)资深图神经网络专家多年研究和实践总结,白翔、俞栋等学术界和企业界领军人物强烈推荐
(3)从原理、算法、实现、应用4个维度详细讲解图神经网络,理论与实践相结合
作者亲授“图神经网络”直播课,与图书搭配学习效果更佳!
获取方式:
1.微信关注“华章计算机”(微信号:hzbook_jsj)
2.在后台回复关键词:GNN
《深入理解AutoML和AutoDL:构建自动化机器学习与深度学习平台》
(1)作者是资深的AI专家,在机器学习、AutoML、联邦学习、大数据、云计算等领域发表国际论文30余篇,发明专利200余项。
(2)作者是大型金融集团科技公司深度学习平台和AutoML平台负责人,美国佛罗里达大学人工智能博士后,中国人工智能开源软件发展联盟副理事长。
(4)本书得到了腾讯、阿里、字节跳动、微众银行、浙江大学、新智元等企业界、学术界、媒体界的8位资深专家联袂推荐。
(5)从基础理论、核心原理、前沿算法等多个维度全面解读AutoML、AutoDL和元学习
作者亲授“AutoML入门”直播课,与图书搭配学习效果更佳!
获取方式:
1.微信关注“华章计算机”(微信号:hzbook_jsj)
2.在后台回复关键词:AutoML
《深入浅出图神经网络:GNN原理解析》
这是一本从原理、算法、实现、应用4个维度详细讲解图神经网络的著作,在图神经网络领域具有重大的意义。
本书作者是图神经网络领域的资深技术专家,作者所在的公司极验也是该领域的领先者。本书是作者和极验多年研究与实践经验的总结,内容系统、扎实、深入浅出,得到了白翔、俞栋等多位学术界和企业界领军人物的高度评价及强烈推荐。
全书共10章:
第1~4章全面介绍了图、图数据、卷积神经网络以及表示学习等基础知识,是阅读本书的预备知识;
第5~6章从理论的角度出发,讲解了图信号处理和图卷积神经网络,深入剖析了图卷积神经网络的性质,并提供了GCN实现节点分类的实例;
第7~9章全面讲解了图神经网络的各种变体及范式、图分类机制及其实践,以及基于GNN的图表示学习;
第10章介绍了图神经网络的*研究和应用。
作者亲授“图神经网络”直播课,与图书搭配学习效果更佳!
获取方式:
1.微信关注“华章计算机”(微信号:hzbook_jsj)
2.在后台回复关键词:GNN
《深入理解AutoML和AutoDL:构建自动化机器学习与深度学习平台》
这是一部从基础理论、核心原理、前沿算法等多个维度系统、全面讲解AutoML、AutoDL、AutoNAS和元学习的著作。
作者是资深的人工智能专家,大型金融集团科技公司深度学习平台和AutoML平台负责人。本书得到了IEEE Fellow/ACM杰出科学家/香港科技大学教授杨强教授、腾讯AI Lab副主任俞栋、美国佛罗里达大学教授李晓林等8位来自企业界、学术界和媒体界的资深专家的一致好评。它既能让新人理清AutoML的脉络,快速上手机器学习,又能让有经验的读者全面掌握AutoML的知识体系,工作变得更高效。
全书共14章,逻辑上分为四部分:
*部分(第1~2章) 人工智能基础
对人工智能、自动化人工智能的重要概念、发展历程及现状、适用场景、主要的工具和技术等做了全面的介绍,并引出了人工智能技术未来的发展方向——AutoML,这部分是阅读本书的基础。
第二部分(第3~6章) AutoML
主要讲解机器学习和自动化机器学习,核心是AutoML,包含自动化特征工程、自动化模型选择和自动化超参优化3个方面的内容。
第三部分(第7~13章) AutoDL
主要讲解深度学习和自动化深度学习,重点讲解了AutoDL的原理、基于强化学习的AutoDL、基于进化算法的AutoDL、AtuoDL的高阶知识、自动化模型压缩与加速,以及各种核心算法和前沿算法。
第四部分(第14章) 元学习
元学习是人工智能的理想目标,这部分对元学习的概念、流程和各种主流的学习方法都进行了详尽的介绍。
作者亲授“AutoML入门”直播课,与图书搭配学习效果更佳!
获取方式:
1.微信关注“华章计算机”(微信号:hzbook_jsj)
2.在后台回复关键词:AutoML
《深入浅出图神经网络:GNN原理解析》
前言
第1章 图的概述 1
1.1 图的基本定义 1
1.1.1 图的基本类型 2
1.1.2 邻居和度 4
1.1.3 子图与路径 4
1.2 图的存储与遍历 5
1.2.1 邻接矩阵与关联矩阵 5
1.2.2 图的遍历 6
1.3 图数据的应用场景 7
1.4 图数据深度学习 10
1.5 参考文献 13
第2章 神经网络基础 17
2.1 机器学习基本概念 17
2.1.1 机器学习分类 17
2.1.2 机器学习流程概述 18
2.1.3 常见的损失函数 21
2.1.4 梯度下降算法 23
2.2 神经网络 25
2.2.1 神经元 25
2.2.2 多层感知器 27
2.3 激活函数 29
2.3.1 S型激活函数 30
2.3.2 ReLU及其变种 30
2.4 训练神经网络 33
2.4.1 神经网络的运行过程 34
2.4.2 反向传播 34
2.4.3 优化困境 36
2.5 参考文献 38
第3章 卷积神经网络 39
3.1 卷积与池化 39
3.1.1 信号处理中的卷积 39
3.1.2 深度学习中的卷积操作 42
3.1.3 池化 46
3.2 卷积神经网络 46
3.2.1 卷积神经网络的结构 47
3.2.2 卷积神经网络的特点 49
3.3 特殊的卷积形式 51
3.3.1 1×1卷积 51
3.3.2 转置卷积 52
3.3.3 空洞卷积 54
3.3.4 分组卷积 55
3.3.5 深度可分离卷积 55
3.4 卷积网络在图像分类中的应用 56
3.4.1 VGG 56
3.4.2 Inception系列 57
3.4.3 ResNet 60
3.5 参考文献 62
第4章 表示学习 65
4.1 表示学习 65
4.1.1 表示学习的意义 65
4.1.2 离散表示与分布式表示 66
4.1.3 端到端学习是一种强大的表示学习方法 68
4.2 基于重构损失的方法—自编码器 69
4.2.1 自编码器 69
4.2.2 正则自编码器 71
4.2.3 变分自编码器 72
4.3 基于对比损失的方法—Word2vec 75
4.4 参考文献 79
第5章 图信号处理与图卷积神经网络 81
5.1 矩阵乘法的三种方式 81
5.2 图信号与图的拉普拉斯矩阵 83
5.3 图傅里叶变换 85
5.4 图滤波器 90
5.4.1 空域角度 93
5.4.2 频域角度 94
5.5 图卷积神经网络 96
5.6 GCN实战 101
5.7 参考文献 109
第6章 GCN的性质 111
6.1 GCN与CNN的联系 111
6.2 GCN能够对图数据进行端对端学习 115
6.3 GCN是一个低通滤波器 120
6.4 GCN的问题—过平滑 122
6.5 参考文献 127
第7章 GNN的变体与框架 129
7.1 GraphSAGE 129
7.1.1 采样邻居 130
7.1.2 聚合邻居 131
7.1.3 GraphSAGE算法过程 132
7.2 GAT 134
7.2.1 注意力机制 134
7.2.2 图注意力层 137
7.2.3 多头图注意力层 138
7.3 R-GCN 140
7.3.1 知识图谱 140
7.3.2 R-GCN 141
7.4 GNN的通用框架 143
7.4.1 MPNN 143
7.4.2 NLNN 146
7.4.3 GN 147
7.5 GraphSAGE实战 148
7.6 参考文献 153
第8章 图分类 155
8.1 基于全局池化的图分类 155
8.2 基于层次化池化的图分类 156
8.2.1 基于图坍缩的池化机制 157
8.2.2 基于TopK的池化机制 165
8.2.3 基于边收缩的池化机制 168
8.3 图分类实战 169
8.4 参考文献 177
第9章 基于GNN的图表示学习 179
9.1 图表示学习 180
9.2 基于GNN的图表示学习 182
9.2.1 基于重构损失的GNN 183
9.2.2 基于对比损失的GNN 184
9.3 基于图自编码器的推荐系统 188
9.4 参考文献 195
第10章 GNN的应用简介 197
10.1 GNN的应用简述 197
10.2 GNN的应用案例 199
10.2.1 3D视觉 199
10.2.2 基于社交网络的推荐系统 203
10.2.3 视觉推理 205
10.3 GNN的未来展望 208
10.4 参考文献 209
附录A 符号声明 211
《深入理解AutoML和AutoDL:构建自动化机器学习与深度学习平台》
赞誉
前言
第1章 人工智能概述1
1.1 全面了解人工智能1
1.1.1 人工智能定义1
1.1.2 弱人工智能、强人工智能与超人工智能2
1.1.3 人工智能三大主义3
1.1.4 机器学习与深度学习4
1.2 人工智能发展历程5
1.3 深度学习的崛起之路7
1.3.1 人脸识别的起源7
1.3.2 自动驾驶的福音7
1.3.3 超越人类的AI智能体8
1.3.4 懂你的AI8
1.3.5 奔跑、飞行以及玩游戏的AI8
1.3.6 人人都可以创造属于自己的AI8
1.4 深度学习的发展9
1.4.1 计算机视觉9
1.4.2 自然语言处理10
1.4.3 语音识别11
1.5 下一代人工智能11
1.6 参考文献13
第2章 自动化人工智能14
2.1 AutoML概述14
2.1.1 什么是自动化14
2.1.2 AutoML的起源与发展15
2.2 AutoML的研究意义17
2.2.1 AutoML的研究动机17
2.2.2 AutoML的意义和作用18
2.3 现有AutoML平台产品21
2.3.1 谷歌Cloud AutoML21
2.3.2 百度EasyDL23
2.3.3 阿里云PAI24
2.3.4 探智立方DarwinML28
2.3.5 第四范式AI ProphetAutoML29
2.3.6 智易科技30
2.4 参考文献31
第3章 机器学习概述32
3.1 机器学习的发展32
3.1.1 “机器学习”名字的由来32
3.1.2 “机器学习”的前世今生33
3.1.3 “机器学习”的理论基础34
3.2 机器学习的实现方法36
3.2.1 分类问题36
3.2.2 回归问题38
3.2.3 聚类问题39
3.3 自动化机器学习40
3.3.1 机器学习面临的问题40
3.3.2 为什么会产生AutoML41
3.4 参考文献41
第4章 自动化特征工程43
4.1 特征工程43
4.1.1 什么是特征43
4.1.2 什么是特征工程44
4.2 特征工程处理方法45
4.2.1 特征选择45
4.2.2 数据预处理47
4.2.3 特征压缩48
4.3 手工特征工程存在的问题49
4.4 自动化特征工程50
4.4.1 什么是自动化特征工程50
4.4.2 机器学习和深度学习的特征工程51
4.5 自动化特征工程生成方法52
4.5.1 深度特征合成算法52
4.5.2 Featuretools自动特征提取52
4.5.3 基于时序数据的自动化特征工程56
4.6 自动化特征工程工具67
4.6.1 自动化特征工程系统67
4.6.2 自动化特征工程平台71
4.7 参考文献75
第5章 自动化模型选择76
5.1 模型选择76
5.2 自动化模型选择77
5.2.1 基于贝叶斯优化的自动化模型选择78
5.2.2 基于进化算法的自动化模型选择84
5.2.3 分布式自动化模型选择86
5.2.4 自动化模型选择的相关平台92
5.3 自动集成学习94
5.3.1 集成学习基础94
5.3.2 集成学习之结合策略97
5.3.3 自动化模型集成98
5.4 参考文献99
第6章 自动化超参优化101
6.1 概述101
6.1.1 问题定义103
6.1.2 搜索空间103
6.1.3 搜索策略103
6.1.4 评价预估104
6.1.5 经验迁移加速105
6.2 基本方法105
6.2.1 网格搜索105
6.2.2 随机搜索105
6.3 基于模型的序列超参优化106
6.3.1 代理模型的选择108
6.3.2 代理模型的更新108
6.3.3 新超参组的选择109
6.3.4 基于高斯过程回归的序列超参优化111
6.3.5 基于随机森林算法代理的序列超参优化112
6.3.6 基于TPE算法的序列超参优化114
6.3.7 SMBO的进阶技巧114
6.4 基于进化算法的自动化超参优化115
6.4.1 基于进化策略的自动化超参优化115
6.4.2 基于粒子群算法的自动化超参优化116
6.5 基于迁移学习的超参优化加速方法117
6.5.1 经验迁移机制117
6.5.2 经验迁移衰退机制117
6.5.3 经验迁移权重机制117
6.5.4 优化过程的试点机制118
6.6 参考文献118
第7章 深度学习基础120
7.1 深度学习简介120
7.1.1 什么是神经元120
7.1.2 人工神经网络的发展历程121
7.1.3 深度学习方法123
7.2 卷积神经网络简介123
7.2.1 卷积层123
7.2.2 池化层125
7.2.3 全连接层126
7.3 CNN经典模型126
7.3.1 LeNet126
7.3.2 AlexNet127
7.3.3 VGGNet128
7.3.4 GoogLeNet129
7.3.5 ResNet130
7.3.6 DenseNet131
7.4 循环神经网络132
7.4.1 基本循环神经模型132
7.4.2 LSTM模型133
7.4.3 GRU模型134
7.5 参考文献134
第8章 自动化深度学习概述136
8.1 深度学习vs自动化深度学习136
8.2 什么是NAS136
8.2.1 问题定义137
8.2.2 搜索策略139
8.2.3 加速方案140
8.3 NAS方法分类140
第9章 基于强化学习的AutoDL142
9.1 强化学习基础142
9.1.1 强化学习简介142
9.1.2 基本要素及问题定义144
9.1.3 发展历史144
9.1.4 基本方法146
9.2 两类基本模型147
9.2.1 TD经典算法148
9.2.2 DQN系列算法149
9.2.3 策略梯度算法152
9.3 强化学习之Actor-Critic系列154
9.3.1 Actor-Critic算法154
9.3.2 确定性策略梯度155
9.3.3 深度确定性策略梯度157
9.3.4 异步优势Actor-Critic算法158
9.3.5 近端策略优化160
9.3.6 分布式近端策略优化164
9.4 基于强化学习的自动搜索166
9.5 基本搜索方法166
9.5.1 基于层的搜索166
9.5.2 基于块的搜索169
9.5.3 基于连接的搜索171
9.6 进阶搜索方法173
9.6.1 逆强化学习173
9.6.2 图超网络174
9.6.3 蒙特卡洛树搜索175
9.6.4 知识提炼(教师网络)177
9.7 参考文献179
第10章 基于进化算法的AutoDL181
10.1 启发式算法181
10.1.1 随机搜索182
10.1.2 近邻搜索183
10.1.3 进化计算187
10.1.4 启发式算法的局限性189
10.2 初代进化算法190
10.2.1 基本术语190
10.2.2 基础算子191
10.2.3 遗传算法196
10.2.4 进化策略198
10.2.5 进化规划199
10.3 其他近代进化算法200
10.3.1 遗传编程算法簇200
10.3.2 群体算法—以PSO为例205
10.3.3 文化基因算法207
10.3.4 差分进化算法208
10.3.5 分布估计算法208
10.4 进化神经网络209
10.4.1 简介209
10.4.2 神经网络编码方式210
10.4.3 竞争约定211
10.4.4 网络结构的创新性212
10.4.5 NAS之进化算法212
10.5 细粒度的神经进化(NEAT算法)213
10.5.1 基因编码214
10.5.2 基因的可追溯性216
10.5.3 通过物种形成保护创新结构216
10.6 粗粒度的神经进化(CoDeep-NEAT算法)218
10.6.1 DeepNEAT算法218
10.6.2 CoDeepNEAT算法219
10.7 block-level的进化220
10.7.1 Genetic CNN算法220
10.7.2 CGP-CNN方法222
10.8 基于node-level的网络架构进化224
10.8.1 思想简介224
10.8.2 基本算法设计225
10.8.3 信息复用与加速226
10.9 基于NAS搜索空间的网络架构进化227
10.9.1 思想简介227
10.9.2 基本算法设计227
10.9.3 信息复用与加速228
10.10 基于层次拓扑表示的网络进化方法228
10.10.1 思想简介228
10.10.2 分级表示229
10.10.3 随机的层次分级进化230
10.11 参考文献230
第11章 AutoDL高阶233
11.1 搜索加速之权值共享法233
11.1.1 ENAS233
11.1.2 基于稀疏优化的NAS235
11.2 基于one-shot模型的架构搜索236
11.2.1 超网络的应用236
11.2.2 基于one-shot的搜索237
11.2.3 实例级架构搜索238
11.2.4 单路径超网络240
11.3 搜索加速之代理评估模型241
11.3.1 代理模型241
11.3.2 PNAS中的LSTM代理242
11.4 基于网络态射法的神经架构搜索244
11.4.1 网络态射的提出244
11.4.2 什么是网络态射244
11.4.3 网络态射 迂回爬山法246
11.5 可微分神经架构搜索247
11.5.1 可微分神经架构搜索的来源247
11.5.2 可微分神经架构搜索的方法248
11.6 参考文献250
第12章 垂直领域的AutoDL252
12.1 AutoCV252
12.1.1 Auto-DeepLab(图像语义分割)252
12.1.2 随机连线神经网络257
12.2 AutoVoice261
12.2.1 关键词定位问题定义261
12.2.2 随机自适应架构搜索原理262
12.2.3 SANAS模型262
12.3 AutoNLP263
12.3.1 什么是自注意力机制263
12.3.2 初识Transformer模型265
12.3.3 Evolved Transformer结构266
12.4 参考文献270
第13章 自动化模型压缩与加速271
13.1 从生物角度看模型压缩的重要性271
13.1.1 人脑神经元的修剪271
13.1.2 大脑的冗余性272
13.1.3 修剪的意义273
13.2 模型压缩发展概述274
13.3 入门级方法:量化技术275
13.3.1 量化技术275
13.3.2 二值化网络276
13.3.3 TensorRT277
13.4 初级方法:修剪法278
13.4.1 修剪法278
13.4.2 修剪与修复279
13.5 中级方法:稀疏化技术281
13.5.1 正则化281
13.5.2 知识精炼281
13.5.3 张量分解281
13.6 高级方法:轻量级模型设计284
13.6.1 简化卷积操作284
13.6.2 深度可分离卷积285
13.6.3 改进的Inception287
13.7 自动化模型压缩技术289
13.7.1 AMC算法289
13.7.2 PocketFlow框架291
13.8 基于AutoDL的轻量级模型292
13.8.1 问题定义292
13.8.2 帕累托最优问题293
13.8.3 进化算法的应用294
13.8.4 强化学习的应用296
13.8.5 可微分架构搜索298
13.9 参考文献300
第14章 元学习302
14.1 什么是元学习302
14.1.1 基本介绍302
14.1.2 经典案例303
14.1.3 深入了解元学习304
14.1.4 元学习应用的发展306
14.2 元学习的通用流程306
14.2.1 基本定义306
14.2.2 流程框架306
14.3 从模型评估中学习307
14.3.1 任务无关推荐308
14.3.2 参数空间设计308
14.3.3 参数转换309
14.3.4 学习曲线310
14.4 从任务属性中学习310
14.4.1 元特征310
14.4.2 学习元特征311
14.4.3 相似任务的热启动优化311
14.4.4 元模型311
14.4.5 管道合成312
14.4.6 是否调整312
14.5 从先前模型中学习312
14.5.1 迁移学习313
14.5.2 神经网络中的元学习313
14.5.3 小样本学习314
14.5.4 监督学习之外的方法315
14.6 基于模型的方法316
14.6.1 记忆增强神经网络316
14.6.2 元网络317
14.6.3 模型无关的元学习方法317
14.6.4 利用注意力机制的方法319
14.6.5 基于时间卷积的方法320
14.6.6 基于损失预测的方法321
14.6.7 元强化学习321
14.7 基于度量的方法322
14.7.1 Siamese网络322
14.7.2 匹配网络324
14.7.3 关系网络324
14.7.4 原型网络325
14.8 基于优化的方法326
14.8.1 基于LSTM网络的元学习者326
14.8.2 未知模型的元学习326
14.8.3 Reptile:可扩展元学习方法327
14.8.4 基于梯度预测的方法327
14.9 参考文献329
结束语332
《深入浅出图神经网络:GNN原理解析》
为何写作本书
近年来,作为一项新兴的图数据学习技术,图神经网络(GNN)受到了非常广泛的关注。2018年年末,发生了一件十分有趣的事情,该领域同时发表了三篇综述类型论文,这种“不约而同”体现了学术界对该项技术的认可。事实上,在2019年的各大顶级学术会议上,与图神经网络有关的论文也占据了相当可观的份额。相信在未来几年,这种流行的趋势会只增不减。
图神经网络技术的出现有其必然性和重要性。在深度神经网络技术兴起的前几年,图像、语音、文本等形式的数据都能在深度学习中被很好地应用,并获得了十分好的效果。这促使大量的相关应用进入了实用阶段,如人脸识别、语音助手、机器翻译等。尽管如此,深度学习一直无法很好地对另一类形式的数据—图数据(或称网络数据)进行有效的适配。作为一类主要用来描述关系的通用数据表示方法,图数据在产业界有着更加广阔的应用场景,在诸如社交网络、电子购物、物联网、生物制药等场景中,都可以找到图数据的影子。将深度学习技术的成功经验迁移到图数据的学习中来,是一种十分自然且必要的需求。
在这样的背景下,图神经网络的出现很好地填补了上述技术空白,实现了图数据与深度学习技术的有效结合,使得深度学习能够在图数据的相关应用场景中继续攻城略地。事实上,纵观这三年,图神经网络技术的相关应用和研究已经拓展到了极其广泛的领域,从视觉推理到开放的阅读理解问题,从药物分子的研发到5G芯片的设计,从交通流量预测到3D点云数据的学习,该项技术都展示出了极其重要且极具渗透性的应用能力,这种能力必将给产业界带来极高的应用价值。
笔者所在公司极验在业务风控的应用场景中,长期奋战在网络攻防对抗的前线,在这样的背景下,不管是主动还是被动,都促使我们不断努力提升数据分析与数据建模的能力,一直以来,我们都期望有一套端对端的模型来高效学习数据中的关系或结构化信息。极验在2017年年中与图神经网络技术结缘,正好提供了这样的契机,在对该项技术进行多番论证并上线到极验的实际业务中后,取得了超出预期的效果,这极大提升了我们对该项技术的热情。同时,为了更好地对这项新技术进行讨论和学习,我们组织了相应的学习社群,大家都表现出了高昂的热情,这份热情激励笔者将更多精力投入到该项技术上,也正因如此,写一本关于图神经网络的书籍的想法应运而生。期望通过本书,让读者朋友对该项技术的来龙去脉有更清晰、全面的认识。如果能产生更大的知识分享成果,那么本书的价值就更高了,这将是对我们的最好回报。
本书读者对象
想学习并初步实践图神经网络技术的读者
想较系统且深入理解图神经网络技术的读者
本书主要内容
本书分为三大部分:
第一部分为基础篇,包括第1~4章,其中第1章由笔者撰写,第2~4章由李彦霖撰写。主要介绍学习图神经网络所需的基础知识,包括图的基本概念、卷积神经网络以及表示学习,帮助初学者更加清晰地认识到图神经网络技术与深度学习技术是一脉相承的。
第二部分为高级篇,包括第5~9章。这部分是本书的重点,主要讲解图卷积神经网络的理论基础和性质、图神经网络的各种变体和框架范式、图分类以及基于GNN的图表示学习。该部分的各章节都有相关的实践案例,为读者规划了完整的从理论到实践的学习路线,帮助读者系统全面地学习图神经网络。这部分有两位作者,理论部分由笔者撰写,实践案例的代码由李彦霖提供。
第三部分为应用篇,即第10章,主要介绍了图神经网络目前的一些应用。图神经网络的应用非常广泛,现实应用场景非常多,但鉴于本书的规划,这里只是略着笔墨,旨在抛砖引玉,让读者对应用场景有一定的认知。这部分由周洋撰写。
最后,每个章节都附有相关的参考文献。
本书特色
本书有如下特色:
(1)详细阐述了图卷积模型的由来,以及什么是频域图卷积和空域图卷积,这是很多初学者学习该技术的第一只“拦路虎”;
(2)集中阐述了图卷积模型的性质,这些性质的解读对读者深入地理解图神经网络技术有着重要的作用;
(3)给出了关键部分的代码,希望能辅助读者清晰理解书中的一些公式里的变量的具体含义。
(4)本书为了帮助读者理解图神经网络的相关概念和技术,提供了很多示意图。
勘误和支持
由于作者的水平有限,编写时间仓促,书中难免会出现一些错误或者不准确的地方,恳请读者批评指正。如果你遇到任何问题,可以访问我们专门为本书创建的技术主页 https://github.com/FighterLYL/GraphNeuralNetwork,我们将尽量为读者提供满意的解答。如果你有更多宝贵的意见,也欢迎发送邮件至邮箱[email protected],期待能够得到你们的真挚反馈。
致谢
首先要感谢这个开放的时代,深度学习技术的爆发离不开产、学、研的紧密结合,在信息开放、知识分享的大背景下,我们每一个人都是其中的受益者。
感谢笔者所在公司极验科技,对本书的写作提供了大力支持,特别是同事谢永芬,完成了书稿所有章节的初排工作,为其中大量的公式和插图付出了许多精力。
感谢机械工业出版社华章公司的编辑杨福川和张锡鹏,在这段时间始终支持我们的写作,他们的耐心和专业引导我们顺利完成了撰写工作。
最后,感谢我的妻子,她理解并支持我这段时间的挑灯写作,家人的关怀是我前进的动力!
刘忠雨
《深入浅出图神经网络:GNN原理解析》
图神经网络能对图数据进行端对端学习,在推理学习、半监督学习以及模型的可解释性等方面有着独特的优势,在图数据分析领域备受瞩目。本书扎实的理论知识将帮助读者打下坚实的基础,有针对性的实战应用能指导读者进行实操。仔细研读本书,一定会使GNN的学习事半功倍。
——白翔 华中科技大学电信学院教授
虽然图神经网络的蓬勃发展还是*近几年的事,但它已经成功应用在适合用图表示的诸多领域,比如社交网络、知识系统、物联网等。本书作者结合自己在图神经网络领域多年的研发经历,系统地介绍了图表示、卷积网络和图神经网络(尤其是图卷积模型)的基本知识,并在此基础上阐述了图卷积模型的各种框架、变体、性质和应用。对于有兴趣了解图神经网络技术及其应用的读者,本书将会是一本有益的参考书。
——俞栋(博士) IEEE Fellow,腾讯公司杰出科学家、腾讯AI LAB副主任
深度学习时代,图计算与神经网络天然地结合到了一起,为人工智能的发展注入了新的动力,在学术界和企业界都有着极其广阔的发展前景。本书从理论与实践的双重维度对GNN进行了全面讲解,深入浅出。同时,书中还提供了实践案例和关键部分的PyTorch源码,方便读者动手实战,全方位地帮助读者掌握图神经网络的知识和技能。
——王彦博 龙盈智达首席数据科学家/剑桥大学计算机系访问学者
图神经网络将端到端的训练推理模式应用到了图数据上,突破了传统图像、语音等领域深度学习的知识边界。本书从图神经网络的基础出发,内容涵盖图神经网络的各种框架、变体以及实战案例和应用场景,是作者在图神经网络领域的耕耘成果和经验积累,也是读者全面而系统地学习GNN技术的不二之选。
——王健宗(博士) 中国人工智能开源软件发展联盟副理事长/
深圳市金融智能机器人研究中心常务副主任/《深入理解AutoML和AutoDL》作者
《深入理解AutoML和AutoDL:构建自动化机器学习与深度学习平台》
自动化机器学习是未来人工智能的一个重要发展方向,值得我们关注和学习。本书作者王健宗博士是机器学习方面的资深研究者和实践者,在本书中,他不仅讲解了AutoML的基础理论知识,还详细分析了近几年AutoDL方面*前沿的算法和技术,提供了很好的方法与思路参考。想要系统研究AutoML并把握其*技术趋势的读者,本书不容错过。
—杨强 IEEE Fellow/IAPR Fellow/AAAS Fellow/ACM杰出科学家/微众银行首席人工智能官/香港科技大学计算机与工程系教授
人工智能技术将会重塑很多行业,而人工智能的自动化将极大地加速这一进程。本书作者王健宗博士是人工智能领域的知名专家,兼具深厚的理论功底和丰富的实践经验,一直致力于让AI无处不在。他的这本专著深入浅出地总结了人工智能自动化的基本理论、框架和技术,对研究和应用人工智能自动化的专业人士和初学者来说都是一本不可多得的参考书。
—俞栋 腾讯AI Lab副主任/西雅图人工智能实验室负责人
AutoML可以使机器学习的调参建模流程实现自动化,大大降低机器学习的门槛,让用户在没有丰富机器学习经验的情况下也能开发机器学习模型,大大缩短创建模型的时间。王健宗博士的这本书不仅非常系统、深入地讲解了AutoML和AutoDL的理论知识和核心技术,而且给出了具体的工程实践方法。对于想学习AutoML和AutoDL技术或搭建自动化机器学习平台的读者来讲,本书有很大的参考价值。
—李晓林 美国佛罗里达大学教授/同盾科技副总裁兼人工智能研究院院长
自动化机器学习探索一种“学习的学习”模式,既是国际学术界热点研究问题,也是工业界急需的核心技术。本书是国内*AI专家王健宗博士在实践中摸索出的自动化机器学习理论、方法与系统框架,具有极高的学术和应用价值。
—陈为 教授/博导/浙江大学计算机学院副院长
AutoML在机器学习的发展过程中一直是研究者的梦想,让模型的超参数甚至模型结构本身就可以通过学习过程自动探索到*解。王健宗等著的这本AutoML专著涵盖自动化特征工程、自动化超参优化,以及神经网络架构搜索等前沿技术方法。从理论和实践双重维度,对自动化机器学习做了全面介绍,对工程实践也有很好的指导意义。
—李磊 字节跳动人工智能实验室总监
AutoML的概念于2012年由学术界提出,当时的目的是解决编程时人工调校参数的问题。在谷歌、微软等公司的大力推动下,目前AutoML的研究越来越深入,应用越来越广泛。AutoML可以帮助选择模型并选择超参数,成为机器学习和AI自动化和平民化的重要方向。王博士的这本书填补了AutoML中文图书的空白,从理论与实践的双重维度,对AutoML和AutoDL的入门知识和进阶知识做了全面介绍,值得一读!
—陈继东 蚂蚁金服ZOLOZ全球可信身份平台负责人/资深数据专家
AutoML是当前AI领域的前沿方向之一,由谷歌等巨头引领,让深度学习的使用更趋自动化、民主化,是降低机器学习门槛的一大利器。王健宗博士查阅并解读了近百篇论文,详尽介绍了*前沿的AutoML算法和技术,本书堪称打开AutoML和AutoDL深入学习之门的神奇钥匙。
—杨静 新智元创始人兼CEO
如今,自动化机器学习技术已经风靡全球。模型选择、特征工程、调参等工作自动化之后,普通民众学习AI以及专业人士运用AI的效率得到了极大提升。王博士既是奋斗在科研一线的AI专家,又是大型金融集团科技公司的AI项目负责人,理论与实践能力均炉火纯青,写这本书再适合不过。相信很多人能从本书中受益。
—周磊(July) 七月在线创始人兼CEO
《深入理解AutoML和AutoDL:构建自动化机器学习与深度学习平台》
为什么要写这本书
“人工智能”“机器学习”“深度学习”“联邦学习”“自动化”等已经成为互联网行业使用最频繁的词汇,在人工智能发展日益成熟的今天,越来越多的研究者将目标聚焦于“自动化”。出于对AutoML技术出现的振奋和对人工智能的热情与投入,我们逐渐萌生了撰写这本书的想法,我们想让更多的人了解AutoML,了解我们身边最前沿的技术和知识,最终能够让天下没有难的AI,实现普惠AI。如果一定要问我们写这本书的原因,我觉得可以归结为如下三点:
首先,已经有多家互联网公司发布了AutoML平台,毫无疑问AutoML已经成为目前各大公司的“护城河”,我们希望通过本书来揭开AutoML平台的神秘面纱。基于AutoML平台,专业编程人员和非专业人员均可快速创建项目并训练模型,但是,由于国内至今还没有一本关于AutoML算法介绍的书籍,平台用户只知其然却不知其所以然。
其次,我们想要通过本书建立一套完整的AutoML知识体系。很多AutoML从业者懂技术,但是缺少一套完整的知识体系来支撑自己的核心技术,有鉴于此,我们在开始撰写本书前做的第一件事就是建立知识体系,包括自动化机器学习、神经架构搜索的核心算法、自动化模型压缩、模型调参、深度学习的垂直领域应用以及元学习等。这套知识体系可以帮助很多从业者认清技术方向,也可以帮助初期从业者选择研究领域。我们期望有更多人来为AutoML这个诞生仅仅一年半的新技术添砖加瓦,共建AutoML生态。
最后,我们希望这本书能为更多非专业人员带来价值。本书的初期定位是AutoML入门书籍,换句话说,我们撰写的初衷是想为更多不懂算法但是热爱AI技术的爱好者提供一些思路和理解角度。因此,我们在本书中尽量使用白话来解释算法思想,从人工智能的初期发展到AutoML技术的成熟,可以让每一个非技术人员快速理解AutoML。
对于本书,我们倾注了很多热情和心血,从2017年年底AutoML技术开始出现就开始深入探索,接着起草最初书稿框架到成型历时一年多,其中经过了多次章节结构调整和修改,查阅并解读近百篇AI前沿论文,才有了今天大家看到了这本书。在本书中,我们从0到1介绍了AutoML技术的方方面面,希望这本书能带给你惊喜。
读者对象
本书适用于非计算机专业研究人员、期望转型AI领域的技术爱好者,同样也适用于初级、中级和高级的人工智能算法工程师、项目经理和产品经理等。
本书特色
AutoML技术的发展日新月异,诸多科学家和研究者会在论文中发表自己的研究成果,但是目前国内还没有一本讲解AutoML发展和技术的书籍。本书聚焦于AutoML,从无到有地介绍了AutoML的发展过程以及相关的算法。本书涉及AutoML技术的多个方面,从AutoML到AutoDL,最后延伸到元学习,为读者提供了一套完整的知识体系。
如何阅读这本书
本书是关于自动化人工智能的一本入门级书籍,书中涵盖了大部分基础知识,因此非专业人士也可以读懂。自动化人工智能的最重要的两个分支是自动化机器学习和自动化深度学习,因此,本书的核心和聚焦在这两大研究领域,旨在为专业人士和刚入门的学者提供一些研究方向和思路。
从逻辑上,全书一共分为四个部分。
第一部分(第1~2章)是关于人工智能的基础概述,并介绍了现有的AutoML平台。
第二部分(第3~6章)是自动化机器学习,这里的机器学习是指统计机器学习,这一部分主要介绍了基本的机器学习知识以及自动化特征工程、自动化模型选择和自动化超参优化。
第三部分(第7~13章)是自动化深度学习,众所周知,近年来深度学习的研究开展得如火如荼,为了拓展读者的知识领域和研究思路,我们在这一部分花费了大量的篇幅来介绍近几年最前沿的算法和技术,这也是全书最核心的章节。
第四部分(第14章)是关于元学习的内容,我们认为元学习应该是独立于统计机器学习和深度学习的一个研究领域,因为元学习跳出了学习“结果”的这种思想,学习的是“学习过程”,这也是自动化人工智能的理想目标。因此,我们将元学习单独作为一个部分,作为全书内容的升华,读者可以在本书的引导下展开更深入的研究。
我们将本书的重点内容罗列为以下几点:
1)自动化特征工程生成方法,分别是深度特征合成算法、Featuretools自动特征提取以及基于时序特征的自动化特征工程。
2)自动化模型选择方法,包括贝叶斯优化算法、进化算法、分布式优化等。
3)自动化超参优化,主要有序列超参优化、进化算法的运用以及迁移学习方法。
4)神经架构搜索,主要搜索算法有强化学习和进化算法。
5)神经架构搜索加速方案,包括权值共享法、超网络、网络态射法、代理评估模型以及可微分神经架构搜索。
6)模型压缩和加速方案,包括量化、修剪法、稀疏化以及轻量级模型设计。
专业读者或具体从业者可根据自己的研究领域以及感兴趣情况选择以上部分内容重点阅读。对于非专业读者,本书中也有最基本的算法入门介绍,可以将本书作为一本AutoML入门书籍进行全书通读。
勘误和支持
本书并没有涵盖AutoML研究领域的全部知识,因为这个领域的知识体系之庞大,不是一本书就可以介绍完的。譬如我们书中所涉及的图计算网络、超网络、蒙特卡洛树搜索以及元学习都可以成为一个独立的研究课题。在AutoML技术的发展过程中,很多前沿算法会不断被提出和更新,因此书中的内容会存在一定的局限性。
本书的很多思想和知识体系都是作者基于自己的理解建立的,难免会出现理解不当或者不准确的地方,恳请读者批评指正。如果你有更多的宝贵意见,欢迎发送邮件至邮箱
[email protected],我们会认真采纳你的意见和建议。这本书的结束并不意味着我们的研究就此结束,我们还需要不断挖掘其中的精华与奥妙,期待能够得到你们的真挚反馈和支持。
致谢
在本书的撰写和研究期间,感谢多名AutoML技术爱好者(赵淑贞、尚迪雅、曾昱为、吴文启、唐彦玺、张君婷、贺凡等)的参与支持。
感谢出版社对本书的耐心修订和整理,没有他们,就没有今天这本书的出版。
最后,我要感谢读者,感谢读者对我们的信任。我们尽最大努力想要给大家呈现一本逻辑清晰、技术易懂的入门书籍,感谢读者选择了这本书,选择就是对我们最大的信任。
谨以此书献给AutoML的技术爱好者和研究者们!
王健宗
2019年8月于深圳
评论
还没有评论。