描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787111662365
读者对象:
1、人工智能领域的技术工程师,尤其是机器学习和深度学习领域的工程师;
2、高校人工智能专业学生、教师以及研究人员;
3、希望了解人工智能尤其是深度学习的技术工程师和产品经理。
(1)本书由百度官方出品,PaddlePaddle总架构师共同创作。
(2)百度公司CTO王海峰博士作序,张钹院士、李未院士、百度集团副总裁吴甜联袂推荐
(3)“内容全面、由浅入深、注重实践”,结合新近PaddlePaddle技术版本,详细讲解了PaddlePaddle的技术和原理,以及如何从零开始快速掌握深度学习。
本书由百度官方出品,百度公司CTO王海峰博士作序,张钹院士、李未院士、百度集团副总裁吴甜联袂推荐。
本书遵循“内容全面、由浅入深、注重实践”的原则,基于飞桨PaddlePaddle深度学习平台,较为全面地覆盖了学习深度学习技术所必须具备的基础知识以及深度学习主要核心技术,包括相关的数学基础、Python编程基础、机器学习基础以及正向/反向传播算法、卷积神经网络、循环神经网络等,尽量做到读懂一本书即可达到“零基础”到“全精通”。
在章节安排上,考虑读者的特点和认知规律,在知识架构和案例穿插的设计上确保循序渐进、由浅入深。同时,本书提供了大量的深度学习实战案例,覆盖了当前计算机视觉、自然语言处理、个性化推荐等领域主流应用典型的算法,每章都单独配以飞桨代码实现,详细解析实操过程,手把手引导读者开展实践练习、深入掌握相关知识。
本书提供配套代码合集,详情请访问https://aistudio.baidu.com/aistudio/projectdetail/518424
序
前言
部分 数学与编程基础篇
第1章 数学基础与Python库 2
1.1 Python是进行人工智能编程的主要语言 2
1.2 数学基础 3
1.2.1 线性代数基础 3
1.2.2 微积分基础 7
1.3 Python库的操作 14
1.3.1 NumPy操作 14
1.3.2 Matplotlib操作 19
1.4 本章小结 23
第2章 深度学习概论与飞桨入门 24
2.1 人工智能、机器学习和深度学习 25
2.1.1 人工智能 25
2.1.2 机器学习 26
2.1.3 深度学习 26
2.2 深度学习的发展历程 27
2.2.1 神经网络的次高潮 27
2.2.2 神经网络的次寒冬 28
2.2.3 神经网络的第二次高潮 30
2.2.4 神经网络的第二次寒冬 30
2.2.5 深度学习的来临 31
2.2.6 深度学习崛起的时代背景 31
2.3 深度学习的应用场景 31
2.3.1 图像与视觉 32
2.3.2 语音识别 32
2.3.3 自然语言处理 33
2.3.4 个性化推荐 33
2.4 常见的深度学习网络结构 34
2.4.1 全连接网络结构 34
2.4.2 卷积神经网络 34
2.4.3 循环神经网络 35
2.5 机器学习回顾 35
2.5.1 线性回归的基本概念 36
2.5.2 数据处理 37
2.5.3 模型概览 38
2.5.4 效果展示 39
2.6 深度学习框架简介 40
2.6.1 深度学习框架的优势 40
2.6.2 常见的深度学习框架 41
2.6.3 飞桨简介 42
2.6.4 飞桨安装 42
2.6.5 AI Studio 43
2.7 飞桨实现 44
2.8 飞桨服务平台和工具组件 51
2.8.1 PaddleHub 51
2.8.2 X2Paddle 54
2.8.3 PARL 56
2.8.4 EasyDL 61
2.9 本章小结 62
第二部分 深度学习基础篇
第3章 深度学习的单层网络 64
3.1 Logistic回归模型 64
3.1.1 Logistic回归概述 64
3.1.2 损失函数 66
3.1.3 Logistic回归的梯度下降 68
3.2 实现Logistic回归模型 72
3.2.1 NumPy版本 73
3.2.2 飞桨版本 80
3.3 本章小结 88
第4章 浅层神经网络 89
4.1 神经网络 89
4.1.1 神经网络的定义及其结构 89
4.1.2 神经网络的计算 91
4.2 BP算法 96
4.2.1 逻辑回归与BP算法 96
4.2.2 单样本双层神经网络的BP算法 97
4.2.3 多样本神经网络的BP算法 100
4.3 BP算法实践 103
4.3.1 NumPy版本 103
4.3.2 飞桨版本 110
4.4 本章小结 114
第5章 深层神经网络 116
5.1 深层网络介绍 116
5.1.1 深度影响算法能力 116
5.1.2 网络演化过程与常用符号 118
5.2 传播过程 120
5.2.1 神经网络算法核心思想 120
5.2.2 深层网络正向传播过程 120
5.2.3 深层网络反向传播过程 121
5.2.4 传播过程总结 122
5.3 网络的参数 124
5.4 代码实现 125
5.4.1 NumPy版本 125
5.4.2 飞桨版本 128
5.5 本章小结 130
第6章 卷积神经网络 131
6.1 图像分类问题描述 131
6.2 卷积神经网络介绍 132
6.2.1 卷积层 132
6.2.2 ReLU激活函数 136
6.2.3 池化层 137
6.2.4 Softmax分类层 138
6.2.5 主要特点 139
6.2.6 经典神经网络架构 140
6.3 飞桨实现 145
6.3.1 数据介绍 145
6.3.2 模型概览 146
6.3.3 配置说明 146
6.4 本章小结 153
第7章 循环神经网络 154
7.1 任务描述 154
7.2 循环神经网络介绍 155
7.2.1 长短期记忆网络 156
7.2.2 门控循环单元 157
7.2.3 双向循环神经网络 158
7.2.4 卷积循环神经网络 159
7.3 利用飞桨实现机器翻译 159
7.3.1 数据准备 159
7.3.2 柱搜索 163
7.3.3 模型配置 167
7.3.4 模型训练 168
7.3.5 加载训练模型进行预测 169
7.4 本章小结 170
第8章 注意力机制 171
8.1 任务描述 171
8.2 注意力机制介绍 172
8.2.1 Transformer 172
8.2.2 Non-local神经网络 175
8.2.3 Attention Cluster神经网络 176
8.3 利用飞桨实现视频分类 177
8.3.1 Non-local神经网络 177
8.3.2 Attention Cluster 183
8.4 本章小结 195
第9章 算法优化 196
9.1 基础知识 196
9.1.1 训练、验证和测试集 196
9.1.2 偏差和方差 197
9.2 评估 198
9.2.1 选定评估目标 198
9.2.2 迭代过程 199
9.2.3 欠拟合和过拟合 199
9.3 调优策略 199
9.3.1 降低偏差 199
9.3.2 降低方差 204
9.4 超参数调优 209
9.4.1 随机搜索和网格搜索 209
9.4.2 超参数范围 209
9.4.3 分阶段搜索 210
9.4.4 例子:对学习率的调整 210
9.5 本章小结 212
第三部分 飞桨实践篇
第10章 目标检测 214
10.1 任务描述 214
10.2 常见模型解析 217
10.2.1 R-CNN系列 217
10.2.2 YOLO 223
10.2.3 SSD 228
10.3 PaddleDetection应用实践 231
10.3.1 Faster-R-CNN 231
10.3.2 YOLOv3 234
10.4 本章小结 237
第11章 图像生成 238
11.1 任务描述 238
11.1.1 图像生成 238
11.1.2 图像–图像转换 239
11.1.3 文本–图像转换 239
11.2 模型概览 240
11.2.1 图像生成 240
11.2.2 图像–图像 241
11.2.3 文本–图像 246
11.3 PaddleGAN应用实践 248
11.3.1 数据准备 248
11.3.2 参数设置 248
11.3.3 网络结构定义 249
11.3.4 模型训练 253
11.3.5 模型测试 256
11.4 本章小结 257
第12章 情感分析 258
12.1 任务描述 258
12.2 算法原理解析 259
12.2.1 BOW 259
12.2.2 DB-LSTM 259
12.3 情感分析应用实践 261
12.3.1 数据集下载 261
12.3.2 配置模型 262
12.3.3 训练模型 268
12.4 本章小结 273
第13章 机器翻译 274
13.1 任务描述 274
13.2 算法原理解析 275
13.2.1 Seq2Seq 275
13.2.2 Transformer 276
13.3 机器翻译应用实践 287
13.3.1 数据准备 287
13.3.2 模型配置 287
13.3.3 模型训练 289
13.3.4 模型测试 291
13.3.5 模型评估 292
13.4 本章小结 292
第14章 语义表示 293
14.1 任务描述 293
14.2 常见模型解析 294
14.2.1 ELMo 294
14.2.2 ERNIE 296
14.3 ERNIE应用实践 300
14.3.1 数据准备 301
14.3.2 模型配置 301
14.3.3 模型训练 302
14.3.4 模型评估 305
14.4 本章小结 305
第15章 个性化推荐 306
15.1 问题描述 306
15.2 传统推荐方法 307
15.2.1 基于内容的推荐 307
15.2.2 协同过滤推荐 309
15.2.3 混合推荐 310
15.3 深度学习推荐方法 310
15.3.1 YouTube的深度神经网络推荐系统 310
15.3.2 融合推荐系统 312
15.4 个性化推荐系统在飞桨上的实现 315
15.4.1 数据准备 315
15.4.2 模型设计 332
15.4.3 模型训练 358
15.4.4 保存特征 363
15.4.5 模型测试 364
15.5 本章小结 373
为何写作本书
众所周知,深度学习已经成为新一轮人工智能浪潮的重要驱动力量。从大数据到云计算,数据资源的积累、计算性能的提升为以深度学习为代表的新一代人工智能的快速发展和广泛应用奠定了基础。人工智能已经成为当下科技革命和产业变革的重要驱动力,将在人类社会经济和生活中产生广泛而深远的影响。把握人工智能的发展机遇,构筑先发优势,抢占科技制高点,将关乎人类社会发展和国家前途命运。
为把握人工智能发展的重大战略机遇,很多国家纷纷制定了人工智能发展战略和规划,人工智能技术竞争趋于白热化,甚至上升到了国家体系对抗博弈的高度。在这场竞争中,我国有着诸多优势。制度和政策优势有利于人工智能技术创新和产业生态的顶层规划和统筹推进,互联网、物联网等信息技术的普及使得各个行业积累了大量的数据资源和用户群体。在人工智能人才方面,我国还具有人才储备基数大、层次丰富、后备力量充足的优势。但我们也要清醒地看到我国在人工智能领域的差距和挑战,诸如基础理论方法、高端核心器件、开源开放平台、领军人才等方面的短板显著。尤其要建设人工智能强国,我们还需要在数据、算法、芯片和平台等方面形成一系列引领性技术、标准和开源生态,以确保人工智能核心要素的自主可控,规范技术和行业应用,保障人工智能健康发展。
深度学习平台作为人工智能时代的“操作系统”,其自主可控的重要性不言而喻。然而,无论是学术界驱动的代表性深度学习框架Theano(2010,蒙特利尔大学)、Caffe(2013,加州大学伯克利分校),还是由企业主导的深度学习框架TensorFlow(2015,谷歌)、PyTorch(2017,脸书),鲜有中国主导的平台。面对愈演愈烈的国际竞争态势,为了全面提升我国人工智能科技实力,发展和推广类似PaddlePaddle(飞桨)这样自主可控的深度学习开源平台势在必行。本书编写的初衷就是为推动我国人工智能教育,以及人工智能技术的自主可控贡献一份力量。
本书主要特点
本书在编写过程中始终遵循“内容全面、由浅入深、注重实践”的原则。书中较为全面地覆盖了学习深度学习技术所必须具备的基础知识以及主要核心技术,包括相关的数学基础、Python编程基础、机器学习基础以及正向/反向传播算法、卷积神经网络、循环神经网络等,尽量做到读懂一本书即可实现从“零基础”到“全精通”。相关内容的章节安排充分考虑了读者的特点和认知规律,在知识架构和案例穿插的设计上确保循序渐进、由浅入深。本书的另外一个重要特点是提供了大量深度学习实战案例,覆盖当前计算机视觉、自然语言处理、个性化推荐等领域主流的应用和典型的算法,每章都单独配以飞桨代码实现,详细解析实操过程,一步步引导读者开展实践练习,深入掌握相关知识。
本书阅读对象
本书结合国内自主可控的产业级深度学习开源平台飞桨,以通俗易懂的方式向读者介绍深度学习的数学基础、主流模型以及目标识别、机器翻译、个性化推荐等深度学习应用,适合各类读者阅读。本书比较全面地覆盖了深度学习的基础知识和核心算法,可作为初学者了解深度学习的基础教材;同时,书中详细介绍了大量深度学习应用案例及算法实现,可作为高校人工智能专业学生、研究人员以及技术人员(包括开源框架开发者、算法研究者和工程师、应用开发工程师等)深入掌握深度学习技术和飞桨平台开发的参考书。
如何阅读本书
本书一共15章,主要分为三个部分。读者只需要按照章节顺序学习,即可掌握相关知识。
部分为数学与编程基础篇(第1~2章),首先介绍了学习深度学习需要掌握的基础知识,包括数学基础和Python编程基础,其后概述了深度学习发展历史、应用场景,详解了飞桨平台的构成和入门使用。
第二部分为深度学习基础篇(第3~9章),重点介绍了神经网络以及深度网络的主流模型,包括多层感知机、卷积神经网络、循环神经网络等,同时详细讲解了深度学习常用的注意力机制和算法优化策略。
第三部分为飞桨实践篇(第10~15章),分别结合计算机视觉、自然语言处理、个性化推荐等领域中深度学习的主要应用,介绍目前比较经典的深度学习模型以及飞桨实现,帮助读者从入门到精通。
致谢
首先感谢飞桨社区的开发者和生态用户,正是因为你们的热忱和积极贡献,才使得飞桨框架不断演进,成为“智能时代的操作系统”。
感谢百度技术委员会理事长陈尚义先生对本书的推动和支持,也感谢百度深度学习平台部高级总监马艳军对本书技术内容的指导和审阅。
感谢百度工程师周湘阳、邓凯鹏、郭晟、蒋佳军、周波、陈泽裕、吕梦思、孙高峰、刘毅冰、董大祥、党青青提供书中的实战案例与相关代码。
参与本书编写的人员除封面署名作者外还有蒋晓琳、马婧、白世豪、王硕、郜廷权、王立民、武东锟、崔程、王思吉、殷晓婷、马宇晴、李俊、高一杰、胡晟、王嘉凯、沈一凡、雷开宇、石泽宏、曾维佳、孙俊康、彭锦、韩明宇、孙昭等。
刘祥龙
有关深度学习的图书已经有很多,从基础理论、关键技术到实际应用应有尽有,在众多的同类书中,本书的价值与意义在哪里?
深度学习是人工智能的一个子领域,它的崛起改变了人工智能的低迷状态,成为当下科技革命和产业变革的重要驱动力。深度学习与*代靠知识驱动的人工智能不同,它是一个与领域无关的通用技术与工具,只要拥有大数据,任何领域都可以使用,因此推广这项技术至关重要。但在深度学习技术的应用中,将面临亿万级别的海量数据、千万级别的参数、多种多样的模型、高度优化的算法和人工选择的超参数等挑战,给广大开发者和使用者带来诸多困难,因此需要一部通俗易懂的教科书,让大众能很快地掌握这门技术,这本书正是为此目的而撰写的。
本书面向“实战”,书中较全面地介绍了深度学习的基础知识和核心技术,包括数学基础、Python 编程基础、机器学习基础以及正向/反向传播算法、卷积神经网络、循环神经网络等。同时提供了大量实战案例,包括计算机视觉、自然语言处理、个性化推荐等领域的典型应用和算法,并配以飞桨代码实现的相关内容。本书按照循序渐进、由浅入深的认识规律,引导读者了解相关知识,并在此基础上,通过实践练习让大家深入掌握这门技术,可以作为高校学生、研究人员以及技术人员掌握深度学习技术和飞桨平台开发的参考书。
——张钹 中国科学院院士、清华大学人工智能研究院院长
深度学习平台是深度学习领域的“新基建”工程,发展并推广具有自主知识产权的深度学习平台是提升我国人工智能技术、发展人工智能产业的关键举措。飞桨作为百度的自研平台,已发展成为当前主流深度学习平台之一。本书是基于飞桨深度学习的一个及时总结和积极探索,从基本概念到模型实现,从理论知识到工程落地,涵盖了图像领域、自然语言处理领域和推荐系统领域的主流算法模型,并辅以丰富的案例代码,能帮助深度学习的初学者快速入门,也能助力开发者更快地落地产品。同时,本书对理论知识采用循序渐进的展开方式,可供教育工作者在AI教学时参考和使用。
——李未 中国科学院院士
深度学习推动人工智能进入工业化大生产阶段,而源于产业实践的深度学习平台——飞桨为个人开发者和企业开发者提供功能全面、技术领先的平台及服务。百度一直很重视AI人才培养,通过各种培训培养了大量高校AI人才、企业AI架构师;提供学习与实训社区,帮助开发者交流成长;落实深度学习工程师认证标准,培养更多、更高水平的工程师,加速推动产业发展。本书充分融合了深度学习理论与大量的实践案例,循序渐进,帮助读者实现从“零基础”到“全精通”,深入掌握深度学习的知识。
——吴甜 百度集团副总裁、深度学习技术及应用国家工程实验室副主任
评论
还没有评论。