描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787111622888
编辑推荐
·紧跟前沿技术:基于视觉的技术已经从感知模式转变为可以理解现实世界的智能系统,并且成为该领域的创新企业和技术人员需要掌握的重要技术。
·理论结合实践:不仅包含对卷积神经网络(CNN)的全面介绍,而且分享了CNN在计算机视觉方面的应用经验,包括图像分类、目标检测、语义分割、场景理解和图像生成等案例。
·专为新手打造:不要求读者具备相关背景知识,非常适合有兴趣快速了解CNN模型的学生、程序员、工程师和研究者阅读。
·理论结合实践:不仅包含对卷积神经网络(CNN)的全面介绍,而且分享了CNN在计算机视觉方面的应用经验,包括图像分类、目标检测、语义分割、场景理解和图像生成等案例。
·专为新手打造:不要求读者具备相关背景知识,非常适合有兴趣快速了解CNN模型的学生、程序员、工程师和研究者阅读。
内容简介
本书自成一体,如果你既想了解CNN的原理,又想获得将CNN应用于计算机视觉的一手经验,那么本书将非常适合阅读。书中对CNN进行了全面介绍,首先是神经网络的基本概念:训练、正则化和优化。然后讨论了各种各样的损失函数、网络层和流行的CNN架构,回顾了评价CNN的不同技术,并介绍了一些常用的CNN工具和库。此外,本书还分析了CNN在计算机视觉中的应用案例,包括图像分类、对象检测、语义分割、场景理解和图像生成。
目 录
译者序
前言
致谢
作者简介
第1章简介
11什么是计算机视觉
111应用案例
112图像处理与计算机视觉
12什么是机器学习
121为什么需要深度学习
13本书概览
第2章特征和分类器
21特征和分类器的重要性
211特征
212分类器
22传统特征描述符
221方向梯度直方图
222尺度不变特征变换
223加速健壮特征
224传统的手工工程特征的局限性
23机器学习分类器
231支持向量机
232随机决策森林
24总结
第3章神经网络基础
31引言
32多层感知机
321基础架构
322参数学习
33循环神经网络
331基础架构
332参数学习
34与生物视觉的关联
341生物神经元模型
342神经元的计算模型
343人工神经元与生物神经元
第4章卷积神经网络
41引言
42神经网络层
421预处理
422卷积层
423池化层
424非线性
425全连接层
426转置卷积层
427感兴趣区域的池化层
428空间金字塔池化层
429局部特征聚合描述符层
4210空间变换层
43CNN损失函数
431交叉熵损失函数
432SVM铰链损失函数
433平方铰链损失函数
434欧几里得损失函数
4351误差
436对比损失函数
437期望损失函数
438结构相似性度量
第5章CNN学习
51权重初始化
511高斯随机初始化
512均匀随机初始化
513正交随机初始化
514无监督的预训练
515泽维尔(Xavier)初始化
516ReLU敏感的缩放初始化
517层序单位方差
518有监督的预训练
52CNN的正则化
521数据增强
522随机失活
523随机失连
524批量归一化
525集成模型平均
5262正则化
5271正则化
528弹性网正则化
529最大范数约束
5210早停
53基于梯度的CNN学习
531批量梯度下降
532随机梯度下降
533小批量梯度下降
54神经网络优化器
541动量
542涅斯捷罗夫动量
543自适应梯度
544自适应增量
545RMSprop
546自适应矩估计
55CNN中的梯度计算
551分析微分法
552数值微分法
553符号微分法
554自动微分法
56通过可视化理解CNN
561可视化学习的权重
562可视化激活
563基于梯度的可视化
第6章CNN架构的例子
61LeNet
62AlexNet
63NiN
64VGGnet
65GoogleNet
66ResNet
67ResNeXt
68FractalNet
69DenseNet
第7章CNN在计算机视觉中的应用
71图像分类
711PointNet
72目标检测与定位
721基于区域的CNN
722快速RCNN
723区域建议网络
73语义分割
731全卷积网络
732深度反卷积网络
733DeepLab
74场景理解
741DeepContext
742从RGBD图像中学习丰富的特征
743用于场景理解的PointNet
75图像生成
751生成对抗网络
752深度卷积生成对抗网络
753超分辨率生成对抗网络
76基于视频的动作识别
761静止视频帧的动作识别
762双流CNN
763长期递归卷积网络
第8章深度学习工具和库
81Caffe
82TensorFlow
83MatConvNet
84Torch7
85Theano
86Keras
87Lasagne
88Marvin
89Chainer
810PyTorch
第9章结束语
91本书概要
92未来研究方向
术语表
参考文献
前言
致谢
作者简介
第1章简介
11什么是计算机视觉
111应用案例
112图像处理与计算机视觉
12什么是机器学习
121为什么需要深度学习
13本书概览
第2章特征和分类器
21特征和分类器的重要性
211特征
212分类器
22传统特征描述符
221方向梯度直方图
222尺度不变特征变换
223加速健壮特征
224传统的手工工程特征的局限性
23机器学习分类器
231支持向量机
232随机决策森林
24总结
第3章神经网络基础
31引言
32多层感知机
321基础架构
322参数学习
33循环神经网络
331基础架构
332参数学习
34与生物视觉的关联
341生物神经元模型
342神经元的计算模型
343人工神经元与生物神经元
第4章卷积神经网络
41引言
42神经网络层
421预处理
422卷积层
423池化层
424非线性
425全连接层
426转置卷积层
427感兴趣区域的池化层
428空间金字塔池化层
429局部特征聚合描述符层
4210空间变换层
43CNN损失函数
431交叉熵损失函数
432SVM铰链损失函数
433平方铰链损失函数
434欧几里得损失函数
4351误差
436对比损失函数
437期望损失函数
438结构相似性度量
第5章CNN学习
51权重初始化
511高斯随机初始化
512均匀随机初始化
513正交随机初始化
514无监督的预训练
515泽维尔(Xavier)初始化
516ReLU敏感的缩放初始化
517层序单位方差
518有监督的预训练
52CNN的正则化
521数据增强
522随机失活
523随机失连
524批量归一化
525集成模型平均
5262正则化
5271正则化
528弹性网正则化
529最大范数约束
5210早停
53基于梯度的CNN学习
531批量梯度下降
532随机梯度下降
533小批量梯度下降
54神经网络优化器
541动量
542涅斯捷罗夫动量
543自适应梯度
544自适应增量
545RMSprop
546自适应矩估计
55CNN中的梯度计算
551分析微分法
552数值微分法
553符号微分法
554自动微分法
56通过可视化理解CNN
561可视化学习的权重
562可视化激活
563基于梯度的可视化
第6章CNN架构的例子
61LeNet
62AlexNet
63NiN
64VGGnet
65GoogleNet
66ResNet
67ResNeXt
68FractalNet
69DenseNet
第7章CNN在计算机视觉中的应用
71图像分类
711PointNet
72目标检测与定位
721基于区域的CNN
722快速RCNN
723区域建议网络
73语义分割
731全卷积网络
732深度反卷积网络
733DeepLab
74场景理解
741DeepContext
742从RGBD图像中学习丰富的特征
743用于场景理解的PointNet
75图像生成
751生成对抗网络
752深度卷积生成对抗网络
753超分辨率生成对抗网络
76基于视频的动作识别
761静止视频帧的动作识别
762双流CNN
763长期递归卷积网络
第8章深度学习工具和库
81Caffe
82TensorFlow
83MatConvNet
84Torch7
85Theano
86Keras
87Lasagne
88Marvin
89Chainer
810PyTorch
第9章结束语
91本书概要
92未来研究方向
术语表
参考文献
前 言
本书的主旨是从计算机视觉的角度全面深入地介绍卷积神经网络(Convolutional Neural Network,CNN)的主题,覆盖了与理论和实践方面相关的初级、中级和高级主题。
本书共分为9章。第1章介绍计算机视觉和机器学习主题,并介绍与它们高度相关的应用领域。第1章的后半部分提出本书的主题“深度学习”。第2章介绍背景知识,展示流行的手工提取的特征和分类器,这些特征和分类器在过去二十年间仍然在计算机视觉中很受欢迎。其中包括的特征描述符有尺度不变特征变换(ScaleInvariant Feature Transform,SIFT)、方向梯度直方图(Histogram of Oriented Gradients,HOG)、加速健壮特征(SpeededUp Robust Features,SURF),涵盖的分类器有支持向量机(Support Vector Machine,SVM)和随机决策森林(Random Decision Forest,RDF)等。
第3章描述神经网络,并涵盖与其架构、基本构建块和学习算法相关的初步概念。第4章以此为基础,全面介绍CNN架构。该章介绍各种CNN层,包括基本层(例如,子采样、卷积)以及更高级的层(例如,金字塔池化、空间变换)。第5章全面介绍学习和调整CNN参数的技巧,还提供可视化和理解学习参数的工具。
第6章及其后的内容更侧重于CNN的实践方面。具体来说,第6章介绍目前的CNN架构,它们在许多视觉任务中表现出色。该章还深入分析并讨论它们的相对优缺点。第7章进一步深入探讨CNN在核心视觉问题中的应用。对于每项任务,该章都会讨论一组使用CNN的代表性工作,并介绍其成功的关键因素。第8章介绍深度学习的流行软件库,如Theano、TensorFlow、Caffe和Torch。最后,第9章介绍深度学习的开放性问题和挑战,并简要总结本书内容。
本书的目的不是提供关于CNN在计算机视觉中的应用的文献综述。相反,它简洁地涵盖了关键概念,并提供了当前为解决计算机视觉的实际问题而设计的模型的鸟瞰图。
本书共分为9章。第1章介绍计算机视觉和机器学习主题,并介绍与它们高度相关的应用领域。第1章的后半部分提出本书的主题“深度学习”。第2章介绍背景知识,展示流行的手工提取的特征和分类器,这些特征和分类器在过去二十年间仍然在计算机视觉中很受欢迎。其中包括的特征描述符有尺度不变特征变换(ScaleInvariant Feature Transform,SIFT)、方向梯度直方图(Histogram of Oriented Gradients,HOG)、加速健壮特征(SpeededUp Robust Features,SURF),涵盖的分类器有支持向量机(Support Vector Machine,SVM)和随机决策森林(Random Decision Forest,RDF)等。
第3章描述神经网络,并涵盖与其架构、基本构建块和学习算法相关的初步概念。第4章以此为基础,全面介绍CNN架构。该章介绍各种CNN层,包括基本层(例如,子采样、卷积)以及更高级的层(例如,金字塔池化、空间变换)。第5章全面介绍学习和调整CNN参数的技巧,还提供可视化和理解学习参数的工具。
第6章及其后的内容更侧重于CNN的实践方面。具体来说,第6章介绍目前的CNN架构,它们在许多视觉任务中表现出色。该章还深入分析并讨论它们的相对优缺点。第7章进一步深入探讨CNN在核心视觉问题中的应用。对于每项任务,该章都会讨论一组使用CNN的代表性工作,并介绍其成功的关键因素。第8章介绍深度学习的流行软件库,如Theano、TensorFlow、Caffe和Torch。最后,第9章介绍深度学习的开放性问题和挑战,并简要总结本书内容。
本书的目的不是提供关于CNN在计算机视觉中的应用的文献综述。相反,它简洁地涵盖了关键概念,并提供了当前为解决计算机视觉的实际问题而设计的模型的鸟瞰图。
评论
还没有评论。