描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787111650454
前言
第1章 AI时代:图像技术背景知识 1
1.1 人工智能的前世今生 2
1.2 AI与CV的相互融合之路 3
1.3 AI图像处理技术 5
1.4 本章小结 7
第2章 武器和铠甲:开发环境配置 8
2.1 来自传承的馈赠:OpenCV开源跨平台机器视觉库 8
2.1.1 OpenCV的整体概念 9
2.1.2 OpenCV的应用领域 9
2.1.3 OpenCV的编程语言 9
2.1.4 OpenCV支持的系统 10
2.1.5 OpenCV的线上资源 10
2.2 召唤萌宠:Python语言的“制霸”之路 10
2.2.1 Python语言的发展 11
2.2.2 Python 2.7.X版本和3.X版本的区别 11
2.2.3 本书采用的Python版本 13
2.3 铸剑:基于PyCharm的系统环境配置 14
2.3.1 PyCharm在Mac OS系统下的安装和配置 14
2.3.2 Mac OS系统下Anaconda的安装和配置 17
2.4 牛刀小试:一起动手来写个例子吧 19
2.5 本章小结 21
第3章 开启星辰大海:图像处理技术基础知识 22
3.1 图像的基本概念 23
3.1.1 像素的概念 23
3.1.2 图像的构成 24
3.1.3 图像的格式 24
3.1.4 理解图像的位深和通道的概念 25
3.2 图像的读取、显示和存储操作 26
3.2.1 OpenCV基本图像处理函数 26
3.2.2 Python读取一张图片并显示和存储 27
3.3 从像素出发构建二维灰度图像 28
3.3.1 NumPy科学计算库 28
3.3.2 创建二维灰度图像 30
3.3.3 灰度图像的遍历 31
3.4 灰度图像和彩色图像的变换 32
3.4.1 图像的颜色空间 32
3.4.2 彩色图像的通道分离和混合 33
3.4.3 彩色图像的通道分离和混合程序示例 34
3.4.4 彩色图像的二值化 35
3.4.5 彩色图像的遍历 37
3.4.6 彩色图像和灰度图像的转换 38
3.5 图像的几何变换 40
3.5.1 图像几何变换的基本概念 40
3.5.2 插值算法 41
3.5.3 图像的缩放 42
3.5.4 图像的平移 44
3.5.5 图像的旋转 45
3.5.6 图像的镜像变换 47
3.6 图像色彩空间基础知识 48
3.6.1 图像的色调、色相、饱和度、亮度和对比度 48
3.6.2 RGB色彩空间 49
3.6.3 HSV色彩空间 49
3.6.4 HSI色彩空间 50
3.7 图像的直方图 50
3.7.1 图像直方图的基本概念 50
3.7.2 绘制灰度图像的直方图 51
3.7.3 绘制彩色图像的直方图 53
3.7.4 图像直方图均衡化 54
3.7.5 图像直方图反向投影 56
3.8 本章小结 58
第4章 First Blood:第一波项目实战 59
4.1 抖音哈哈镜 60
4.1.1 抖音的哈哈镜效果 60
4.1.2 哈哈镜的原理 61
4.1.3 哈哈镜的程序实现 61
4.2 给你一张老照片 64
4.2.1 怀旧风格算法原理 64
4.2.2 怀旧风格程序实现 65
4.3 给自己画一张文艺范的素描 66
4.3.1 轮廓检测算法原理 66
4.3.2 素描风格算法原理 67
4.3.3 素描风格算法的程序实现 68
4.4 来一张油画吧 69
4.4.1 图像油画算法原理 69
4.4.2 图像油画算法的程序实现 69
4.5 如何打马赛克 72
4.5.1 马赛克算法原理 72
4.5.2 马赛克算法的程序实现 72
4.6 打造自己的专属肖像漫画 74
4.6.1 漫画风格算法原理 74
4.6.2 漫画风格算法的程序实现 74
4.7 本章小结 76
第5章 Double Kill:视频图像处理理论和项目实战 77
5.1 视频处理流程和原理 78
5.1.1 视频的捕获和存储 78
5.1.2 提取视频中的某些帧 79
5.1.3 将图片合成为视频 80
5.1.4 多个视频合并 81
5.2 抖音中的视频抖动效果设计 82
5.2.1 视频抖动的原理 82
5.2.2 视频抖动的程序实现 83
5.3 抖音中的视频闪白效果设计 85
5.3.1 视频闪白的原理 86
5.3.2 视频闪白的程序实现 87
5.4 抖音中的视频霓虹效果设计 90
5.4.1 视频霓虹的原理 90
5.4.2 视频霓虹效果的程序实现 91
5.5 抖音中的视频时光倒流效果设计 94
5.5.1 视频时光倒流的原理 94
5.5.2 视频时光倒流的程序实现 94
5.6 抖音中的视频反复效果设计 95
5.6.1 视频反复的原理 95
5.6.2 视频反复的程序实现 95
5.7 抖音中的视频慢动作效果设计 96
5.7.1 视频慢动作的原理 97
5.7.2 视频慢动作的程序实现 97
5.8 视频人物漫画风格滤镜设计 98
5.9 本章小结 99
第6章 Triple Kill:基于机器学习的人脸识别 100
6.1 机器学习的基本概念 101
6.1.1 机器学习的目的 101
6.1.2 机器学习的内容 102
6.1.3 机器学习的作用 103
6.1.4 如何使用机器学习获得的东西 105
6.1.5 使用机器学习方法的时机 106
6.1.6 总结机器学习的基本概念 108
6.2 机器学习中的图像预处理流程 112
6.2.1 一个经典的机器学习图像处理实例 112
6.2.2 人脸识别机器学习Model训练思路 113
6.2.3 正样本图像预处理 113
6.2.4 负样本图像预处理 121
6.3 人脸检测机器学习算法设计 123
6.3.1 图像特征 123
6.3.2 Harr-like特征求值加速算法 127
6.3.3 图像分类器 128
6.3.4 人脸检测的训练算法流程 130
6.3.5 人脸检测的检测算法流程 131
6.4 训练人脸检测分类器并测试 132
6.4.1 训练准备 132
6.4.2 开始训练 133
6.4.3 模型测试 134
6.5 本章小结 135
第7章 Quatary Kill:基于深度学习的人脸识别 137
7.1 深度学习的基本概念 138
7.1.1 深度学习简介 138
7.1.2 深度学习和机器学习的区别 139
7.1.3 深度学习入门概念 141
7.2 卷积神经网络 147
7.2.1 卷积的原理 147
7.2.2 池化层的原理 150
7.2.3 全连接层的原理 150
7.2.4 一个经典的CNN网络结构 152
7.3 手写数字分类项目 153
7.3.1 训练环境的搭建 153
7.3.2 训练数据的准备 154
7.3.3 训练网络的搭建 155
7.3.4 训练代码 158
7.3.5 深度学习基础知识扩展 159
7.4 基于深度学习的人脸识别解决方案 161
7.4.1 数据的准备 161
7.4.2 数据集的读取和处理 163
7.4.3 网络的搭建 165
7.4.4 Model的训练过程 167
7.4.5 Model的测试过程 168
7.5 本章小结 169
第8章 Penta Kill:人脸图像美颜算法项目实战 170
8.1 人脸磨皮算法 171
8.1.1 图像滤波算法和效果 171
8.1.2 人脸磨皮算法设计 176
8.2 图像的色彩空间 180
8.2.1 RGB和HSV色彩空间基础知识 180
8.2.2 RGB和HSV转换的数学描述和函数实现 180
8.2.3 图片中的颜色检测 181
8.3 人脸美白算法设计 183
8.3.1 通过图层混合实现图像美白算法 184
8.3.2 通过beta参数调整实现图像美白算法 185
8.3.3 通过颜色查找表实现图像美白算法 187
8.4 人脸的手动祛痘算法设计 189
8.4.1 图像修复算法介绍 190
8.4.2 图像修复的原理 190
8.4.3 通过图像修复算法实现手动祛痘 191
8.5 本章小结 193
第9章 Legendary:AI时代图像算法应用新生态 194
9.1 抖音中的图像技术 195
9.1.1 抖音中的图像应用概览 195
9.1.2 抖音中的人脸检测技术 195
9.1.3 抖音中的人脸检测技术应用 197
9.1.4 抖音中的人体检测技术 201
9.1.5 抖音中的人体检测技术应用 201
9.1.6 抖音中的视频技术 202
9.1.7 抖音中的图像技术总结 205
9.2 美颜和美妆类App中的图像技术 206
9.2.1 美颜和美妆类App图像应用概览 207
9.2.2 五官的调整 207
9.2.3 美妆算法 208
9.2.4 染发算法 209
9.2.5 五官分析 211
9.2.6 美颜相机和美妆相机中图像技术的一些总结 213
9.3 电商中的图像技术 213
9.3.1 电商中的图像技术应用概览 213
9.3.2 虚拟穿戴技术和商品3D展示 214
9.3.3 尺寸测量 214
9.3.4 相似商品推荐及以图搜图 215
9.4 本章小结 216
在人工智能领域,计算机视觉是人工智能最重要的部分之一,尤其是人脸图像处理领域涌现了商汤、旷视、云丛、抖音等多家独角兽企业。2014年,中国人脸识别行业的市场规模为49亿元;2018年,中国人脸识别行业的市场规模为131亿元,年均复合增长率为37%。这充分显示了人脸图像处理技术的巨大商用价值,大量的人脸相关应用不断涌现。
本书结合大量的实际案例,从Python图像处理开始讲起,再到机器学习、深度学习的理论和应用,通过由浅入深、图文并茂的讲解及项目实战,提高读者的理论水平和代码实践能力。
本书特色
1. 入门门槛低,学习曲线平滑
本书从搭建环境学起,首先介绍Windows、Linux和Mac OS这三种环境下编译环境的配置和安装;然后介绍与Python数据编程相关的基础知识、图像处理算法基础及常用函数;接着介绍机器学习和深度学习的基础理论;最后通过Python复现各种常用软件中的人脸图像算法应用。本书学习曲线平滑,适合深度学习和机器学习的零基础读者阅读。
2. 通过对比、理论结合实践的方式讲解,适合新手学习
对于一个新知识点的出现,本书通过对比的方式给出了概念或原理,让读者能举一反三,拓宽知识面;对深度学习的一些理论和概念,本书结合目前热门软件中的图像算法应用实例,让读者能边学习边实践,缩短了新手与老手之间的差距。
3. 内容丰富、实用,主次分明
本书所选案例涉猎广泛而丰富,算法案例紧跟当前潮流,如抖音、天天P图、美颜相机中的各种图像处理技巧,沿着“需求→算法设计→代码实现”的思路讲解,书中大量既丰富又生动有趣的例子简单易学,可直接上手。在代码示例中,不仅包含了模型构建和设计的核心思想,同时也兼顾了新手容易犯错的细节展示。此外,本书还介绍了一些在工程实践中常用的设计与实现技巧,以提高内容的实用性,增强案例与实际系统设计和实现过程的联系。
4. 图文搭配合理、生动有趣,全程伴随实战
本书从实战出发,介绍了大约60多个案例,脉络清晰,没有太多枯燥的理论讲解,而是以一位资深AI算法工程师手把手带读者入门做项目的方式,讲述了新手如何入门成为AI图像算法工程师,遇到项目如何入手去做,以及目前抖音中好玩的效果是如何一步步通过算法设计做出来的,沿着Python基础、图像处理技术、视频处理技术、机器学习、深度学习及各类图像美颜算法的思路去实现。目前,各种App中美颜算法大行其道,希望通过作者有趣的讲解,可以带领读者探索其中的各种算法设计小技巧。
本书内容
第1章?AI时代:图像技术背景知识
本章首先介绍了什么是人工智能以及人工智能的历史和发展,通过介绍AI的发展历史和一些标志性事件,概述了目前中国AI技术的发展现状;然后介绍了计算机视觉技术及其分类和应用,让读者在第1章就可以体会到AI在生活中无处不在,以及它无限的发展前景。
第2章?武器和铠甲:开发环境配置
本章主要介绍了本书涉及的开发语言和编译环境,详细介绍了OpenCV开源库及Python不同版本间的区别,带领读者手把手搭建PyCharm和Anaconda编译环境,完成基本的AI开发环境配置,并且在不同环境下装载各种需要的工具包。
第3章?开启星辰大海:图像处理技术基础知识
本章详细介绍了图像处理技术的基础知识,每个知识点对应多个Python实例,让读者能够轻松完成图像的旋转、平移、镜像和缩放等一系列操作。
第4章?First Blood:第一波项目实战
本章以大量的Python实例展示了基于图像处理算法可以实现的多种效果,介绍了抖音哈哈镜、照片怀旧、素描、油画、卡通化和马赛克处理等一系列项目的算法原理和代码实现,有趣地展示了图像处理技术中的各种玩法。
第5章?Double Kill:视频图像处理理论和项目实战
本章介绍了视频图像处理技术的原理和流程,并以大量的实例展示了如何根据抖音的一些视频特效来设计算法以实现其效果,完成了抖音视频中抖动、闪白、霓虹、时光倒流、视频反复、慢动作和Black magic等效果设计。
第6章?Triple Kill:基于机器学习的人脸识别
本章详细介绍了机器学习的基础知识,从一个机器学习的实例出发,讲述了机器学习的原理,以及什么时候使用机器学习。本章以经典的人脸识别算法为例,从数据准备到算法设计原理,再到最后的训练,完成一个完整的机器学习项目。
第7章?Quatary Kill:基于深度学习的人脸识别
本章详细介绍了深度学习的基本概念和使用场景;讲解了深度学习和机器学习的区别,并以LeNet-5
评论
还没有评论。