描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787121355486
内容简介
计算机视觉是目前研究*为活跃的领域之一,很多新的技术和方法在计算机视觉中得到了成功的应用。本书以计算机视觉相关技术和模型为主线,讨论当前这个领域的传统技术和方法。全书共分9章。第1章介绍了人类视觉系统及其计算模型、JND模型和显著性模型。第2章介绍了图像的基本表示,以及底层特征,包括边缘、角点、几何形状的检测。第3章介绍了基本的色度学及颜色模型,并对图像形成过程进行了详细介绍。随后介绍了齐次坐标及坐标变换相关的知识,*后介绍了相机位置、方向和姿态估计。后几章分别对运动场与光流相关的基础和算法、应用进行了论述。第4章介绍了从图像序列中估计2D和3D运动。第5章介绍了差分运动分析及基于核函数的视觉跟踪。第6章介绍了蒙特卡洛罗运动分析。第7章介绍了铰链运动分析及人体姿态估计。第8章介绍了多目标跟踪算法。 计算机视觉相关技术在实际生活中有着广泛的应用,并在*近几年取得巨大进展,尤其是深度学习技术的发展使更多人对计算机视觉领域产生了兴趣。本书可供计算机科学与技术、软件工程、多媒体处理和信号处理等领域中关注计算机视觉、图像处理、模式识别及其应用的工程技术人员和科研教学人员阅读,也可以作为研究生和大学高年级学生学习的教材和参考书。
目 录
目 录
第1章 人类视觉系统及其建模 1
1.1 人类视觉系统概述 1
1.2 人眼基本视觉特性 4
1.2.1 色彩空间 4
1.2.2 多通道特性 5
1.2.3 亮度自适应 5
1.2.4 对比度敏感度函数(CSF) 5
1.2.5 视觉掩盖效应 6
1.3 立体视觉的形成过程 7
1.3.1 立体视觉系统的生理特性 7
1.3.2 立体视觉系统的心理特性 9
1.3.3 立体视觉生理特性与心理特性的关系 9
1.4 JND模型与显著性模型 10
1.4.1 JND模型 10
1.4.2 显著性模型 18
1.5 本章小结 19
参考文献 19
第2章 图像边缘、角点检测 20
2.1 图像 20
2.2 灰度位图图像和彩色位图图像 21
2.3 GIF图像格式和JPEG压缩 24
2.3.1 GIF图像 25
2.3.2 JPEG图像 25
2.4 图像边缘及其检测 31
2.4.1 边缘类型 32
2.4.2 边缘检测的三个阶段 33
2.4.3 滤波操作及双边滤波器 33
2.4.4 差分操作 36
2.4.5 边缘检测操作 37
2.4.6 非极大值抑制操作 37
2.4.7 几种典型的边缘检测算法 38
2.5 图像角点检测 41
2.5.1 图像角点检测基本原理及Harris角点检测 41
2.5.2 FAST角点检测 44
2.6 形状检测 44
2.6.1 标准Hough变换及圆形Hough变换 44
2.6.2 广义Hough变换 46
2.6.3 三种常见Hough变换的区别 47
2.7 直线段检测 47
本章小结 49
参考文献 50
第3章 图像形成与相机几何 51
3.1 引言 51
3.1.1 色度学 51
3.1.2 三色视觉原理 52
3.2 图像的形成 53
3.2.1 取景透镜 54
3.2.2 抗混淆滤波器 57
3.2.3 红外截止滤波器和保护玻璃 59
3.2.4 图像传感器 59
3.3 齐次坐标 64
3.4 小孔成像 65
3.5 图像坐标系、相机坐标系和世界坐标系 67
3.5.1 图像坐标系 67
3.5.2 相机坐标系 68
3.5.3 世界坐标系 68
3.6 坐标平移、伸缩和旋转 68
3.6.1 坐标平移 68
3.6.2 坐标伸缩 69
3.6.3 坐标旋转 69
3.6.4 绕任意轴旋转的矩阵表示 71
3.6.5 罗德里格斯公式 74
3.6.6 四元数 75
3.6.7 旋转矩阵与旋转角的关系 76
3.6.8 矩阵与运动的对应关系 77
3.6.9 世界坐标系到图像坐标系的变换 78
3.6.10 透视相机模型 80
3.7 相机标定 80
3.7.1 相机畸变 83
3.7.2 相机标定 84
3.8 相机位置和方向 84
3.9 姿态估计 86
本章小结 88
习题3 88
参考文献 88
第4章 从图像序列中估计2D和3D运动 89
4.1 运动场与光流场 89
4.2 光流计算 91
4.2.1 光流方程 91
4.2.2 经典光流计算方法 92
4.2.3 光流算法的改进 94
4.3 光流技术的研究难点及策略 100
4.3.1 鲁棒的光流估计 101
4.3.2 压缩感知及基于稀疏模型的光流估计 103
4.3.3 光流分布信息的统计研究 105
4.4 3D运动恢复 107
4.4.1 透视投影成像的几何模型 107
4.4.2 3D运动场 109
4.4.3 3D运动场到2D速度场的投影转换模型 111
4.4.4 2D速度场的局部拟合及三维运动参数估计 112
参考文献 114
第5章 差分运动分析及基于核函数的视觉跟踪 120
5.1 基于差分方法的光流计算 120
5.1.1 光流通用模型 120
5.1.2 模型数据项 121
5.1.3 HS模型的计算方法 126
5.2 视觉跟踪概述 128
5.2.1 视觉跟踪的分类 129
5.2.2 视频目标跟踪算法的组成 130
5.3 核函数跟踪算法 130
5.3.1 核函数跟踪算法的问题及发展 131
5.3.2 目标及候选图像区域表达 131
5.3.3 相似性度量 132
5.3.4 概率密度估计 133
5.3.5 Mean Shift 136
5.3.6 误差平方和测度及牛顿迭代 140
5.3.7 多极值点问题 141
5.4 本章小结 142
参考文献 142
第6章 蒙特卡罗运动分析 145
6.1 跟踪问题的形式化表示 145
6.1.1 Markov性假设 145
6.1.2 三个基本模型 145
6.1.3 推测过程 146
6.2 卡尔曼滤波与广义卡尔曼滤波 146
6.2.1 状态空间表示法和参数估计 146
6.2.2 标准卡尔曼滤波 147
6.2.3 广义卡尔曼滤波 148
6.3 特征表示与提取 149
6.3.1 颜色直方图 149
6.3.2 形状特征 150
6.3.3 尺度不变轮廓特征的表示 150
6.4 目标跟踪方法评价指标 152
6.5 序列Monte Carlo方法研究 153
6.5.1 Monte Carlo方法 153
6.5.2 重要性采样 156
6.5.3 序列重要性采样 158
6.5.4 退化问题 160
6.5.5 粒子滤波的改进方法 164
6.5.6 粒子滤波的收敛性 170
6.6 本章小结 174
参考文献 175
第7章 铰链运动分析及人体姿态估计 180
7.1 人体模型及观测似然函数 180
7.1.1 人体模型 180
7.1.2 观测似然函数 181
7.2 模拟退火的粒子滤波算法 181
7.2.1 粒子滤波算法 181
7.2.2 模拟退火 182
7.2.3 模拟退火的粒子滤波 183
7.3 非参数置信传播算法 183
7.4 人体运动估计 184
7.4.1 条件随机场理论 185
7.4.2 人体与外观模型 190
7.5 本章小结 192
参考文献 192
第8章 多目标跟踪算法 194
8.1 多目标跟踪概述 194
8.1.1 目标运动模型 195
8.2 数据关联算法 197
8.2.1 近邻域法 197
8.2.2 概率数据关联算法 197
8.2.3 联合概率数据互联算法 199
8.2.4 其他的经典算法 201
8.3 基于图模型的多目标跟踪算法 202
8.3.1 概率图模型分析 203
8.3.2 概率图模型推理方法 213
8.4 本章小结 224
参考文献 225
第1章 人类视觉系统及其建模 1
1.1 人类视觉系统概述 1
1.2 人眼基本视觉特性 4
1.2.1 色彩空间 4
1.2.2 多通道特性 5
1.2.3 亮度自适应 5
1.2.4 对比度敏感度函数(CSF) 5
1.2.5 视觉掩盖效应 6
1.3 立体视觉的形成过程 7
1.3.1 立体视觉系统的生理特性 7
1.3.2 立体视觉系统的心理特性 9
1.3.3 立体视觉生理特性与心理特性的关系 9
1.4 JND模型与显著性模型 10
1.4.1 JND模型 10
1.4.2 显著性模型 18
1.5 本章小结 19
参考文献 19
第2章 图像边缘、角点检测 20
2.1 图像 20
2.2 灰度位图图像和彩色位图图像 21
2.3 GIF图像格式和JPEG压缩 24
2.3.1 GIF图像 25
2.3.2 JPEG图像 25
2.4 图像边缘及其检测 31
2.4.1 边缘类型 32
2.4.2 边缘检测的三个阶段 33
2.4.3 滤波操作及双边滤波器 33
2.4.4 差分操作 36
2.4.5 边缘检测操作 37
2.4.6 非极大值抑制操作 37
2.4.7 几种典型的边缘检测算法 38
2.5 图像角点检测 41
2.5.1 图像角点检测基本原理及Harris角点检测 41
2.5.2 FAST角点检测 44
2.6 形状检测 44
2.6.1 标准Hough变换及圆形Hough变换 44
2.6.2 广义Hough变换 46
2.6.3 三种常见Hough变换的区别 47
2.7 直线段检测 47
本章小结 49
参考文献 50
第3章 图像形成与相机几何 51
3.1 引言 51
3.1.1 色度学 51
3.1.2 三色视觉原理 52
3.2 图像的形成 53
3.2.1 取景透镜 54
3.2.2 抗混淆滤波器 57
3.2.3 红外截止滤波器和保护玻璃 59
3.2.4 图像传感器 59
3.3 齐次坐标 64
3.4 小孔成像 65
3.5 图像坐标系、相机坐标系和世界坐标系 67
3.5.1 图像坐标系 67
3.5.2 相机坐标系 68
3.5.3 世界坐标系 68
3.6 坐标平移、伸缩和旋转 68
3.6.1 坐标平移 68
3.6.2 坐标伸缩 69
3.6.3 坐标旋转 69
3.6.4 绕任意轴旋转的矩阵表示 71
3.6.5 罗德里格斯公式 74
3.6.6 四元数 75
3.6.7 旋转矩阵与旋转角的关系 76
3.6.8 矩阵与运动的对应关系 77
3.6.9 世界坐标系到图像坐标系的变换 78
3.6.10 透视相机模型 80
3.7 相机标定 80
3.7.1 相机畸变 83
3.7.2 相机标定 84
3.8 相机位置和方向 84
3.9 姿态估计 86
本章小结 88
习题3 88
参考文献 88
第4章 从图像序列中估计2D和3D运动 89
4.1 运动场与光流场 89
4.2 光流计算 91
4.2.1 光流方程 91
4.2.2 经典光流计算方法 92
4.2.3 光流算法的改进 94
4.3 光流技术的研究难点及策略 100
4.3.1 鲁棒的光流估计 101
4.3.2 压缩感知及基于稀疏模型的光流估计 103
4.3.3 光流分布信息的统计研究 105
4.4 3D运动恢复 107
4.4.1 透视投影成像的几何模型 107
4.4.2 3D运动场 109
4.4.3 3D运动场到2D速度场的投影转换模型 111
4.4.4 2D速度场的局部拟合及三维运动参数估计 112
参考文献 114
第5章 差分运动分析及基于核函数的视觉跟踪 120
5.1 基于差分方法的光流计算 120
5.1.1 光流通用模型 120
5.1.2 模型数据项 121
5.1.3 HS模型的计算方法 126
5.2 视觉跟踪概述 128
5.2.1 视觉跟踪的分类 129
5.2.2 视频目标跟踪算法的组成 130
5.3 核函数跟踪算法 130
5.3.1 核函数跟踪算法的问题及发展 131
5.3.2 目标及候选图像区域表达 131
5.3.3 相似性度量 132
5.3.4 概率密度估计 133
5.3.5 Mean Shift 136
5.3.6 误差平方和测度及牛顿迭代 140
5.3.7 多极值点问题 141
5.4 本章小结 142
参考文献 142
第6章 蒙特卡罗运动分析 145
6.1 跟踪问题的形式化表示 145
6.1.1 Markov性假设 145
6.1.2 三个基本模型 145
6.1.3 推测过程 146
6.2 卡尔曼滤波与广义卡尔曼滤波 146
6.2.1 状态空间表示法和参数估计 146
6.2.2 标准卡尔曼滤波 147
6.2.3 广义卡尔曼滤波 148
6.3 特征表示与提取 149
6.3.1 颜色直方图 149
6.3.2 形状特征 150
6.3.3 尺度不变轮廓特征的表示 150
6.4 目标跟踪方法评价指标 152
6.5 序列Monte Carlo方法研究 153
6.5.1 Monte Carlo方法 153
6.5.2 重要性采样 156
6.5.3 序列重要性采样 158
6.5.4 退化问题 160
6.5.5 粒子滤波的改进方法 164
6.5.6 粒子滤波的收敛性 170
6.6 本章小结 174
参考文献 175
第7章 铰链运动分析及人体姿态估计 180
7.1 人体模型及观测似然函数 180
7.1.1 人体模型 180
7.1.2 观测似然函数 181
7.2 模拟退火的粒子滤波算法 181
7.2.1 粒子滤波算法 181
7.2.2 模拟退火 182
7.2.3 模拟退火的粒子滤波 183
7.3 非参数置信传播算法 183
7.4 人体运动估计 184
7.4.1 条件随机场理论 185
7.4.2 人体与外观模型 190
7.5 本章小结 192
参考文献 192
第8章 多目标跟踪算法 194
8.1 多目标跟踪概述 194
8.1.1 目标运动模型 195
8.2 数据关联算法 197
8.2.1 近邻域法 197
8.2.2 概率数据关联算法 197
8.2.3 联合概率数据互联算法 199
8.2.4 其他的经典算法 201
8.3 基于图模型的多目标跟踪算法 202
8.3.1 概率图模型分析 203
8.3.2 概率图模型推理方法 213
8.4 本章小结 224
参考文献 225
前 言
前 言
自马尔的计算机视觉理论以来,计算机视觉技术作为与现实生活紧密联系的重要研究内容引起了国内外学术界的普遍关注。随着计算能力和技术的发展,其实际应用越发促进了计算机视觉技术的进一步发展。从开始的实时人脸识别到目标检测与跟踪,从传统的手工提取特征到基于深度学习方式的提取特征,计算机视觉技术正从理论研究及在可控环境中的应用逐步向更广泛的普及应用扩展。
本书叙述了计算机视觉相关的一些基本理论和技术,主要包括人类视觉系统的建模、JND模型和显著性模型、图像的形成过程及相关的坐标变换、图像的底层特征提取与检测、图像中物体运动与关联分析等。由于篇幅有限,本书对深度学习内容介绍较少,后续版本会增加深度学习的内容。本书内容及材料主要来自已公开发表的文献、书籍、网上博客,以及编者所在单位的硕士生、博士生的相关工作。本书对相关的基本原理有较详细的介绍,具有较好的实用性,对本领域研究人员和科技工程人员均有较好的参考价值。
本书第1、2、3章由刘绍辉撰写,其余各章由姜峰撰写。全书由刘绍辉、姜峰统稿。在本书的撰写和校稿过程中,计算机科学与技术学院智能接口与人机交互技术研究中心的博士生和硕士生做了大量工作,在此一并表示感谢。本书的完成特别感谢电子工业出版社的章海涛主任,正是在他的鼓励和帮助下才得以完成全文的撰写。
限于编者水平,书中不足之处在所难免,敬请广大读者批评指正。再版时将会逐一考虑进行更正。
编 者
2018年9月
于哈尔滨工业大学
自马尔的计算机视觉理论以来,计算机视觉技术作为与现实生活紧密联系的重要研究内容引起了国内外学术界的普遍关注。随着计算能力和技术的发展,其实际应用越发促进了计算机视觉技术的进一步发展。从开始的实时人脸识别到目标检测与跟踪,从传统的手工提取特征到基于深度学习方式的提取特征,计算机视觉技术正从理论研究及在可控环境中的应用逐步向更广泛的普及应用扩展。
本书叙述了计算机视觉相关的一些基本理论和技术,主要包括人类视觉系统的建模、JND模型和显著性模型、图像的形成过程及相关的坐标变换、图像的底层特征提取与检测、图像中物体运动与关联分析等。由于篇幅有限,本书对深度学习内容介绍较少,后续版本会增加深度学习的内容。本书内容及材料主要来自已公开发表的文献、书籍、网上博客,以及编者所在单位的硕士生、博士生的相关工作。本书对相关的基本原理有较详细的介绍,具有较好的实用性,对本领域研究人员和科技工程人员均有较好的参考价值。
本书第1、2、3章由刘绍辉撰写,其余各章由姜峰撰写。全书由刘绍辉、姜峰统稿。在本书的撰写和校稿过程中,计算机科学与技术学院智能接口与人机交互技术研究中心的博士生和硕士生做了大量工作,在此一并表示感谢。本书的完成特别感谢电子工业出版社的章海涛主任,正是在他的鼓励和帮助下才得以完成全文的撰写。
限于编者水平,书中不足之处在所难免,敬请广大读者批评指正。再版时将会逐一考虑进行更正。
编 者
2018年9月
于哈尔滨工业大学
评论
还没有评论。