描述
开 本: 16开纸 张: 胶版纸包 装: 精装是否套装: 否国际标准书号ISBN: 9787515325316
编辑推荐
这本书是计算机视觉的“圣经”!如果任何人想要学习计算机视觉的基本内容,一定要以这本书作为起始点。千万不要错过!尤其是,这本经典著作对于书中概念的杰出的介绍方法。我强烈地将这本不可或缺的书推荐给所有学习计算机视觉的人。
内容简介
《机器视觉》从逆问题的角度出发,提出了一整套关于机器视觉的研究方法,其核心是:机器视觉应该基于对成像过程的深刻理解!作为作者在麻省理工学院(MIT)所讲授的机器视觉课程的指定教材,本书已经被使用了近30年,至今仍被欧美许多著名高校所广泛使用。本书提供了一个理解现有方法和技术以及为以后的研究做准备的系统框架,其中包含了很多将机器视觉方法应用于实际问题的内容。全书共包括18章,前13章主要讲述早期视觉的内容,后5章更加关注于:解决一些更加复杂的实际问题。最后,作者将各个章节所介绍的方法整合到一起,搭建了一个可以和周围环境进行交互的“眼-手”系统。书中所用到的数学方法,也都收录在最后的附录中;作为内容的补充和扩展,本书还提供了丰富的练习题。
本书可以作为高等院校相关专业本科生和研究生一年级课程的教材,也可以作为研究人员的参考书籍。
本书可以作为高等院校相关专业本科生和研究生一年级课程的教材,也可以作为研究人员的参考书籍。
目 录
第1章 简介 1.1 机器视觉 1.2 机器视觉的任务 1.3 机器视觉和其他领域的关系 1.4 后续章节的概要 1.5 本章参考文献 1.6 习题 第2章 成像与图像检测 2.1 成像的两个方面 2.1.1 透视投影 2.1.2 正射投影 2.2 亮度 2.3 透镜 2.4 我们的视觉世界 2.5 图像检测 2.5.1 感知颜色 2.5.2 随机性和噪声 2.5.3 图像量化 2.6 本章参考文献 2.7 习题 第3章 二值图:几何性质 3.1 二值图 3.2 简单几何性质 3.2.1 区域的位置 3.2.2 朝向 3.3 投影 3.4 离散二值图 3.5 行程编码 3.6 本章参考文献 3.7 习题 第4章 二值图:拓扑性质 4.1 多个物体 4.1.1 标注图像中的物体 4.1.2 连通性 4.1.3 串行标注算法 4.2 局部计数和迭代修正 4.2.1 局部计数 4.2.2 集合可加性 4.2.3 迭代修正 4.3 本章参考文献 4.4 习题 第5章 区域与图像分割 5.1 设定阈值的方法 5.2 统计直方图 5.3 空间相关性 5.4 图像分割 5.5 使用颜色信息 5.6 合并与分裂 5.7 本章参考文献 5.8 习题 第6章 图像处理:连续图像 6.1 线性移不变系统 6.2 卷积与点扩散函数 6.3 调制传递函数 6.4 Fourier 变换和滤波 6.5 Fourier 变换和卷积 6.6 广义函数与单位冲击函数 6.7 收敛因子与单位冲击函数 6.8 偏微分与卷积 6.9 旋转对称与各向同性算子 6.10 模糊,失焦和运动拖尾 6.11 图像复原与增强 6.12 相关以及功率谱 6.13 最优滤波器与噪声抑制 6.14 图像模型 6.15 本章参考文献 6.16 习题 第7章 图像处理:离散图像 7.1 有限的图像尺寸 7.2 离散图像采样 7.3 采样定理 7.4 离散 Fourier 变换 7.5 循环卷积 7.6 一些有用的结果 7.7 本章参考文献 7.8 习题 第8章 边缘和边缘查找 8.1 图像中的边缘 8.2 微分算子 8.3 离散近似 8.4 局部算子和噪声 8.5 边缘的检测和定位 8.6 结论和例子 8.7 本章参考文献 8.8 习题 第9章 光照与颜色 9.1 物体表面的反射率以及 Land 实验 9.2 Mondrian 图 9.3 复原光照 9.4 求解逆问题 9.5 光照的归一化 9.6 选择阈值 9.7 离散情况下计算光照 9.8 一个物理模型 9.9 本章参考文献 9.10 习题 第10章 反射图:光度立体视觉 10.1 图像亮度 10.2 辐射 10.3 图像的形成 10.4 双向反射分布函数 10.5 连续光源 10.6 物体表面的反射性质 10.7 物体表面的亮度 10.8 物体表面的朝向 10.9 反射图 10.10 图像中的明暗 10.11 明暗图 10.12 光度立体视觉 10.13 估计反射率 10.14 曲面朝向的查询表 10.15 本章参考文献 10.16 习题 第11章 从明暗恢复形状 11.1 从明暗中恢复形状 11.2 特征曲线与初始曲线 11.3 奇异点 11.4 奇异点附近的幂级数 11.5 闭合边界 11.6 球极投影 11.7 松弛方法 11.8 从针状图中恢复景深 11.9 本章参考文献 11.10 习题 第12章 运动场和光流 12.1 运动场 12.2 光流 12.3 光流的光滑性 12.4 填充光流信息 12.5 边界条件 12.6 离散情况 12.7 光流的不连续 12.8 本章参考文献 12.9 习题 第13章 摄影测量和立体视觉 13.1 两张图像之间的差异 13.2 摄影测量 13.3 绝对朝向 13.4 相对朝向 13.5 使用已知的相对朝向 13.6 计算景深 13.7 外部朝向 13.8 内部朝向 13.9 寻找共轭点对 13.10 本章参考文献 13.11 习题 第14章 模式分类 14.1 由一个例子引入 14.2 特征向量 14.3 基本方法 14.4 最近邻分类 14.5 最近中心分类 14.6 实例:白血球分类 14.7 使用概率密度模型设计分类方法 14.8 不同形状的聚类 14.9 聚类的自动形成 14.10 一个童话 14.11 本章参考文献 14.12 习题 第15章 多面体物体 15.1 多面体场景的素描图 15.2 恢复三维结构 15.3 梯度空间 15.4 明暗和梯度空间 15.5 图像分割与多个物体的情况 15.6 标记素描图 15.7 演示:复制一个积木结构 15.8 本章参考文献 15.9 习题 第16章 扩展 Gauss 图 16.1 凸多面体 16.2 Gauss 图 16.3 Gauss 曲率 16.4 扩展 Gauss 图 16.5 扩展 Gauss 图的例子 16.6 离散情况 16.7 圆环面的扩展 Gauss 图 16.8 对单位球面的剖分 16.9 旋转体的扩展 Gauss 图 16.10 一般情况下的 Gauss 曲率 16.11 扩展 Gauss 图的应用 16.12 本章参考文献 16.13 习题 第17章 无源导航 17.1 恢复观测者的运动 17.2 预备知识和技术 17.3 平动的情况 17.4 使用其他的范数形式 17.5 转动的情况 17.6 一般刚体运动的情况 17.7 本章参考文献 17.8 习题 第18章 从容器中抓取零件 18.1 方法总览 18.2 动机 18.3 装着零件的容器 18.4 图像分割 18.5 典型物体模型 18.6 物体表面的透视收缩 18.7 对齐主轴 18.8 非凸的物体 18.9 物体在空间中的姿态 18.10 旋转的表示方法 18.11 朝向统计直方图的匹配 18.12 针状图的二次投影 18.13 对偏离理想情况的矫正 18.14 选择要抓取的物体 18.15 移动机器臂 18.16 “眼 --- 手”坐标系之间的变换 18.17 任意形状的物体 18.18 结论 18.19 结束语 18.20 本章参考文献 18.21 习题 附录: 一些有用的数学工具 A.1 求解三角形 A.2 向量操作 A.3 向量和矩阵的导数 A.4 线性方程组的最小二乘解 A.5 Lagrange 乘子 A.6 变分法 A.7 本附录参考文献 参考文献 索引
前 言
中文版序言
对于《RobotVision》中译本的出版发行,我感到非常兴奋。因为这将使得广大的学生、教师和科研人员可以更容易地接触和了解机器视觉。自从《RobotVision》首次出版以来,将近三十年过去了,机器视觉领域一直在不断地发展和变化着,但是直到现在,始终存在着一种需要,即:寻找一种关于这个领域的统一的研究方法,并且,该方法应该是能够经受住时间考验的。我相信在研究机器视觉的过程中,我们应该思索如下两个问题:1)成像过程的基本原理是什么?2)如何探索对成像过程“求逆”(也就是说,就是从一张图像、多张图像或者图像序列中恢复出关于场景或者观测者的信息)的知识和方法?显然,要做到这一点,我们至少需要理解:光学、运动学和坐标变换。
通过物理模型,我们可以很自然地导出相应的数学公式,然后,通过数学公式,我们可以导出相应的算法。本书的主题包括:
建立起对成像过程的基本理解;
探讨对成像过程进行求逆的方法。
尽管本书包含了许多用于解决机器视觉问题的具体方法,但是,本书所关注的是:建立一种针对不同机器视觉问题的整体解决方法。事实上,许多成功的机器视觉技术,例如:从明暗恢复形状、光流、无源导航等,都是这种“整体解决方法”的具体应用。关注基本原理所带来的一个好处是:真正需要去理解的核心内容变少了,甚至连算法的实现细节都有可能会变成一个“瞬间”就被理解或完成的工作。
最近几年,在机器视觉的应用领域取得了很多实质性的进展,这些进展部分归功于机器学习方法的使用。当然,机器学习结果的好坏依赖于:从图像中所提取出来的特征的“质量”。特征的“描述力”越强,区分效果也就越好;所提取出的特征越有“特点”,所得到的结果也就越好。从这个意义上说,本书所讲述的内容可以被看作是:用于提取“具有物理意义的特征”的方法。还记得当初在写《RobotVision》的序言时,我以“机器视觉是一个年轻的、发展很快的领域”作为开篇的第一句话。这么多年过去了,我们很高兴地看到:直到今天,这句话还像当初我写它时一样正确!
BertholdK.P.Horn
2014年6月于MIT
对于《RobotVision》中译本的出版发行,我感到非常兴奋。因为这将使得广大的学生、教师和科研人员可以更容易地接触和了解机器视觉。自从《RobotVision》首次出版以来,将近三十年过去了,机器视觉领域一直在不断地发展和变化着,但是直到现在,始终存在着一种需要,即:寻找一种关于这个领域的统一的研究方法,并且,该方法应该是能够经受住时间考验的。我相信在研究机器视觉的过程中,我们应该思索如下两个问题:1)成像过程的基本原理是什么?2)如何探索对成像过程“求逆”(也就是说,就是从一张图像、多张图像或者图像序列中恢复出关于场景或者观测者的信息)的知识和方法?显然,要做到这一点,我们至少需要理解:光学、运动学和坐标变换。
通过物理模型,我们可以很自然地导出相应的数学公式,然后,通过数学公式,我们可以导出相应的算法。本书的主题包括:
建立起对成像过程的基本理解;
探讨对成像过程进行求逆的方法。
尽管本书包含了许多用于解决机器视觉问题的具体方法,但是,本书所关注的是:建立一种针对不同机器视觉问题的整体解决方法。事实上,许多成功的机器视觉技术,例如:从明暗恢复形状、光流、无源导航等,都是这种“整体解决方法”的具体应用。关注基本原理所带来的一个好处是:真正需要去理解的核心内容变少了,甚至连算法的实现细节都有可能会变成一个“瞬间”就被理解或完成的工作。
最近几年,在机器视觉的应用领域取得了很多实质性的进展,这些进展部分归功于机器学习方法的使用。当然,机器学习结果的好坏依赖于:从图像中所提取出来的特征的“质量”。特征的“描述力”越强,区分效果也就越好;所提取出的特征越有“特点”,所得到的结果也就越好。从这个意义上说,本书所讲述的内容可以被看作是:用于提取“具有物理意义的特征”的方法。还记得当初在写《RobotVision》的序言时,我以“机器视觉是一个年轻的、发展很快的领域”作为开篇的第一句话。这么多年过去了,我们很高兴地看到:直到今天,这句话还像当初我写它时一样正确!
BertholdK.P.Horn
2014年6月于MIT
免费在线读
《机器视觉》这本书提出了一种从成像到图像分析、再到场景分析的一致研究方法。它既可以作为视觉领域中“Horn学派”的个人思想表现,也可以作为一本教科书。每一个从事计算机视觉相关领域研究的科学家和技术人员,都应该认真地阅读本书!
——AlanK.Mackworth教授,美国哥伦比亚大学
霍恩教授是一个在人类以及机器视觉领域做了很多年研究的顶级研究者。他所写的这本优秀教材非常适合觉领域的工程师、教师以及科学家。本书遵循严格的数学架构,开始于成像的物理模型;逐渐过渡到——人类和机器对于光照、形状、运动和景深的感知方面的最新计算理论;最后结束于——机器视觉方法在自动导航和工业机器人中的现实应用。
——AIBovik教授,美国田纳西大学
《机器视觉》是一部极好的书,既是对该领域很好的介绍,同时也是一本完整包含了计算机视觉所需的数学知识的入门书籍。
——CharlesThorpe,《美国科学家》
当我第一次拿起这本书时,我有点担心这本书出版年代的久远,但是,这本书是机器视觉核心思想的一个极其丰富的展现!我强烈地推荐:将这本书作为一本教科书。每一位认真从事于计算机视觉、机器人或计算机图形学领域的研究者,都应该拥有这本书。我认为这本书写得太好了,不管是过去还是未来,它都会是很有用的。
——读者评论,Amazon网站
——AlanK.Mackworth教授,美国哥伦比亚大学
霍恩教授是一个在人类以及机器视觉领域做了很多年研究的顶级研究者。他所写的这本优秀教材非常适合觉领域的工程师、教师以及科学家。本书遵循严格的数学架构,开始于成像的物理模型;逐渐过渡到——人类和机器对于光照、形状、运动和景深的感知方面的最新计算理论;最后结束于——机器视觉方法在自动导航和工业机器人中的现实应用。
——AIBovik教授,美国田纳西大学
《机器视觉》是一部极好的书,既是对该领域很好的介绍,同时也是一本完整包含了计算机视觉所需的数学知识的入门书籍。
——CharlesThorpe,《美国科学家》
当我第一次拿起这本书时,我有点担心这本书出版年代的久远,但是,这本书是机器视觉核心思想的一个极其丰富的展现!我强烈地推荐:将这本书作为一本教科书。每一位认真从事于计算机视觉、机器人或计算机图形学领域的研究者,都应该拥有这本书。我认为这本书写得太好了,不管是过去还是未来,它都会是很有用的。
——读者评论,Amazon网站
评论
还没有评论。