描述
开 本: 32开纸 张: 纯质纸包 装: 平装是否套装: 否国际标准书号ISBN: 9787122422880丛书名: 人工智能超入门丛书
1.技术型科普书,属于计算机视觉方向零基础入门读物; 2.全书语言文字简洁易懂,对初学者友好; 3.本书作者是清华大学人工智能方向老师,有非常强的专业能力; 4.本书理论与实践结合,但尽量避免了烦琐公式。
“人工智能超入门丛书”致力于面向人工智能各技术方向零基础的读者,内容涉及数据思维、机器学习、视觉感知、情感分析、搜索算法、强化学习、知识图谱、专家系统等方向,体系完整、内容简洁、文字通俗,综合介绍人工智能相关知识,并辅以程序代码解决问题,使得零基础的读者快速入门。《视觉感知:深度学习如何知图辨物》是“人工智能超入门丛书”中的分册,本分册主要介绍人工智能视觉领域的相关知识,以通俗易懂的文字风格,解读用卷积神经网络等深度学习算法及机器学习算法对图像进行分类和识别的方法,介绍OpenCV在图像处理中的基础知识,为进一步学习高阶内容奠定基础。同时,本书配有关键代码,让读者在学习过程中快速上手,提升解决问题的能力。本书可以作为大学生以及想要走向计算机视觉相关工作岗位的技术人员的入门读物,同时,对人工智能感兴趣的人群也可以阅读。
第1章 计算机视觉综述 001
1.1 生物的视界 002
1.1.1 三只眼 002
1.1.2 眼见为实? 005
1.2 人工智能的视界 009
1.2.1 数字图像类型 009
1.2.2 从图像到矩阵 011
1.2.3 视不同,理相通 014
1.3 计算机视觉发展与应用 018
1.3.1 计算机视觉发展史 018
1.3.2 大规模视觉识别挑战赛 021
1.3.3 计算机视觉应用 022
第2章 机器学习与图像识别 024
2.1 从感知机到支持向量机 025
2.1.1 感知机的线性可分 025
2.1.2 支持向量机 027
2.2 支持向量机的超强“核”心 030
2.3 支持向量机的实践 034
2.3.1 鸢尾花的辨识 034
2.3.2 手写数字图像识别 040
第3章 神经网络与图像分类 043
3.1 从神经元到神经网络 044
3.1.1 神经元与感知机 044
3.1.2 神经网络的结构 046
3.1.3 前向与反向传播 047
3.2 激活函数与损失函数 052
3.2.1 非线性转换的激活函数 052
3.2.2 衡量优劣的损失函数 056
3.2.3 激活函数与损失函数的组合 057
3.3 拟合与误差 058
3.3.1 过拟合与欠拟合 058
3.3.2 偏差与方差的权衡 060
3.4 利用神经网络识别手写数字图像 064
3.4.1 MNIST手写数字图像数据集 064
3.4.2 Scikit-learn库神经网络与手写数字图像 066
3.4.3 NumPy库神经网络与手写数据集 069
第4章 卷积入门 073
4.1 图像噪声 074
4.2 卷积核与去噪 077
4.3 边缘检测 085
4.4 纹理分析 089
第5章 卷积神经网络及经典详解 092
5.1 卷积神经网络的提出 093
5.1.1 从全局到局部 093
5.1.2 感受野 096
5.2 卷积层、池化层与全连接层 097
5.2.1 卷积与卷积层 098
5.2.2 池化与池化层 100
5.2.3 全连接层 101
5.3 卷积神经网络的图像分类 103
5.3.1 CIFAR-10图像集介绍 103
5.3.2 简单实现图像分类 104
5.4 ImageNet与经典网络介绍 113
5.4.1 ImageNet数据集 113
5.4.2 经典卷积神经网络 114
第6章 OpenCV基础 118
6.1 图像处理入门 120
6.1.1 读取、显示与保存图像 121
6.1.2 分割与合并颜色通道 126
6.1.3 转换颜色空间 128
6.1.4 读取、显示与保存视频 131
6.2 图像基本变换 135
6.2.1 操作单个像素 135
6.2.2 裁剪图像 138
6.2.3 调整图像大小 140
6.2.4 翻转图像 144
6.3 为图像添加注释 146
6.3.1 为图像添加线段 147
6.3.2 为图像添加圆 148
6.3.3 为图像添加矩形 149
6.3.4 为图像添加文本 150
6.4 图像增强 151
6.4.1 调整图像亮度 151
6.4.2 调整图像对比度 153
第7章 OpenCV实战应用 157
7.1 目标跟踪 158
7.1.1 目标跟踪算法 159
7.1.2 创建跟踪器实例 160
7.2 目标检测 169
7.2.1 SSD目标检测算法 169
7.2.2 目标检测实例 170
7.3 图像分割 177
7.3.1 图像分割介绍 178
7.3.2 通过Mask R-CNN进行图像分割 179
7.4 人脸识别 181
7.4.1 人脸检测实例 182
7.4.2 眼睛检测实例 187
附录 189
附录一 优化基础 190
附录二 神经网络代码 198
附录三 腾讯扣叮Python实验室:Jupyter Lab使用说明 205
新一代人工智能的崛起深刻影响着国际竞争格局,人工智能已经成为推动国家与人类社会发展的重大引擎。2017年,国务院发布《新一代人工智能发展规划》,其中明确指出:支持开展形式多样的人工智能科普活动,鼓励广大科技工作者投身人工智能知识的普及与推广,全面提高全社会对人工智能的整体认知和应用水平。实施全民智能教育项目,在中小学阶段设置人工智能相关课程,逐步推广编程教育,鼓励社会力量参与寓教于乐的编程教学软件、游戏的开发和推广。
为了贯彻落实《新一代人工智能发展规划》,国家有关部委相继颁布出台了一系列政策。截至2022年2月,全国共有440所高校设置了人工智能本科专业,387所普通高等学校高等职业教育(专科)设置了人工智能技术服务专业,一些高校甚至已经在积极探索人工智能跨学科的建设。在高中阶段,“人工智能初步”已经成为信息技术课程的选择性必修内容之一。在2022年实现“从0到1”突破的义务教育阶段信息科技课程标准中,明确要求在7~9年级需要学习“人工智能与智慧社会”相关内容,实际上,1~6年级阶段的不少内容也与人工智能关系密切,是学习人工智能的基础。
人工智能是一门具有高度交叉属性的学科,笔者认为其交叉性至少体现在三个方面:行业交叉、学科交叉、学派交叉。在大数据、算法、算力三驾马车的推动下,新一代人工智能已经逐步开始赋能各个行业,现在几乎没有哪一个行业不涉及人工智能有关元素。人工智能也在助力各学科的研究,近几年,《自然》等顶级刊物不断刊发人工智能赋能学科的文章,如人工智能推动数学、化学、生物、考古、设计、音乐以及美术等。人工智能内部的学派也在不断交叉融合,像知名的AlphaGo,就是集三大主流学派优势制作,并且现在这种不同学派间取长补短的研究开展得如火如荼。总之,未来的学习、工作与生活中,人工智能赋能的身影将无处不在,因此掌握一定的人工智能知识与技能将大有裨益。
根据笔者长期从事人工智能教学、研究经验来看,一些人对人工智能还存在一定的误区。比如将编程与人工智能直接画上了等号,又或是认为人工智能就只有深度学习等。实际上,人工智能的知识体系十分庞大,内容涵盖相当广泛,不但有逻辑推理、知识工程、搜索算法等相关内容,还涉及机器学习、深度学习以及强化学习等算法模型。当然,了解人工智能的起源与发展、人工智能的道德伦理对正确认识人工智能和树立正确的价值观也是十分必要的。
通过对人工智能及其相关知识的系统学习,可以培养数学思维( Mathematical Thinking)、逻辑思维( Reasoning Thinking)、计算思维(Computational Thinking)、艺术思维(Artistic Thinking)、创新思维( Innovative Thinking)与数据思维(Data Thinking),即MRCAID。然而遗憾的是,目前市场上既能较综合介绍人工智能相关知识,又能辅以程序代码解决问题,同时还能迅速入门的图书并不多见。因此笔者策划了本系列图书,以期实现体系内容较全、配合程序操练及上手简单方便等特点。
本书主要介绍一些关于人工智能视觉领域相关的知识。除介绍像卷积神经网络等深度学习算法解决图像分类问题外,也给出了如何利用传统机器学习算法进行图像识别的知识与技能。本书也介绍了OpenCV在图像处理中的一些基础知识,为进一步学习高阶的内容奠定了基础。第1章介绍了计算机视觉的基础知识与发展脉络,第2章介绍如何利用支持向量机解决分类问题以及其在手写数字图像识别中的运用,第3章介绍神经网络实现对MNIST手写数字数据集的分类,第4章和第5章介绍卷积神经网络的相关知识以及其实现图像分类的案例,第6章主要介绍OpenCV的基础知识,第7章在第6章的基础上,介绍了目标跟踪、目标检测、图像分割以及人脸识别等相关知识。本书的附录部分介绍了关于优化问题的基础知识以及给出了一步步实现神经网络的代码。
本书的出版要感谢曾提供热情指导与帮助的院士、教授、中小学教师等专家学者,也要感谢与笔者一起并肩参与写作的其他作者,同时还要感谢化学工业出版社编辑老师们的热情支持与一丝不苟的工作态度。
在本书的出版过程中,未来基因(北京)人工智能研究院、腾讯教育、阿里云、科大讯飞等机构给予了大力支持,在此一并表示感谢。同时,本书受“中央高校基本科研业务费专项资金”资助,在此表示感谢。
由于笔者水平有限,书中内容不可避免会存在疏漏,欢迎广大读者批评指正并提出宝贵的意见。
龚超
2022年9月于清华大学
评论
还没有评论。