描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787111764335
本教材对多年产教融合一线实践经验进行归纳总结,结合作者技术研究领域,采用PyTorch作为深度学习框架,将搭建深度学习技术和企业应用场景项目需求间的桥梁,使得学生通过本教材的学习,具备企业项目开发能力。为紧跟企业需求,在内容选材上,突出以下要素:
① 通过5个基础项目,重点介绍了CNN、Transformer等主流的神经网络框架,做到逐行代码讲解,结合插图和DEBUG调试技巧,让读者理解神经网络参数变化趋势, 通过逐网络层级可视化,观察网络对特征的提取,揭开网络黑盒,直面神经网络本质。
② 通过3个综合项目,紧扣实际项目需求和行业应用热点,重点介绍了Yolo、UNet、Real-ESRGAN、ChatGPT、Stable Difusion等最新技术,实现了目标检测、图像分割、超分辨率重建、智能问答、文生图、图生图等热门应用,带领读者完成商业级项目开发,让读者具备一定的企业级项目实战能力。
《PyTorch深度学习项目教程》根据初学者的学习曲线和职业生涯成长规律,由浅入深设计了5个基础项目和3个综合项目。 基础项目包括手写数字识别、二维曲线拟合、猫狗图像分类、提升猫狗图像分类的准确率和文本翻译,引导读者使用PyTorch构建神经网络算法框架,深入探讨了深度学习数据集构建、神经网络模型原理及实现、算法训练与评价等内容;综合项目包括食品加工人员异常行为检测、工业检测图像分割和内容智能生成,介绍了深度学习的新技术,实现了目标检测、图像分割、超分辨率重建、智能问答、文生图、图生图等应用。
《PyTorch深度学习项目教程》可作为高等职业院校人工智能技术专业相关课程的教材,也可作为工程人员的入门书籍。
前言
项目1 手写数字识别项目背景
任务1.1 初识深度学习
任务1.2 配置PyTorch开发环境
1.2.1 PyTorch概述及硬件要求
1.2.2 Anaconda的下载及安装
1.2.3 CUDA工具包的下载及安装
1.2.4 PyTorch的安装及配置
1.2.5 PyCharm的下载及安装
任务1.3 快速完成手写数字识别功能
1.3.1 MNIST手写数字识别数据库概述
1.3.2 手写数字识别实现
1.3.3 手写数字识别测试
习题
项目2 二维曲线拟合项目背景
任务2.1 理解曲线拟合需求
任务2.2 掌握PyTorch的基本语法
2.2.1 Tensor的创建
2.2.2 Tensor索引操作
2.2.3 Tensor形状变换
2.2.4 PyTorch的数学运算
2.2.5 广播机制
2.2.6 Tensor和NumPy的转换
2.2.7 在GPU上操作
任务2.3 搭建二维曲线数据集
任务2.4 搭建网络结构
2.4.1 神经网络概述
2.4.2 激活函数
2.4.3 多层感知机
任务2.5 训练神经网络模型
2.5.1 正向传播
2.5.2 损失函数
2.5.3 训练迭代与反向传播
2.5.4 训练迭代过程
任务2.6 网络推理
任务2.7 模型结构分析
任务2.8 拟合更多的二维曲线
习题
项目3 猫狗图像分类项目背景
任务3.1 准备猫狗数据集
3.1.1 创建猫狗分类数据集
3.1.2 数据集的读取与预处理
任务3.2 设计图像分类全连接网络
任务3.3 训练图像分类网络
3.3.1 训练日志记录
3.3.2 训练初始化
3.3.3 配置数据集
3.3.4 加载网络模型
3.3.5 配置训练策略
3.3.6 迭代训练
任务3.4 应用分类网络推理更多图片
任务3.5 认识深度学习的主要任务:回归与分类
3.5.1 线性回归
3.5.2 二分类与逻辑回归
3.5.3 多分类问题处理
习题
项目4 提升猫狗图像分类的准确率项目背景
任务4.1 多层感知机问题分析
任务4.2 卷积神经网络的引入
4.2.1 卷积的概念
4.2.2 添加步长
4.2.3 填充边缘
4.2.4 卷积神经网络结构
任务4.3 卷积网络结构编程实现
任务4.4 网络训练及结果评估
任务4.5 认识更多网络结构
4.5.1 AlexNet网络模型
4.5.2 VGGNet网络模型
4.5.3 ResNet网络模型
4.5.4 MobileNet网络模型
习题
项目5 文本翻译项目背景
任务5.1 认知自然语言处理及相关技术
5.1.1 自然语言处理的概念
5.1.2 图灵测试
5.1.3 自然语言处理技术的发展
任务5.2 构建中英文翻译数据集
任务5.3 搭建Transformer神经网络
5.3.1 输入序列向量化
5.3.2 位置编码
5.3.3 编码器、解码器和输出序列化
任务5.4 训练Transformer网络
任务5.5 完成文本翻译推理
任务5.6 理解Transformer网络模型
5.6.1 Transformer模型结构
5.6.2 Transformer的输入和输出
5.6.3 Transformer的推理过程
5.6.4 Transformer的训练过程
5.6.5 nn.Transformer的构造参数
5.6.6 nn.Transformer的forward参数
习题
项目6 食品加工人员异常行为检测项目背景
任务6.1 理解目标检测需求
任务6.2 数据采集及标注
6.2.1 数据采集
6.2.2 数据标注
6.2.3 数据集构建
任务6.3 训练YOLO模型
6.3.1YOLO 工具包的安装
6.3.2 配置文件修改
6.3.3 训练模型
任务6.4 采用YOLO进行异常行为推理
任务6.5 掌握目标检测流程
习题
项目7 工业检测图像分割项目背景
任务7.1 了解图像分割需求
任务7.2 数据集构建
7.2.1 数据标注
7.2.2 数据格式转换及数据集划分
任务7.3 图像分割网络训练
7.3.1 UNet网络概述
7.3.2 UNet网络的建立
7.3.3 创建Dataset类
7.3.4 进行网络训练
任务7.4 网络推理及结果评价
习题
项目8 内容智能生成项目背景
任务8.1 了解人工智能内容生成相关概念
任务8.2 实现图像超分辨率重建
8.2.1 图像超分辨率技术
8.2.2 生成对抗网络技术
8.2.3 Real-ESRGAN应用
任务8.3 实现自动问答
8.3.1 ChatGPT技术概述
8.3.2 类ChatGPT本地化应用
8.3.3 问答提词器的设计技巧
任务8.4 实现AI绘画
8.4.1 扩散模型技术概述
8.4.2 Stable Diffusion UI安装
8.4.3 AI绘图实现
习题
参考文献
随着信息技术的飞速发展和互联网的迅猛普及,人工智能作为一个引人注目的领域,正在迎来前所未有的繁荣时期。而深度学习作为人工智能的核心技术之一,已经在各个领域展现出了巨大的潜力和应用价值。PyTorch作为一种快速发展的深度学习框架,以其灵活性、易用性和强大的性能成了研究人员和工程师们的首选。
本书结合人工智能的新发展,为读者提供由浅入深的项目平台。不仅注重技术知识的传授,更重视思政素质的培养。在教学内容的设计上,特别强调了社会主义核心价值观的教育,引导读者树立正确的人工智能伦理观和数据隐私保护意识。
人工智能当前的热点技术为深度学习。本书旨在帮助读者全面了解深度学习的基本原理和PyTorch的使用方法,讲解其在实际应用中的技术路线和调试技巧。本书紧密结合党的二十大精神,引导读者深刻理解国家的人工智能发展战略,激发爱国热情和责任感,培养成为有理想、有担当、有能力的社会主义建设者和接班人意识。
全书共分8个项目,每个项目都针对不同的深度学习任务,通过Python语言和PyTorch框架,展示了深度学习技术的运用。全书采用理论与项目实践相结合的方式,深入浅出地剖析了深度学习的具体应用,介绍了图像分类、识别、分割、文本翻译和内容生成等不同领域的项目案例。
项目1为手写数字识别。介绍了PyTorch的环境安装、手写识别数据集的下载、手写识别算法的实现等基础知识。通过一个简单的手写数字识别小实验,带领读者进入深度学习的世界。
项目2为二维曲线拟合。介绍了PyTorch语法基础,围绕回归与预测相关任务,详细介绍了神经网络的设计、训练、评价、优化和推理的工作流程,让读者深入理解深度学习的基本思想和技术知识。
项目3、项目4为图像分类项目,项目3采用了多层感知机网络完成了猫狗图像分类,项目4使用卷积神经网络(CNN)替换了项目3中的多层感知机全连接网络,并介绍了经典的神经网络模型,如AlexNet、VGGNet、ResNet等。通过图像分类项目,读者可以体会到深度学习技术的强大之处。其中项目3侧重介绍了数据集的处理方法和训练方法,并讲解了损失函数和评价函数的作用;项目4则从卷积神经网络的角度,介绍了CNN的基本概念、经典网络等内容,通过从0到1搭建一个又一个网络模型,帮助读者了解深度学习的项目调试过程,不断提高图像分类的准确率。
项目5为文本翻译。介绍了Transformer模型原理及其PyTorch中的实现,梳理了自然语言处理的相关知识,并对PyTorch实现的Transformer模型接口进行了梳理。无论是学生还是科技实践者,都可以快速调参和优化网络结构,提高自己在深度学习领域应用的能力。
项目6为食品加工人员异常行为检测。介绍了异常行为分析系统的设计与实现思路,主要介绍了目标检测算法YOLO,这是一种基于深度学习技术的目标检测算法,广泛应用于智能交通、工业质量检测等多个领域。
项目7为工业检测图像分割。给出了图像分割方法的设计与实现,涵盖了图像语义分割等相关技术,重点讲解了UNet模型,帮助读者了解其实现原理和实际应用。
项目8为内容智能生成。实现了人工智能内容生成方面(AIGC)的常见项目需求,包括图像超分辨率重建、文生文、文生图、图生图、图生文等。主要通过实际案例的分析,带领读者探究当前深度学习领域中主流AI大模型的应用技巧。
愿本书能够成为读者深入学习掌握PyTorch和深度学习的重要参考,也期待读者通过学习与实践,具备人工智能项目的实际开发能力。我们期待,通过本书的学习,读者不仅能够掌握人工智能领域的专业知识,更能够在思想上得到升华,为实现中华民族的伟大复兴贡献自己的力量。
在本书写作过程中,从内容选题到确定思路,从资料搜集、拟定提纲到内容的编写与修改以及诸多算法和实验的梳理,得到无锡日联科技股份有限公司、江苏森蓝智能系统有限公司等合作企业的大力支持,在此特别表示感谢。另外,对所有关心本书的学者、同人表示感谢。
本书在编写过程中,参考和引用了大量国内外的著作、论文和研究报告,在此向所有被参考和引用论著的作者表示由衷的感谢,他们的辛勤劳动成果为本书提供了丰富的资料。
由于编者水平有限,书中难免存在疏漏与不妥之处,敬请读者批评指正。
编者
评论
还没有评论。