描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787302651024
MediaPipe是一个由谷歌研究开发并开源的多媒体机器学习模型应用框架。它是一个跨平 台框架,适用于桌面/服务器、Android、iOS和嵌入式设备,如Raspberry Pi和Jetson Nano。
MediaPipe是用于构建机器学习管道的框架,主要用于处理视频、音频等时间序列数据。 此外,该框架为流媒体提供了跨平台且可定制的机器学习解决方案。这意味着开发者可 以根据自己的需求定制适合其应用场景的机器学习模型。
MediaPipe已被广泛应用于各种机器学习任务,如人脸识别、人脸3D重建、手势检测、语 音识别和对象检测等。在谷歌的一系列重要产品中,如Google Lens、ARCore、Google Home等,都已深度整合了MediaPipe。
具体来说,MediaPipe具备处理视频和音频帧流的能力,通常用于构建交互式应用程序。 例如,其中的FaceMesh模型可以从图像或视频中重建出人脸的3D结构。此外,通过 MediaPipe Solutions,开发者可以为应用配置预构建的处理流水线,为用户提供即时的 、有吸引力的有用输出。
《MediaPipe机器学习跨平台框架实战》以实际项目为线索,带领读者探索MediaPipe在不同场景中的应用,使读者既能了解 理论知识,又能通过实践掌握技能。书中以大量案例介绍了MediaPipe在移动端应用,包 括增强现实、AR滤镜和视频会议软件、MdiaPipe与游戏控制的结合应用、如何在体感游 戏中应用MediaPipe技术,以AR激光剑效果、火箭发射小游戏、空中作图为例展示了 MediaPipe在视觉特效方面的应用,如何使用MediaPipe实现手语识别应用、如何通过 MediaPipe打造虚拟智能健身教练以及MediaPipe与Unity结合在游戏与虚拟现实领域的应 用等等,精彩粉呈地展现了MediaPipe的强大潜力。
《MediaPipe机器学习跨平台框架实战》不仅适合对机器学习感兴趣的程序员、广大编程爱好者,还适合在校学生、创业者 或者普通用户学习与参考,在此推荐给读者。
《MediaPipe机器学习跨平台框架实战》以实际项目为线索,带领读者探索MediaPipe在不同场景中的应用,使读者既能了解理论知识,又能通过实践掌握技能。全书共9章,第1章介绍MediaPipe基础;第2章重点探讨MediaPipe的控制流、同步机制以及GPU的使用;第3章介绍MediaPipe中的Facemesh,探讨其在增强现实、AR滤镜和视频会议软件中的应用;第4章将MediaPipe与游戏控制相结合,介绍如何在体感游戏中应用MediaPipe技术;第5章以AR激光剑效果、火箭发射小游戏、空中作图等为例,展示MediaPipe在视觉特效方面的应用;第6章介绍如何使用MediaPipe实现手语识别应用;第7章展示如何通过MediaPipe打造虚拟智能健身教练;第8章通过案例介绍MediaPipe与Unity在游戏与虚拟现实领域整合应用的强大潜力;第9章展望MediaPipe的未来,为读者提供了对这一技术的更深层次的认识和思考。 《MediaPipe机器学习跨平台框架实战》内容新颖,案例丰富,代码翔实,不仅适合对机器学习感兴趣的程序员、广大编程爱好者,还适合在校学生、创业者或者普通用户学习与参考。
第 1 章 MediaPipe基础1
1.1 MediaPipe——站在巨人的肩膀上1
1.1.1 MediaPipe简介1
1.1.2 MediaPipe可以做什么2
1.1.3 MediaPipe和实时流媒体数据3
1.1.4 MediaPipe和TensorFlow 5
1.1.5 MediaPipe和OpenCV6
1.2 为什么选择MediaPipe7
1.3 主流推理框架的对比7
1.4 小结8
第 2 章 MediaPipe上手第一步9
2.1 MediaPipe的安装9
2.1.1 在CentOS下安装10
2.1.2 在Windows下安装11
2.1.3 使用Docker安装12
2.2 MediaPipe的基础架构介绍15
2.2.1 基础架构组件的构成及
特点15
2.2.2 MediaPipe技术栈介绍16
2.3 控制流和同步加速机制介绍26
2.3.1 控制流27
2.3.2 同步机制28
2.4 GPU的使用28
2.5 小结31
第 3 章 MediaPipe Facemesh33
3.1 Facemesh简介33
3.1.1 用于增强现实34
3.1.2 用于AR滤镜34
3.1.3 用于视频会议软件35
3.1.4 基于MediaPipe的美颜应用36
3.2 实现虚拟化身(一)36
3.2.1 构建工作环境36
3.2.2 构建流程 38
3.2.3 获取面部关键点39
3.3 实现虚拟化身(二)53
3.3.1 构建开发环境53
3.3.2 构建虚拟化身特效55
3.4 实现美颜特性65
3.5 虚拟背景的Python实现68
3.6 虚拟背景的Android实现 71
3.6.1 构建开发环境72
3.6.2 视频背景特效的实现80
3.7 小结99
第 4 章 MediaPipe与游戏控制100
4.1 体感游戏简介100
4.2 体感游戏与MediaPipe的姿态估计(Pose Estimation)102
4.3 MediaPipe姿态检测102
4.4 游戏人物控制机制105
4.5 控制水平和竖直方向的移动105
4.5.1 控制水平方向的移动105
4.5.2 控制竖直方向的移动107
4.6 控制键盘或鼠标的移动109
4.7 小结 110
第 5 章 MediaPipe视觉特效实现111
5.1 识别眼睛EAR活动111
5.1.1 EAR介绍112
5.1.2 EAR判定疲劳的流程113
5.1.3 MediPipe监测EAR114
5.2 AR激光剑效果118
5.2.1 游戏策划119
5.2.2 准备和设计图片资源120
5.2.3 编写脚本120
5.2.4 测试和预览效果131
5.3 火箭发射小游戏131
5.4 空中作图149
5.4.1 空中作图的历史149
5.4.2 应用流程的设计149
5.4.3 菜单的设计149
5.4.4 选择和绘画手势的判断150
5.4.5 绘画逻辑的实现152
5.4.6 测试和预览效果154
5.5 小结 155
第 6 章 MediaPipe手语识别实战156
6.1 手语识别介绍156
6.1.1 手语简介156
6.1.2 手语识别的历史157
6.2 MediaPipe手语识别的实现步骤157
6.3 小结 183
第 7 章 MediaPipe智能健身教练实战184
7.1 智能健身概述184
7.2 MediaPipe健康教练的实现185
7.3 小结199
第 8 章 MediaPipe和Unity200
8.1 MediaPipe Unity插件简介200
8.2 MediaPipe Unity插件的安装方法201
8.3 MediaPipe Unity插件的使用方法206
8.4 案例介绍214
8.5 小结230
第 9 章 MediaPipe的前景和展望231
9.1 实时识别、移动设备加速AI技术的落地,助力廉价AR/VR设备(ARCore/VRCHAT)231
9.2 MediaPipe助力元宇宙发展232
9.3 面临的挑战233
9.4 小结233
随着短视频应用的兴起并引领全球移动端应用,各种基于摄像头的趣味短视频特效应用进入广大用户的视野,重新定义了用户体验的边界。这其中包含一些增强现实/虚拟现实的有趣尝试,比如虚拟化妆镜、视频实时换背景、特效面具以及基于摄像头的实时物体检测和文字翻译等。在这些应用中,低功耗、具有跨平台特性以及可运行在中低端设备(特别是移动端)上的机器学习框架尤其引人瞩目,并为各类创意场景提供了无限可能。对此,部分厂商提供了自己的SDK套件,用于上述场景或应用的构建,普通用户有机会接触这些场景或应用吗?答案是肯定的。
本书介绍的MediaPipe是一款由Google开发并开源的多媒体机器学习模型应用框架。在谷歌,很多产品如 Google Lens、ARCore都已高度整合了MediaPipe。作为一款开源跨平台框架,MediaPipe不仅可以被部署在服务器端,也可以在移动端或嵌入式平台成为机器学习推理框架使用。本书介绍MediaPipe的功能、技术框架,从简单的例子入手介绍工作原理,并且通过大量由浅入深的工程实例引领读者深入探索这个充满创意的领域,揭示其中的技术奥秘和潜力。通过深入解析,读者将了解到这些视频特效应用背后的故事,以及它们是如何在移动端引领潮流,塑造数字时代的奇妙格局的。无论你是对机器学习感兴趣的程序员、编程爱好者还是在校学生、创业者或者普通用户,相信本书都会给你耳目一新的阅读体验。
本书内容如下:
第1章为读者建立了对MediaPipe的基本认识,从MediaPipe的简介、应用领域到与主流推理框架的对比,全方位介绍了这一技术的重要性和灵活性。
第2章是入门指南,详细介绍了MediaPipe的安装与配置,同时深入探讨了控制流、同步机制以及GPU的使用。
第3章聚焦于MediaPipe中的Facemesh,探讨了其在增强现实、AR滤镜和视频会议软件中的应用。
第4章将MediaPipe与游戏控制相结合,介绍了如何在体感游戏中应用MediaPipe
技术。
第5章是实战项目,以AR激光剑效果、火箭发射小游戏、空中作图等为例,全面展示了MediaPipe在视觉特效方面的应用。
第6章带领读者挑战手语识别,介绍了手语识别的基础知识以及如何使用MediaPipe实现手语识别应用。
第7章聚焦于健身领域,展示了如何通过MediaPipe打造智能健身教练,为用户提供个性化的健身指导。
第8章将MediaPipe与Unity结合,为读者呈现了这两者在游戏和虚拟现实领域的强大潜力,并提供了案例介绍。
第9章展望了MediaPipe的未来发展方向,为读者提供了对这一技术的更深层次的认识和思考。
本书提供配套资源文件,用微信扫描下述二维码即可获取:
如果下载有问题,请用电子邮件联系[email protected],邮件主题为“MediaPipe机器学习跨平台框架实战”。
由于编者水平有限,书中难免存在疏漏之处,敬请广大读者和专家批评指正。
在这里特别感谢王金柱编辑提供的指导和帮助,感谢父母、其他家人和朋友一如既往的支持和鼓励。
编 者
2023年11月
评论
还没有评论。