描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787111741312丛书名: 网络空间安全技术丛书
本书是面向程序员的差分隐私书籍,最初由佛蒙特大学作为数据隐私课程的讲义,之后被芝加哥大学、宾夕法尼亚州立大学和莱斯大学选作教学参考书。本书旨在向读者介绍数据隐私保护领域所面临的挑战,描述为解决这些挑战而提出的技术,并帮助读者理解如何实现其中的关键技术。本书强调动手实践,包含很多示例和很多概念的具体实现,这些示例和实现都是用可以实际运行的程序编写的,并提供开源代码下载。
本书是一本面向程序员的差分隐私书籍,主要介绍数据隐私保护领域所面临的挑战,描述为解决这些挑战而提出的技术,并帮助读者理解如何实现其中一部分技术。本书前几章主要介绍去标识化、聚合、k-匿名性等无法抵御复杂隐私攻击的常用隐私技术。然后通过差分隐私技术、差分隐私的性质、敏感度、近似差分隐私、局部敏感度、差分隐私变体、指数机制、稀疏向量技术、本地差分隐私和合成数据等内容,详细介绍差分隐私如何从数学和技术角度提供隐私保护能力。
目 录
译者序
第1章 引言 1
第2章 去标识 3
2.1 关联攻击 4
2.1.1 重标识出Karrie有多难 5
2.1.2 Karrie很特别吗 7
2.1.3 可以重标识出多少个个体 8
2.2 聚合 10
2.2.1 小分组问题 10
2.2.2 差分攻击 11
2.3 总结 12
第3章 k-匿名性 13
3.1 验证k-匿名性 14
3.2 泛化数据以满足k-匿名性 15
3.3 引入更多的数据可以减小泛化的影响吗 17
3.4 移除异常值 19
3.5 总结 20
第4章 差分隐私 21
4.1 拉普拉斯机制 22
4.2 需要多大的噪声 24
第5章 差分隐私的性质 25
5.1 串行组合性 25
5.2 并行组合性 29
5.2.1 直方图 30
5.2.2 列联表 31
5.3 后处理性 32
第6章 敏感度 35
6.1 距离 36
6.2 计算敏感度 37
6.2.1 计数问询 37
6.2.2 求和问询 38
6.2.3 均值问询 39
6.3 裁剪 40
第7章 近似差分隐私 45
7.1 近似差分隐私的性质 46
7.2 高斯机制 46
7.3 向量值函数及其敏感度 48
7.3.1 L1和L2范数 48
7.3.2 L1和L2敏感度 48
7.3.3 选择L1还是L2 49
7.4 灾难机制 49
7.5 高级组合性 50
7.6 近似差分隐私的高级组合性 53
第8章 局部敏感度 55
8.1 均值问询的局部敏感度 56
8.2 通过局部敏感度实现差分隐私 57
8.3 平滑敏感度 60
8.4 采样-聚合框架 62
第9章 差分隐私变体 67
9.1 最大散度和瑞丽散度 70
9.2 瑞丽差分隐私 71
9.3 零集中差分隐私 72
9.4 不同差分隐私变体的组合性 73
第10章 指数机制 77
10.1 有限集合的指数机制 78
10.2 报告噪声最大值 79
10.3 将指数机制作为差分隐私的基本机制 81
第11章 稀疏向量技术 83
11.1 高于阈值算法 83
11.2 应用稀疏向量技术 85
11.3 返回多个问询结果 89
11.4 应用:范围问询 91
第12章 算法设计练习 93
12.1 需要考虑的问题 93
12.2 更普适的采样-聚合算法 93
12.3 汇总统计 94
12.4 频繁项 95
12.5 分层查询 95
12.6 一系列范围问询 96
?12.6.1 第1部分 96
?12.6.2 第2部分 96
?12.6.3 第3部分 96
第13章 机器学习 97
13.1 使用scikit-learn实现逻辑回归 98
13.2 模型是什么 99
13.3 使用梯度下降训练模型 100
?13.3.1 单步梯度下降 102
?13.3.2 梯度下降算法 103
13.4 差分隐私梯度下降 104
?13.4.1 梯度裁剪 105
?13.4.2 梯度的敏感度 108
13.5 噪声对训练的影响 110
第14章 本地差分隐私 113
14.1 随机应答 114
14.2 一元编码 118
第15章 合成数据 125
15.1 合成表示:直方图 126
15.2 增加差分隐私 127
15.3 生成列表数据 129
15.4 生成更多数据列 131
15.5 总结 134
参考文献 135
译?者?序
能将Joseph P. Near和Chiké Abuah所著的Programming Differential Privacy的中文译本呈现给国内读者,我们感到非常荣幸。作为隐私增强技术领域的关键解决方案,差分隐私的实际应用依赖较为严格的数学证明,这成为差分隐私在普及和应用时所面临的主要困难和挑战。我们很高兴能够为读者提供这样一本面向程序员的差分隐私指南,帮助更多读者轻松入门差分隐私。
我们将书名译为《动手学差分隐私》,体现出这是一本可通过执行代码和实际操作学习差分隐私的书籍。本书涵盖差分隐私的大部分应用场景,作者对理论算法进行了拆解,结合大量的实例提供具体实现,更加生动地解释生涩抽象的理论。理论介绍加案例代码实现的讲解模式,可帮助读者更直观地理解差分隐私。只需要掌握Python代码的基本语法,以及Pandas、NumPy等提供的简单数据处理函数,就可以轻松理解差分隐私技术的实现逻辑。我们相信,本书不仅可以作为读者入门差分隐私的敲门砖,也能够激发读者的兴趣,让更多人参与到差分隐私的研究和应用中,用这一前沿技术为数据提供隐私保护。
这本书不仅是一本全面和系统的差分隐私入门指南,也是我们学习差分隐私的过程记录。为保证翻译的准确性与严谨性,我们在翻译过程中进一步深入研究差分隐私原理、技术和相关的数学概念,通过逐字逐句地阅读原文来理解作者的意图,并尽量通过译文将其准确地传达给读者。基于对原文的理解,我们对部分描述进行了调整,以尽可能保留原文的易读性和趣味性。我们在翻译过程中也发现了原文中的一些错误,并如实反馈给作者。他们对我们的反馈给予了高度肯定,并修改了原著。
在此,我们对所有支持和帮助我们完成翻译的人表示衷心的感谢。在翻译过程中,我们得到了两位作者充分的支持和帮助。特别感谢Joseph P. Near教授,他即时解答了我们在翻译过程中发现和遇到的问题,尽可能减小了我们对相应内容的理解误差。感谢机械工业出版社编辑团队的支持和指导,使本书能够顺利出版。本书的翻译工作得到了国家社科基金重大项目(编号:22&ZD147)和移动应用创新与治理技术工业和信息化部重点实验室开放基金项目(编号:2022IFS080611-K)的支持。
限于我们的水平,书中表达难免有不妥之处,恳请各位读者批评指正。希望您在阅读过程中能够获得愉快和有益的体验,并通过这本书获得知识和启发,将差分隐私应用于实际工作和项目中。同时,也希望这本书能够推动差分隐私在国内的普及和应用。
刘巍然、李双
2023年9月11日
评论
还没有评论。