描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787111682738丛书名: O’Reilly精品图书系列
随着越来越多的公司转向构建微服务及其他形式的分布式系统,这些系统的复杂性也与日俱增。虽然无法消除复杂性,但通过实践混沌工程,可以发现系统中的漏洞,并防患于未然。本书向工程师展示了如何在优化系统满足业务目标的同时应对复杂的系统。两位作者是该领域的杰出人物,他们在Netflix公司合作期间开创了“混沌工程”这一学科。在本书中,他们不仅阐述了混沌工程的目标、方法和价值,还促进了各行业的从业者针对该主题展开交流。本书内容丰富,立足于发展史,面向未来,是打开混沌工程之门的黄金之钥。
通过阅读本书,你将:
* 了解混沌工程如何使组织能够应对复杂性。
* 探索一种方法论来避免应用程序、网络和基础设施出现故障。
* 通过谷歌、微软、Slack和LinkedIn等行业专家的真实故事,学习如何将理论应用于实践。
* 建立思考软件系统内部复杂性的框架。
* 围绕Game Day设计一个混沌工程实施计划,并朝着目标明确的自动化实验方向发展。
* 了解如何设计能够实现持续协作的混沌实验。
随着越来越多的公司转向构建微服务及其他形式的分布式系统,系统的复杂性与日俱增。虽然无法消除复杂性,但通过实践混沌工程,可以发现系统中的漏洞,并在其影响客户之前,避免停机事故。本书会展现混沌工程背后的历史,讨论奠定混沌工程基础的理论、定义和原则,研究整个软件行业实现混沌工程的方式,分析传统软件无法企及的实例,以及混沌工程实践的未来。
前言 1
导言:混沌工程的诞生 5
部分 搭建舞台 13
第1章 遇到复杂系统 15
1.1 思考复杂性 15
1.2 遇到复杂性 17
1.3 面对复杂性 26
1.4 接纳复杂性 29
第2章 应对复杂系统 30
2.1 动态安全模型 30
2.2 复杂性的经济支柱模型 33
2.3 系统化视角 36
第3章 原则概述 37
3.1 混沌工程是什么 37
3.2 混沌工程不是什么 39
3.3 高级原则 41
3.4 原则的未来 45
第二部分 投入实战 47
第4章 Slack的灾难剧场 49
4.1 旧系统的混沌工程改造 49
4.2 灾难剧场 52
4.3 混沌工程的过程 53
4.4 过程如何演化 59
4.5 获得管理层支持 60
4.6 结果 60
4.7 总结 62
第5章 谷歌DiRT:灾难恢复测试 63
5.1 DiRT测试的生命周期 65
5.2 谷歌的测试范围 77
5.3 总结 79
第6章 微软的多样化故障和实验优先级 81
6.1 为什么一切都如此复杂 81
6.2 实验结果的类别 83
6.3 故障优先级 86
6.4 多样化的程度 87
6.5 大规模部署实验 90
6.6 总结 91
第7章 LinkedIn心中有会员 92
7.1从灾难中学习 93
7.2 细化实验目标 93
7.3 安全地进行大规模实验 95
7.4 LinkedOut实战 96
7.5 总结 105
第8章 采纳并演进混沌工程的资本金融公司 106
8.1 资本金融公司案例研究 107
8.2 设计实验时需要注意的事项 109
8.3 工具链 110
8.4 团队结构 111
8.5 传播 112
8.6 总结 113
第三部分 人为因素 115
第9章 先见之明 117
9.1 混沌工程与韧性 118
9.2 混沌工程的步骤 118
9.3 混沌工程实验的工具支持 120
9.4 有效的内部合作 122
9.5 总结 127
第10章 人类系统的混沌 128
10.1 系统中的人 128
10.2 工程师团队的适应能力 130
10.3 付诸实践 132
第11章 决策圈中的人 144
11.1 实验的原因、方法和时机 145
11.2 总结 151
第12章 实验选择问题及解决方案 152
12.1 选择实验 152
12.2 可观测性:机会来了 158
12.3 总结 160
第四部分 商业因素 163
第13章 混沌工程的投资回报率 165
13.1 减少事故所带来的好处转瞬即逝 165
13.2 Kirkpatrick模型 166
13.3 投资回报率替代方案示例 168
13.4 附带投资回报率 169
13.5 总结 170
第14章 将心态、科学和混沌开放 171
14.1 协作心态 171
14.2 开放科学与开放源代码 173
14.3 总结 176
第15章 混沌成熟度模型 177
15.1 采用度 177
15.2 复杂性 182
15.3 总结 186
第五部分 持续演进 189
第16章 持续验证 191
16.1 持续验证从何而来 191
16.2 持续验证系统的类型 193
16.3 持续验证示例:ChAP 194
16.4 持续验证的未来用例 197
第17章 介入信息物理系统 199
17.1 信息物理系统的兴起 200
17.2 功能安全遇上混沌工程 200
17.3 信息物理系统的软件 203
17.4 混沌工程超越FMEA 204
17.5 探针效应 206
17.6 总结 208
第18章 当HOP遇上混沌工程 210
18.1 什么是HOP 210
18.2 HOP的主要原则 210
18.3 HOP遇上混沌工程 212
18.4 总结 215
第19章 数据库的混沌工程 216
19.1 为什么我们需要混沌工程 216
19.2 应用混沌工程 218
19.3 检测故障 222
19.4 自动化混沌工程 223
19.5 总结 226
第20章 安全混沌工程的案例 227
20.1 现代安全手段 228
20.2 安全混沌工程与现有方法 231
20.3 安全Game Day 233
20.4 安全混沌工程工具示例:ChaoSlingr 234
20.5 总结 236
第21章 结语 238
作者简介 241
译者简介 241
封面简介 242
混沌工程已然腾飞。在各个垂直领域,成千上万的各种类型和规模的公司都将混沌工程作为核心实践,以使公司的产品和服务更安全、更可靠。虽然相关主题的资源(尤其是会议演讲)十分丰富,但都无法描绘混沌工程的全貌。
Nora和Casey着手编写了这本完整讨论混沌工程的书。因为整个行业都在广泛实践混沌工程,而且该学科也在不断地发展,所以编写本书并不轻松。本书会展现混沌工程背后的历史,讨论奠定混沌工程基础的理论、定义和原则,研究整个软件行业实现混沌工程的方式,分析传统软件无法企及的示例,以及混沌工程实践的未来。
评论
还没有评论。