描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787519843182
快来使用Prometheus,Prometheus是基于指标的监控系统,为成千上万的组织在生产环境中提供服务。这本实用指南为应用开发人员、系统管理人员和DevOps人员提供了关于Prometheus关键部分的相关介绍,包括基础设施和应用的监控、仪表盘显示、告警、代码测控,以及如何通过导出器获取第三方的指标。 这个开源系统在过去几年中变得流行是有原因的。基于它简单而强大的的数据模型和查询语句,Prometheus专注于监控这一件事情并将其做到了极致。本书的作者同时也是Prometheus的开发人员Brian Brazil将会带着你学习Prometheus配置、节点导出器、Alertmanager,以及如何对应用和基础设施进行监控。
– 了解对你的应用程序代码进行测控的位置以及对应的测控量级。
– 使用标签来区分指标:*的键值对。
– 对Grafana这个流行的仪表盘工具进行介绍。
– 学习如何使用节点导出器对你的基础设施进行监控。
– 使用服务发现为你的机器和服务提供不同的监控视角。
– 在Kubernetes中使用Prometheus,并测试你可以在容器中使用的导出器。
– 将其他监控系统的数据转换为Prometheus能够识别的格式。
目录前言 1第I 部分 概述第1 章 什么是Prometheus 7什么是监控? 9监控简史 10监控分类 11Prometheus 架构 16客户端库 16导出器 18服务发现 18数据抓取 19存储 20仪表盘 20记录规则和告警 21告警管理 21数据持久化22Prometheus 不是什么 22第2 章 开始使用Prometheus 24运行Prometheus 24使用表达式浏览器 27运行Node Exporter 33告警 35第Ⅱ部分 应用监控第3 章 测控 47一个简单的程序 47Counter 数据类型 49统计异常 52统计大小 53Gauge 数据类型 54使用Gauge 类型 54回调 56summary 数据类型 57histogram 数据类型 59桶 60测控单元测试 63使用测控 64需要测控什么内容 64需要测控多少 66要怎么给指标命名 67第4 章 展示 71Python 72WSGI72Twisted 73Gunicorn 多进程 74Go 77Java 78HTTPServer 78Servlet 80Pushgateway 81桥接 85解析器 86展示格式 86指标类型 87标签 88Escaping 88时间戳 89检查指标 89第5 章 标签 91什么是标签 91测控和目标标签 92测控 93指标 94多标签 95子项 95聚合 97标签模式 99枚举 99信息 101什么时候使用标签 103基数 104第6 章 Grafana 仪表盘 107安装 108数据源 110仪表盘和面板 110避免图形墙 112图形面板 113时间控件 115单一统计面板 116表格面板 118模板变量 119第Ⅲ部分 基础设置监控第7 章 Node 导出器 127CPU 收集器 129文件系统收集器 129磁盘状态收集器 130Netdev 收集器 132Meminfo 收集器 132hwmom 收集器 133stat 收集器 134uname 收集器 134loadavg 收集器 135文本文件收集器 135使用文本文件收集器 136时间戳 138第8 章 服务发现 139服务发现机制 140静态配置 141文件 142Consul 145EC2 146重置标签 147选择要抓取的内容 148目标标签 151如何拉取 159metric_relabel_configs 161标签冲突和honor_labels 164第9 章 容器和Kubernates 166cAdvisor 166CPU 168内存 168标签 169Kubernetes 170在 Kubernetes 中运行 170服务发现 172kube-stat-metrics 182第10 章 常见导出器 183Cousul 184HAProxy 185Grok 导出器 188黑盒 191ICMP 193TCP 196HTTP 198DNS 201Prometheus 配置 203第11 章 与其他监控系统协同 207其他监控系统 207InfluxDB 209StatsD 210第12 章 编写导出器 214Consul 遥测 214自定义收集器 218标签 222指南 223第Ⅵ部分 PromQL第13 章 PromQL 概述 229聚合基础知识 229Gauge 229counter 231summary 232histogram 234选择器 236匹配器 236瞬时向量 238范围向量 239偏移 241HTTP 接口 242query 242query_range 245第14 章 聚合运算符 248分组 248without 249by 250操作符 252sum 252count 253avg 254stddev 和stdvar 255min 和max 256topk 和bottomk 256quantile 257count_values 259第15 章 二元运算符 261处理标量 261算术运算符262比较运算符263向量匹配 266一对一 266多对一和group_left 269多对多和逻辑运算符 272运算优先级 277第16 章 函数 279改变类型 279vector280scalar 280数学函数 281abs 282ln,log2 和log10 282exp 283sqrt 283ceil 和floor 283round 284clamp_max 和 clamp_min 284时间和日期 285time 285minute, hour, day_of_week, day_of_month, days_in_month, month 和year 286timestamp 287标签 288label_replace 288label_join 289缺失系列和absent 290使用sort 和sort_desc 进行排序 290Histogram 类型与histogram_quantile291计数器 292rate 292increase294irate 294resets 295改变gauge 值 296changes 296deriv 297predict_linear 297delta 298idelta 298holt_winters 298随时间聚合 299第17 章 记录规则 301使用记录规则 301何时使用记录规则 304降低基数大小 304编写范围向量函数 306API 规则 307如何不使用规则 307记录规则的命名 309第Ⅴ部分 告警第18 章 告警 315告警规则 316for 318告警标签 321注释和模板323什么是好的告警? 326设置Alertmanager 327外部标签 328第19 章 Alertmanager 330通知管道 330配置文件 331路由树 332接收器 340抑制 350Alertmanager Web 界面 351第Ⅵ部分 部署第20 章 整合 357计划推出 357Prometheus 规模增长 358使用联合机制监控全局 360长期存储 363运行Prometheus 365硬件 365配置管理 367网络和身份验证 369为失败做准备 370Alertmanager 集群 373元监控和交叉监控 374管理性能 375检测问题 376寻找昂贵的指标和目标 376减少负载 378水平分片 379管理变革 380获得帮助 381
“监控不仅仅是为了让工程师保持理智,它同时也是关键业务的重要基础设施。Prometheus的发布是监控领域重要的分水岭,它永久改变了人们进行监控的方式。本书由Prometheus团队成员所撰写和审核,它是你喜欢的*接近于官方指南的书籍。” ——Richard Hartmann MonitoringLead,SpaceNet
“书中的*实践和准则将会帮助你减少不必要的操作并且将 Prometheus 作为每天使用的监控助手。”——Oleg Mayko DevOps Engineer,Swisscom
评论
还没有评论。