描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787111768456
本书教你轻松掌握改善组织数据质量的实用策略
本书深入剖析了组织中数据质量的重要性及提升方法,为组织打造优质数据提供了全面的指导。书中首先揭示了糟糕的数据质量对企业流程、决策及合规的潜在影响,进而阐述了提高数据质量的核心要素和端到端的实践流程。详细解析了数据质量提升方案的每个步骤,从构建业务案例到管理初期的繁忙阶段,再到确定关键利益相关者并明确数据规则,为读者提供了清晰的操作路径。此外,书中还介绍了数据监控与修正的有效方法,并探讨了如何将良好的数据实践融入企业日常运营。最后,作者总结了一份提升数据质量的完整纲要,配以实例和模板工具,以点燃读者的探索热情,并助力数据质量工作持续高效推进。
本书是企业数据质量管理的指南,适合各类组织的数据从业者和管理者阅读参考。
译者序
序
贡献者
前言
第1部分入门
第1章数据质量对组织的影响
1.1本书的价值
1.1.1高层支持的重要性
1.1.2问题数据的详细定义
1.1.3问题数据与完美数据
1.2问题数据的影响
1.2.1量化问题数据的影响
1.2.2问题数据的深层次影响
1.3产生问题数据的原因
1.3.1数据文化缺失
1.3.2流程处理速度优先于数据治理
1.3.3合并与收购
1.4本章小结
第2章数据质量原则
2.1在数据治理背景下的数据质量
2.1.1数据治理作为一门学科
2.1.2数据治理工具和主数据管理
2.1.3如何将数据质量融入数据治理和主数据管理
2.2公认的数据质量原则和术语
2.2.1数据质量基本术语的定义
2.2.2数据质量维度
2.3数据质量方案的利益相关方
2.4数据质量改进周期
2.4.1商业案例
2.4.2数据发现
2.4.3规则制定
2.4.4监控
2.4.5补救
2.4.6纳入日常运营
2.5本章小结
第3章数据质量的商业案例
3.1活动、组成部分和费用
3.1.1数据质量方案的活动
3.1.2早期阶段
3.1.3规划和商业案例阶段
3.2定量收益估算
3.2.1实例——计算量化收益的难度
3.2.2量化策略
3.3定性收益评估
3.3.1调查和焦点小组
3.3.2详细阐述数据质量定性风险
3.4预测领导力挑战
3.4.1“Excel就可以完成工作”的挑战
3.4.2持续费用所有权的挑战
3.4.3费用过高的挑战
3.4.4“我们为什么需要数据质量工具”的挑战
3.5本章小结
第4章数据质量方案入门
4.1预算批准后的最初几周
最初几周的关键活动
4.2了解数据质量工作流
早期需要的工作流
4.3为你的团队确定合适的人选
将人力资源匹配到工作流中
4.4本章小结
第2部分理解和监控关键数据
第5章数据发现
5.1数据发现流程概览
5.2理解业务策略、目标和挑战
5.2.1识别利益相关方的方法
5.2.2相关方的沟通内容
5.3战略、目标、流程、分析和数据的层次结构
5.3.1利用战略确定优先次序
5.3.2将挑战与流程、数据和报告关联
5.4数据剖析的基础知识
5.4.1数据剖析工具的经典功能
5.4.2使用能力
5.4.3连接到数据库
5.5本章小结
第6章数据质量规则
6.1数据质量规则介绍规则范围
6.2数据质量规则的主要特征
6.2.1规则权重
6.2.2规则维度
6.2.3规则优先级
6.2.4规则阈值
6.2.5单次规则失败的成本
6.3实施数据质量规则
6.3.1设计规则
6.3.2构建数据质量规则
6.3.3测试数据质量规则
6.4本章小结
第7章根据规则监控数据
7.1数据质量报告介绍
7.1.1不同层级的数据质量报告
7.1.2数据安全考虑
7.2设计高级数据质量仪表板维度和筛选
7.3设计质量规则结果报告质量规则报告的典型特征
7.4设计不合格数据报表
7.4.1不合格数据报表的典型特征
7.4.2复用不合格数据报表
7.4.3多个不合格数据报表
7.4.4导出不合格数据报表
7.5管理沉寂和重复数据
7.5.1管理沉寂数据
7.5.2管理重复数据
7.5.3检测重复数据
7.6向利益相关方展示调查结果
7.6.1成功启动数据质量报告
7.6.2将报表纳入治理中
7.7本章小结
第3部分持续提高数据质量
第8章数据质量补救
8.1整体补救过程
8.2确定补救活动优先级
8.2.1重新审视收益
8.2.2确定优先级的方法
8.3确定补救办法
8.3.1典型的补救方法
8.3.2将问题与正确的方法相匹配
8.4补救工作常态化
8.5了解工作量和成本
补救的成本类型
8.6管理补救活动
关键的管理活动
8.7跟踪收益
8.7.1量化示例
8.7.2追踪量化收益
8.8本章小结
第9章将数据质量纳入组织中
9.1预防问题再次发生
9.1.1预防问题再次发生的
方法
9.1.2人为失误的持续影响
9.1.3短期水平分析报告
9.2持续改进质量管理规则
9.2.1识别规则变更的策略
9.2.2更新数据质量规则
9.3过渡到日常补救活动中
9.3.1成功的必要条件
9.3.2为成功过渡进行规划
9.3.3成功过渡的标志
9.4持续数据质量之旅
9.4.1数据质量方案路线图
9.4.2确定下一个方案
9.4.3获取支持
9.4.4如果后续方案没有获得批准,该怎么办?
9.5本章小结
第10章最佳实践和常见错误
10.1最佳实践
10.1.1选择最佳实践
10.1.2主要从源头管理数据质量
10.1.3落实支持性治理会议
10.1.4将数据质量纳入全组织教育计划
10.1.5改善数据管理员和数据
生产者之间的关系
10.1.6本书的最佳实践
10.2常见错误
10.2.1未能实施最佳实践
10.2.2缺乏实用性
10.2.3技术驱动的数据质量规则
10.2.4一次性补救活动
10.2.5限制对数据质量结果的访问
10.2.6避免数据质量工作中的各自为政
10.3数据质量工作的未来
10.3.1大语言模型
10.3.2各组织更加重视高质量数据
10.4本章小结
数据质量管理是一个看似简单,实则需要一定经验与技巧的数据工作。数据质量又与高质量的数据应用紧密相关。数据质量工作开展过程中,会遇到体系框架,业务部门职责边界,项目实施与运营分工,质量提升与数据应用场景关联等问题。本书从体系化的角度综合介绍了关于数据质量工作的方法,值得大家学习并在工作中实践、检验。也感谢马欢老师的倾情付出,将多部国外优秀的数据著作引入国内。
用友高端事业群 首席数据官 张旭
数治理是大型集团企业数字化转型的基础,数据质量管理作为数据治理工作中的核心组成部分至关重要,本书不仅系统、详尽地阐述了数据质量全生命周期管理,还提供了实用的方法论与案例,指导用户将数据质量管理融入业务端到端流程,帮助读者构建起坚实的数据质量管理体系。
北京三维天地科技股份有限公司 副总裁 曹朝辉
数据质量的好坏不仅决定了数据的潜在价值与交易前景,亦将影响相关AI技术应用的开发。本书汇聚了当前国际最前沿的数据质量管理理念及方法,将为我国企业提供重要的实践指引与参考价值。
中山大学大数据研究院副院长、中山大学信息管理学院教授、博导、院长助理 彭国超
透过数据问题表象,能够发现企业在业务流程、规则、管理机制、人员能力等方面存在诸多改善点。这意味着数据质量要治本,不仅依赖专业知识与技术,还要能根据企业运营特点构建体系联动的管理机制(如流程、财务、内控、组织等),这也是为什么数据质量局部技术落地易,但持续运营扎根难的原因,是对数据从业者最大的挑战。本书提供了全面的数据质量管理实践内容,强调从理解企业运营的角度掌握数据质量管理知识、工具、方法及案例,这对于想要致力于持续改进的数据质量管理实践者来说,非常具有学习价值。
隆基绿能 数据管理部负责人 李小青博士
企业在着手规划数据质量项目之际,往往会接触到一系列深奥复杂的理念。幸运的是,资深专家罗伯特•霍克凭借其深厚的行业积淀,以平易近人的方式,将这些晦涩难懂的概念一一剖析清晰。他不仅巧妙地穿插了诸多生动实例与应用场景,还列举了实践中常见的误区,仿佛为这一领域注入了一股鲜活的力量,让所有数据质量规划的细节都跃然纸上,变得既直观又易于掌握。
中国软件评测中心 副主任 吴志刚
数据质量是数据资产货币化和人工智能发挥最佳作用的核心基础。《数据质量管理实践手册》是一本易读且专业的书籍。通过实际案例和经过验证的框架,本书帮助数据从业者和商业领导者理解并有效管理数据质量。它是AI时代每个人的之作。
香港数据素养协会 创会主席 湛家扬博士
评论
还没有评论。