描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787111580478
内容简介
本书以客户生命周期管理为主线,结合翔实的案例介绍具含金量的数据挖掘与建模方法,每个案例既自成体系又前后呼应。第1章介绍数据挖掘在客户生命周期管理中的应用,对如何构建客户标签体系和客户画像做了详细介绍。第2章结合一个市场研究案例,介绍完整的客户洞察分析过程,对对应分析、偏好分析、联合分析等简单好用的客户研究方法做了完美阐释。第3章结合*客户细分介绍完整的聚类过程,除快速、系统、两步聚类算法外,详细介绍实际分析过程中必不可少的数据预处理过程。第4章结合*客户精准营销案例,介绍营销响应模型的构建、评估与应用,完整阐述模型的整个生命周期。第5章结合*客户流失预警与挽留案例,介绍客户价值(数值)预测与流失倾向(事件)预测两类问题的建模过程及组合应用。第6章结合*客户反欺诈案例,介绍目前常用的反欺诈方法,以及机器学习中集成算法的典范——*森林。
目 录
Contents?目 录赞誉序前言第1章 金融数据挖掘与建模应用场景 11.1 客户数据挖掘的价值 11.2 金融客户生命周期及数据应用场景 31.3 代表性的数据应用场景 7第2章 客户获取:信用卡客户欺诈评分案例 82.1 案例背景 92.2 数据准备与预处理 102.2.1 数据源 102.2.2 变量设计 112.3 构建评分模型 132.3.1 算法选择 132.3.2 模型训练 142.3.3 模型评估 162.4 评分模型的应用 192.5 小结 20第3章 客户提升:信用卡客户精准营销案例 213.1 案例背景 213.2 建模准备 213.2.1 准备数据 223.2.2 数据预处理 263.2.3 过度抽样 273.2.4 构造训练集及测试集 303.3 数据清洗及变量粗筛 323.3.1 连续变量与连续变量之间 333.3.2 分类变量和分类变量之间 393.3.3 分类变量和连续变量之间 433.3.4 数据的错误及缺失值 473.3.5 数据离群值 533.3.6 重编码 593.4 变量压缩与转换变量 613.4.1 分类变量的水平数压缩 613.4.2 连续变量聚类 653.4.3 连续变量的分箱 773.4.4 变量的转换 793.5 模型训练 803.5.1 关于Logistic回归 803.5.2 变量筛选方法 813.6 模型评估 883.6.1 模型估计 883.6.2 模型评估 893.6.3 调整过度抽样 983.6.4 收益矩阵 983.6.5 模型转换为打分卡 1003.7 模型的部署及更新 1003.7.1 模型的部署 1003.7.2 模型的监测及更新 1013.8 本章小结 103第4章 客户成熟:银行零售客户渠道偏好细分案例 1044.1 案例背景 1044.2 聚类分析流程 1054.3 数据标准化 1074.3.1 标准化介绍 1074.3.2 标准化实现 1104.4 变量聚类 1114.4.1 变量聚类介绍 1114.4.2 变量聚类基本步骤 1124.4.3 SAS实现变量聚类 1134.5 变量降维与可视化 1184.5.1 图形化探索 1184.5.2 主成分分析法降维 1204.6 ACECLUS预处理过程 1234.6.1 ACECLUS介绍 1234.6.2 ACECLUS过程 1234.6.3 ACECLUS示例 1234.7 系统聚类分析 1284.7.1 系统聚类法 1284.7.2 样本与样本之间的度量 1294.7.3 距离定义与测量 1294.7.4 相关系数 1314.7.5 类与类之间的度量 1314.7.6 系统聚类法 1394.7.7 不同系统聚类法之间的比较 1404.7.8 类个数的确定 1584.8 快速聚类 1594.8.1 快速聚类法 1594.8.2 快速聚类法实现 1604.8.3 快速聚类法优缺点 1614.9 两步聚类法 1614.9.1 两步聚类法 1614.9.2 两步聚类法实现 1614.10 本章小结 167第5章 客户衰退:银行贷款违约预测案例 1685.1 案例背景 1695.2 维度分析 1705.3 建模分析 1775.4 业务应用 1795.5 小结 179第6章 客户挽留:信用卡客户流失管理案例 1806.1 案例背景 1816.2 数据准备 1826.2.1 设定目标变量 1826.2.2 设定时间窗 1836.2.3 设计预测变量 1846.2.4 准备数据宽表 1856.3 流失倾向预警:用Logistic回归构建响应率模型 1866.3.1 粗分类 1876.3.2 计算分组变量的WOE值和IV值 1916.3.3 共线性检验 1946.3.4 模型训练:显著性检验 1956.3.5 模型评估 1966.4 潜在客户价值预测:两阶段建模法 2016.4.1 阶段1概率预测 2016.4.2 阶段2 数值预测 2016.4.3 模型评估 2036.5 细分:差异化营销服务的基础 2046.6 小结 208
前 言
Preface?前 言古之欲明德于天下者,先治其国;欲治其国者,先齐其家;欲齐其家者,先修其身;欲修其身者,先正其心;欲正其心者,先诚其意;欲诚其意者,先致其知;致知在格物。 ——《礼记》 知之真切笃实处即是行,行之明觉精察处即是知。 ——王阳明 大数据势不可挡。然而,对于多数公司来说,数据分析和建模能力尚未完全发展起来,虽主观意识上认同了大数据的潜在价值,也开始采集、储备数据,却不知如何才能让数据充分融入业务、帮助业务部门达成业务指标。 大数据是一种全新的业务和产品创新思维,是海量数据存储和计算的基础架构,但小数据的分析运用才是多数公司和业务领域必须关注和掌握的核心能力。本书将聚焦于实践应用,介绍数据分析、建模的方法和在业务领域的实际应用,原理和基础理论知识不是重点,因此数学公式极少,除非它比文字更能表达内容。总体上,本书不会详细罗列热门的机器学习算法、数据挖掘方法以及人工智能,而是基于金融企业当前的实际需要,精选代表性的业务领域以及被广泛验证实用高效的分析建模技术,这些技术是数据分析人员必须掌握的技能。本书同时也是为掌握统计学知识和基本数据分析方法的业务专家所写,帮助他们实践、应用数据建模手段,提升对业务的引导和驾驭能力。 本书的目标读者是高级数据分析师、咨询顾问、企业内部的业务专家、高校学者和研究生,以及立志于夯实数据建模基本功,并希望不断提升的数据挖掘与数据建模人员。 内容提要知者过之,愚者不及也;贤者过之,不肖者不及也。 ——《中庸》 在学校和生活中,工作的重要的动力是工作中的乐趣,是工作获得结果时的乐趣以及对这个结果的社会价值的认识。 ——阿尔伯特·爱因斯坦 本书是一本介绍金融企业数据建模的专著。在内容上,书中以信贷(信用卡)客户的生命周期管理为主线,选取了5个在客户获取、提升、成熟和衰退环节的经典的金融企业案例,来详细介绍价值与实用性的数据建模过程,每个案例既自成体系又前后呼应。 第1章介绍了数据挖掘和建模在信贷(信用卡)客户生命周期管理中的应用场景。 第2章结合信用卡客户反欺诈案例,介绍了常用的三类反欺诈手段以及欺诈评分模型的构建过程,模型采用机器学习集成算法的典范——随机森林,并给出SAS代码(各类书中),对回归类、决策树类、神经网络类三大类机器学习算法做了比对。 第3章结合信用卡客户精准营销案例,介绍了营销响应模型的构建、评估与应用,完整阐述从数据准备、清洗、变量粗筛选、变量压缩与转换、建模、模型评估、部署、监测与更新等模型构建过程中所涉及的操作方法。 第4章通过信用卡客户细分案例,介绍了完整的聚类过程,除快速、系统、两步聚类算法外,还详细介绍了实际分析过程中必不可少的数据预处理过程,并对聚类模型做了完整的阐释。 第5章通过贷款违约预测案例,为零建模基础的读者提供了一个简化的行为评分模型的构建过程,帮助零基础读者快速上手,同时简单介绍了金融企业的三大风险模型(评分卡)。 第6章结合信用卡客户流失预警与挽留案例,介绍客户价值(数值)预测与流失倾向(事件)预测两类问题的建模过程及组合应用,不拘泥于方法本身,彰显了以企业实际运用为导向的写作思路,让案例更具实用参考价值。 了解完五个案例之后,你会发现这些方法和模型在大部分业务场景中似曾相识,金融企业的数据挖掘与建模将变得易如反掌。 全书由陈春宝统稿,其中,第1、2、5、6章由陈春宝撰写,第3章由徐筱刚撰写,第4章由田建中撰写。 源代码下载若你对书中源代码感兴趣,可与作者联系,邮箱:[email protected]。
评论
还没有评论。