描述
包 装: 平塑勒是否套装: 否国际标准书号ISBN: 9787121466250
内容简介
本书全面介绍了最新的因果推断方法,并以实践应用为辅,方便读者理解。本书化繁为简,层层深入地引导读者了解因果推断方法发展的历程和现状。通过本书,读者可以获得关于因果推断方法的全局视角。本书共5章,以递进的方式展开对因果推断方法的介绍。第1章从广泛熟悉的相关关系出发,通过介绍相关关系与因果关系的联系与区别过渡到对因果关系的探索。在明确因果关系概念的基础上,第2章主要介绍洞察因果关系的金标准:随机对照试验。基于随机对照试验的原理和不同的应用场景,本书将因果推断方法分为3类:基于设计思想的因果推断方法、基于潜在结果框架的因果推断方法和基于结构因果模型的因果推断方法。第3章~第5章分别对这3类方法进一步详细分类,并进行解析。同时,这3类方法的应用场景也呈现递进的关系。本书适合有一定统计知识背景的读者,特别是希望深入研究因果推断方法并将其应用于各领域实践的相关研究者。同时,本书也适合对因果推断方法感兴趣的在校学生和业界工作人员。
目 录
第1章 相关关系和因果关系 1
1.1 相关关系 1
1.2 因果关系 3
1.3 相关关系与因果关系之间的迷雾 6
1.3.1 混杂 6
1.3.2 样本的选择性偏差 7
1.4 因果推断方法 9
1.4.1 符号和表示工具 9
1.4.2 本书涉及的因果推断方法 10
参考文献 12
第2章 随机对照试验 14
2.1 随机对照试验的统计学原理 14
2.1.1 基本概念 14
2.1.2 随机对照试验的核心思想 15
2.1.3 统计学的反证思维:假设检验 16
2.2 总体方差未知的情况 17
2.3 两类统计错误 19
2.4 随机对照试验流程 21
2.4.1 最小样本容量 22
2.4.2 试验结果分析 24
2.5 本章小结 25
参考文献 26
第3章 基于设计思想的因果推断方法 28
3.1 双重差分法 28
3.1.1 DID模型的原理 29
3.1.2 DID模型的有效性检验 30
3.1.3 DID法的注意事项 32
3.1.4 DID法案例分析 33
3.2 合成控制法 39
3.2.1 构建潜在的合成控制组 40
3.2.2 求解合成控制组的权重 41
3.2.3 合成控制组的应用 42
3.2.4 合成控制法的评价 43
3.2.5 合成控制法案例分析 44
3.3 断点回归法 48
3.3.1 设计原理 49
3.3.2 确定分组变量和断点 49
3.3.3 精确断点与模糊断点 51
3.3.4 断点回归法的有效性检验 52
3.3.5 断点回归法的结果分析 52
3.3.6 断点回归法的评价 53
3.3.7 断点回归法案例分析 54
3.4 工具变量法 61
3.4.1 工具变量的定义 61
3.4.2 工具变量的前提假设 62
3.4.3 工具变量的有效性 63
3.4.4 工具变量的实践方式 64
3.4.5 工具变量法案例分析 66
3.5 主分层法 72
3.5.1 随机对照试验中的不依从问题 72
3.5.2 主分层法的原理 73
3.5.3 主分层法的前提假设 75
3.6 本章小结 76
参考文献 77
第4章 基于潜在结果框架的因果推断方法 80
4.1 POF 80
4.1.1 POF的基本构成元素 80
4.1.2 POF的因果指标 81
4.1.3 POF的运行规则 82
4.2 均衡的样本子空间 88
4.2.1 分层方法 88
4.2.2 匹配方法 90
4.2.3 基于决策树的子空间划分 94
4.3 重加权的样本空间 96
4.3.1 逆倾向得分权重 96
4.3.2 双鲁棒估计方法 97
4.3.3 基于提升方法的泛化倾向得分权重 98
4.3.4 协变量均衡倾向得分权重 100
4.3.5 泛化的协变量均衡倾向得分权重 101
4.4 去混杂的表征空间 104
4.4.1 均衡表征学习 104
4.4.2 局部相似表征学习 107
4.5 基于潜在结果框架的因果推断方法的综合试验 112
4.5.1 数据生成 112
4.5.2 对照试验:估计ATE的常规方法 114
4.5.3 试验一:分层方法 115
4.5.4 试验二:匹配方法 117
4.5.5 试验三:基于决策树的子空间划分 119
4.5.6 试验四:逆倾向得分权重 120
4.5.7 试验五:双鲁棒估计方法 121
4.5.8 试验六:基于提升方法的泛化倾向得分权重 122
4.5.9 试验七:协变量均衡倾向得分权重 123
4.5.10 试验八:泛化的协变量均衡倾向得分权重 124
4.5.11 试验九:均衡表征学习和局部相似表征学习 124
4.5.12 总结 127
4.6 本章小结 127
参考文献 128
第5章 基于结构因果模型的因果推断方法 132
5.1 因果层级 132
5.2 结构因果模型 134
5.2.1 因果图 134
5.2.2 因果图的基本节点结构 135
5.2.3 因果图上的概率分布 137
5.2.4 因果图上结构方程 139
5.2.5 结构因果模型小结 141
5.3 干预推断 142
5.3.1 后门调整 142
5.3.2 前门调整 143
5.3.3 do演算 144
5.4 干预的可识别性和识别算法 147
5.4.1 基本概念和定义 147
5.4.2 Px(v)的可识别性 150
5.4.3 Px(s)的可识别性 163
5.4.4 Pt(s)的可识别性 179
5.4.5 半马尔可夫模型向马尔可夫模型的进化 183
5.5 反事实预测 184
5.6 本章小结 186
参考文献 186
1.1 相关关系 1
1.2 因果关系 3
1.3 相关关系与因果关系之间的迷雾 6
1.3.1 混杂 6
1.3.2 样本的选择性偏差 7
1.4 因果推断方法 9
1.4.1 符号和表示工具 9
1.4.2 本书涉及的因果推断方法 10
参考文献 12
第2章 随机对照试验 14
2.1 随机对照试验的统计学原理 14
2.1.1 基本概念 14
2.1.2 随机对照试验的核心思想 15
2.1.3 统计学的反证思维:假设检验 16
2.2 总体方差未知的情况 17
2.3 两类统计错误 19
2.4 随机对照试验流程 21
2.4.1 最小样本容量 22
2.4.2 试验结果分析 24
2.5 本章小结 25
参考文献 26
第3章 基于设计思想的因果推断方法 28
3.1 双重差分法 28
3.1.1 DID模型的原理 29
3.1.2 DID模型的有效性检验 30
3.1.3 DID法的注意事项 32
3.1.4 DID法案例分析 33
3.2 合成控制法 39
3.2.1 构建潜在的合成控制组 40
3.2.2 求解合成控制组的权重 41
3.2.3 合成控制组的应用 42
3.2.4 合成控制法的评价 43
3.2.5 合成控制法案例分析 44
3.3 断点回归法 48
3.3.1 设计原理 49
3.3.2 确定分组变量和断点 49
3.3.3 精确断点与模糊断点 51
3.3.4 断点回归法的有效性检验 52
3.3.5 断点回归法的结果分析 52
3.3.6 断点回归法的评价 53
3.3.7 断点回归法案例分析 54
3.4 工具变量法 61
3.4.1 工具变量的定义 61
3.4.2 工具变量的前提假设 62
3.4.3 工具变量的有效性 63
3.4.4 工具变量的实践方式 64
3.4.5 工具变量法案例分析 66
3.5 主分层法 72
3.5.1 随机对照试验中的不依从问题 72
3.5.2 主分层法的原理 73
3.5.3 主分层法的前提假设 75
3.6 本章小结 76
参考文献 77
第4章 基于潜在结果框架的因果推断方法 80
4.1 POF 80
4.1.1 POF的基本构成元素 80
4.1.2 POF的因果指标 81
4.1.3 POF的运行规则 82
4.2 均衡的样本子空间 88
4.2.1 分层方法 88
4.2.2 匹配方法 90
4.2.3 基于决策树的子空间划分 94
4.3 重加权的样本空间 96
4.3.1 逆倾向得分权重 96
4.3.2 双鲁棒估计方法 97
4.3.3 基于提升方法的泛化倾向得分权重 98
4.3.4 协变量均衡倾向得分权重 100
4.3.5 泛化的协变量均衡倾向得分权重 101
4.4 去混杂的表征空间 104
4.4.1 均衡表征学习 104
4.4.2 局部相似表征学习 107
4.5 基于潜在结果框架的因果推断方法的综合试验 112
4.5.1 数据生成 112
4.5.2 对照试验:估计ATE的常规方法 114
4.5.3 试验一:分层方法 115
4.5.4 试验二:匹配方法 117
4.5.5 试验三:基于决策树的子空间划分 119
4.5.6 试验四:逆倾向得分权重 120
4.5.7 试验五:双鲁棒估计方法 121
4.5.8 试验六:基于提升方法的泛化倾向得分权重 122
4.5.9 试验七:协变量均衡倾向得分权重 123
4.5.10 试验八:泛化的协变量均衡倾向得分权重 124
4.5.11 试验九:均衡表征学习和局部相似表征学习 124
4.5.12 总结 127
4.6 本章小结 127
参考文献 128
第5章 基于结构因果模型的因果推断方法 132
5.1 因果层级 132
5.2 结构因果模型 134
5.2.1 因果图 134
5.2.2 因果图的基本节点结构 135
5.2.3 因果图上的概率分布 137
5.2.4 因果图上结构方程 139
5.2.5 结构因果模型小结 141
5.3 干预推断 142
5.3.1 后门调整 142
5.3.2 前门调整 143
5.3.3 do演算 144
5.4 干预的可识别性和识别算法 147
5.4.1 基本概念和定义 147
5.4.2 Px(v)的可识别性 150
5.4.3 Px(s)的可识别性 163
5.4.4 Pt(s)的可识别性 179
5.4.5 半马尔可夫模型向马尔可夫模型的进化 183
5.5 反事实预测 184
5.6 本章小结 186
参考文献 186
评论
还没有评论。