描述
开 本: 16开纸 张: 胶版纸包 装: 精装是否套装: 否国际标准书号ISBN: 9787513027175
编辑推荐
本书致力于介绍复杂分层数据分析的前沿知识,侧重于算法、仿真与实证研究
内容简介
具有复杂分层结构的数据在现实生活中很普遍,剖析这类数据,发现该类数据表象下的潜在规律对于统计学等科研领域很有意义。本书致力于介绍复杂分层数据分析的前沿知识,侧重于算法、仿真与实证研究,主要包括两大块内容:分位回归与分层—分位回归。
本书可作为统计学及其相关领域大学生、研究生的教学参考书,亦可供教师和科技人员参考。
本书可作为统计学及其相关领域大学生、研究生的教学参考书,亦可供教师和科技人员参考。
目 录
上篇 分位回归
第1章 分位回归引论
1.1 引言
1.1.1 分位数
1.1.2 分位回归
1.1.3 分位回归方法的演变
1.2 估计方法和算法
1.2.1 参数分位回归模型
1.2.2 Box-Cox变换分位数模型
1.2.3 非参分位回归模型
1.2.4 窗宽选择
1.2.5 半参分位回归模型
1.2.6 两步法
1.3 分位回归应用领域
1.3.1 执行总裁年报酬与公司股本的市场价值关系
1.3.2 分位数恩格尔曲线(EngelCurve)
1.3.3 分位回归和婴儿体重的决定因素
1.3.4 医学中参考图表的应用
1.3.5 在生存分析方面的应用
1.3.6 风险值、分布尾部及分位数
1.3.7 经济
1.3.8 环境模型的应用
1.3.9 在检测异方差性上的应用
1.4 其他方面的进展
1.4.1 时间序列的分位回归
1.4.2 拟合优度
1.4.3 贝叶斯分位回归
1.5 软件和标准误差
1.6 文献介绍
第2 章线性分位回归模拟
2.1 基本概念
2.1.1 基于条件分位函数的定义
2.1.2 基于分位回归模型的定义
2.1.3 基于损失函数的定义
2.1.4 基于非对称拉普拉斯密度的定义
2.2 家庭背景因素的影响
2.3 数据.
2.4 估计结果
2.4.1 10 年级的影响估计
2.4.2 11 年级的影响估计
2.4.3 12 年级的影响估计
2.5 置信区间和相关解释
2.5.1 哪一个是最好的?双亲、单亲还是没有父母
2.5.2 为什么我们要关注兄弟姐妹关系
2.5.3 父亲和母亲之间的影响的区别是什么
2.5.4 性别上有差异吗
2.5.5 表现差距在哪里
2.5.6 语言问题是很严重的问题吗
2.5.7 本地学生从数学教学中获益了吗
2.6 结论
2.7 文献介绍
第3 章非参数分位回归模拟
3.1 稳健局部逼近
3.1.1 介绍
3.1.2 LAM 估计的相合性
3.1.3 LAM 估计的渐近分布
3.1.4I=2条件下关于K和β的最优估计
3.1.5 文献介绍
3.2 非参数函数估计
3.2.1 引言
3.2.2 渐近性质
3.2.3 百分位回归和预测区间
3.2.4 文献介绍
3.3 局部线性分位回归
3.3.1 引言
3.3.2 局部线性检验函数的最小化
3.3.3 局部线性双核平滑
3.3.4 实际性能
3.3.5 文献介绍
3.4 教育数据分析
3.4.1 数据
3.4.2 方法
3.4.3 科学成绩
3.4.4 数学成绩
3.4.5 科学成绩和数学成绩的关系
3.4.6 文献介绍
第4 章适应性分位回归模拟
4.1 局部常数适应性分位回归
4.1.1 引言
4.1.2 适应性估计
4.1.3 实现
4.1.4 理论性质
4.1.5 蒙特卡洛研究
4.1.6 不同方法的比较
4.1.7 局部适应性窗宽的自动选择
4.1.8 应用
4.1.9 文献介绍
4.2 局部线性适应性分位回归
4.2.1 介绍
4.2.2 局部线性适应性估计
4.2.3 算法
4.2.4 理论性质
……
第5章 可加性分位回归模拟
第6章 变系数分位回归模拟
第7章 单指数分位回归模拟
第8章 分位自回归模拟
第9章 复合分位回归模拟
第10章 高维分位回归模拟
第11章 贝叶斯分位回归模拟
下篇 分层分位回归模拟
第12章 分层样条分位回归模拟
第13章 分层线性分位回归模拟
第14章 分层半参数分位回归模拟
第15章 复合分层线性分位回归模拟
第16章 复合分层半参数分位回归模拟
参考文献
第1章 分位回归引论
1.1 引言
1.1.1 分位数
1.1.2 分位回归
1.1.3 分位回归方法的演变
1.2 估计方法和算法
1.2.1 参数分位回归模型
1.2.2 Box-Cox变换分位数模型
1.2.3 非参分位回归模型
1.2.4 窗宽选择
1.2.5 半参分位回归模型
1.2.6 两步法
1.3 分位回归应用领域
1.3.1 执行总裁年报酬与公司股本的市场价值关系
1.3.2 分位数恩格尔曲线(EngelCurve)
1.3.3 分位回归和婴儿体重的决定因素
1.3.4 医学中参考图表的应用
1.3.5 在生存分析方面的应用
1.3.6 风险值、分布尾部及分位数
1.3.7 经济
1.3.8 环境模型的应用
1.3.9 在检测异方差性上的应用
1.4 其他方面的进展
1.4.1 时间序列的分位回归
1.4.2 拟合优度
1.4.3 贝叶斯分位回归
1.5 软件和标准误差
1.6 文献介绍
第2 章线性分位回归模拟
2.1 基本概念
2.1.1 基于条件分位函数的定义
2.1.2 基于分位回归模型的定义
2.1.3 基于损失函数的定义
2.1.4 基于非对称拉普拉斯密度的定义
2.2 家庭背景因素的影响
2.3 数据.
2.4 估计结果
2.4.1 10 年级的影响估计
2.4.2 11 年级的影响估计
2.4.3 12 年级的影响估计
2.5 置信区间和相关解释
2.5.1 哪一个是最好的?双亲、单亲还是没有父母
2.5.2 为什么我们要关注兄弟姐妹关系
2.5.3 父亲和母亲之间的影响的区别是什么
2.5.4 性别上有差异吗
2.5.5 表现差距在哪里
2.5.6 语言问题是很严重的问题吗
2.5.7 本地学生从数学教学中获益了吗
2.6 结论
2.7 文献介绍
第3 章非参数分位回归模拟
3.1 稳健局部逼近
3.1.1 介绍
3.1.2 LAM 估计的相合性
3.1.3 LAM 估计的渐近分布
3.1.4I=2条件下关于K和β的最优估计
3.1.5 文献介绍
3.2 非参数函数估计
3.2.1 引言
3.2.2 渐近性质
3.2.3 百分位回归和预测区间
3.2.4 文献介绍
3.3 局部线性分位回归
3.3.1 引言
3.3.2 局部线性检验函数的最小化
3.3.3 局部线性双核平滑
3.3.4 实际性能
3.3.5 文献介绍
3.4 教育数据分析
3.4.1 数据
3.4.2 方法
3.4.3 科学成绩
3.4.4 数学成绩
3.4.5 科学成绩和数学成绩的关系
3.4.6 文献介绍
第4 章适应性分位回归模拟
4.1 局部常数适应性分位回归
4.1.1 引言
4.1.2 适应性估计
4.1.3 实现
4.1.4 理论性质
4.1.5 蒙特卡洛研究
4.1.6 不同方法的比较
4.1.7 局部适应性窗宽的自动选择
4.1.8 应用
4.1.9 文献介绍
4.2 局部线性适应性分位回归
4.2.1 介绍
4.2.2 局部线性适应性估计
4.2.3 算法
4.2.4 理论性质
……
第5章 可加性分位回归模拟
第6章 变系数分位回归模拟
第7章 单指数分位回归模拟
第8章 分位自回归模拟
第9章 复合分位回归模拟
第10章 高维分位回归模拟
第11章 贝叶斯分位回归模拟
下篇 分层分位回归模拟
第12章 分层样条分位回归模拟
第13章 分层线性分位回归模拟
第14章 分层半参数分位回归模拟
第15章 复合分层线性分位回归模拟
第16章 复合分层半参数分位回归模拟
参考文献
前 言
很多分层数据具有以下分层结构:我们用变量来描述个体,而个体嵌套在更大单元里,形成金字塔形状。以教育方面的数据为例,学生被分成班级,班级嵌套在学校里。学校上面有社区,社区上面还有省、国家等。
自20世纪70年代以来,人们开始研究分层结构数据的统计模型。比如,作为对线性模型贝叶斯估计学术方面的贡献,Lindley&Smith(1972)和Smith(1973)引入了分层线性模型(HierarchicalLinearModel)这一术语。然而,近年来分层模型在不同的领域有不同的称谓:在社会学研究里,叫作多水平模型(MultilevelModel),参见Mason,Wong&Entwistle(1983),Goldstein(1995);生物统计上则称为混合效应模型(Mixed-e.ectsModel)或者随机效应模型(Random-e.ectsModel),参见Elston(1962),Laird(1982),Longford(1987)以及Singer(1998);计量经济学上称为随机系数回归模型(Random-coe.cientRegressionModel),参见Rosenberg(1973)和Longford(1993);在贝叶斯统计里,我们称之为条件独立分层模型(ConditionallyIndependentHierarchicalModel),参见Kass&Ste.ey(1989)。一般的统计文献则称之为协方差成分模型(CovarianceComponentsModel),参见Dempster,Rubin&Tsutakawa(1981)。Hobert(2000)给出了目前有关拟合分层模型计算方面的热点问题综述。
在上述所提到的各种模型背后,现有的分层模型理论主要关注的是在给定预测变量X的条件下,拟合响应变量Y的条件期望。尽管在很多应用中,这些理论能够应付了,然而它们却不能完全刻画响应变量在各分位点上的情况。例如,学校平均成绩有时候可能会隐藏一些涉及差生与优等生方面的问题,因为平均数本身不能对学生成绩提供一个“谱视”(SpectralView)。
分位回归(QuantileRegression,QR)方法,亦称分位数回归,产生于30年前。由于它能够全面刻画一个条件随机变量的各分位点随协变量的变化情况,所以近年来它逐渐发展成为一种综合的分析线性和非线性模型的统计方法。目前,有大量的文献是关于分位回归研究的。在本书中,我们充分利用了分层模拟与分位回归的优点,提出分层分位回归模型(HierarchicalQuantileRegressionModels)。这类模型具有如下特点:①能够全面刻画出给定高维解释变量的条件下响应变量的各分位点情况;②估计出来的系数向量,即边际效应,对于响应变量的离群观测值来说,是稳健的;③在不同分位点上潜在的不同解具有很有用的解释意义;④沿袭了分层模拟与分位回归模型二者所有的优点。
本书致力于介绍复杂分层数据分析前沿的知识,侧重于算法、仿真与实证研究,以给读者提供一些复杂分层数据的分位回归建模知识。
自2004年中国人民大学统计学院在全国首开《分位回归》课程以来,笔者一直担任本课程的主讲老师。本书的大部分材料在课堂上讨论过。本书在写作过程中,自始至终有以下硕士生、博士生参加过翻译、校正等工作:李远、周朋朋、范洁瑜、张宁、戴成、钱政超、石恒泽、周健、安姝静、陈博钰、范博文、范燕、姜春波、马维华、苏宇楠、张圆圆、陈彦靓、郭洁、康雁飞、荣耀华、王伟、罗幼喜、储昭霁、封达道、李兆媛、司世景、夏文涛、熊巍、何静、胡亚南、黄雅丽、李茜、刘甦倩、吕爽、朱倩倩、田玉柱、梁晓琳、马春桃、马绰欣、孟令宾、王榛、杨亚琦、张亚丽、李二倩、罗静、史普欣、王晓荷、袁梦、吴延科、晏振等。在此,我对他们表示衷心的感谢!
本书获得以下基金部分资助:国家自然科学基金(No.11271368),北京市社会科学基金重大项目(No.15ZDA17),教育部高等学校博士学科点专项科研基金(No.20130004110007),国家社会科学基金重点项目(No.13AZD064),中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)项目成果(No.15XNL008),教育部科学技术研究重点项目(No.108120),北京市社会科学基金项目(No.12JGB051)以及兰州商学院“飞天学者特聘计划”。同时感谢教育部人文社会科学重点研究基地中国人民大学应用统计研究中心的大力支持。
自20世纪70年代以来,人们开始研究分层结构数据的统计模型。比如,作为对线性模型贝叶斯估计学术方面的贡献,Lindley&Smith(1972)和Smith(1973)引入了分层线性模型(HierarchicalLinearModel)这一术语。然而,近年来分层模型在不同的领域有不同的称谓:在社会学研究里,叫作多水平模型(MultilevelModel),参见Mason,Wong&Entwistle(1983),Goldstein(1995);生物统计上则称为混合效应模型(Mixed-e.ectsModel)或者随机效应模型(Random-e.ectsModel),参见Elston(1962),Laird(1982),Longford(1987)以及Singer(1998);计量经济学上称为随机系数回归模型(Random-coe.cientRegressionModel),参见Rosenberg(1973)和Longford(1993);在贝叶斯统计里,我们称之为条件独立分层模型(ConditionallyIndependentHierarchicalModel),参见Kass&Ste.ey(1989)。一般的统计文献则称之为协方差成分模型(CovarianceComponentsModel),参见Dempster,Rubin&Tsutakawa(1981)。Hobert(2000)给出了目前有关拟合分层模型计算方面的热点问题综述。
在上述所提到的各种模型背后,现有的分层模型理论主要关注的是在给定预测变量X的条件下,拟合响应变量Y的条件期望。尽管在很多应用中,这些理论能够应付了,然而它们却不能完全刻画响应变量在各分位点上的情况。例如,学校平均成绩有时候可能会隐藏一些涉及差生与优等生方面的问题,因为平均数本身不能对学生成绩提供一个“谱视”(SpectralView)。
分位回归(QuantileRegression,QR)方法,亦称分位数回归,产生于30年前。由于它能够全面刻画一个条件随机变量的各分位点随协变量的变化情况,所以近年来它逐渐发展成为一种综合的分析线性和非线性模型的统计方法。目前,有大量的文献是关于分位回归研究的。在本书中,我们充分利用了分层模拟与分位回归的优点,提出分层分位回归模型(HierarchicalQuantileRegressionModels)。这类模型具有如下特点:①能够全面刻画出给定高维解释变量的条件下响应变量的各分位点情况;②估计出来的系数向量,即边际效应,对于响应变量的离群观测值来说,是稳健的;③在不同分位点上潜在的不同解具有很有用的解释意义;④沿袭了分层模拟与分位回归模型二者所有的优点。
本书致力于介绍复杂分层数据分析前沿的知识,侧重于算法、仿真与实证研究,以给读者提供一些复杂分层数据的分位回归建模知识。
自2004年中国人民大学统计学院在全国首开《分位回归》课程以来,笔者一直担任本课程的主讲老师。本书的大部分材料在课堂上讨论过。本书在写作过程中,自始至终有以下硕士生、博士生参加过翻译、校正等工作:李远、周朋朋、范洁瑜、张宁、戴成、钱政超、石恒泽、周健、安姝静、陈博钰、范博文、范燕、姜春波、马维华、苏宇楠、张圆圆、陈彦靓、郭洁、康雁飞、荣耀华、王伟、罗幼喜、储昭霁、封达道、李兆媛、司世景、夏文涛、熊巍、何静、胡亚南、黄雅丽、李茜、刘甦倩、吕爽、朱倩倩、田玉柱、梁晓琳、马春桃、马绰欣、孟令宾、王榛、杨亚琦、张亚丽、李二倩、罗静、史普欣、王晓荷、袁梦、吴延科、晏振等。在此,我对他们表示衷心的感谢!
本书获得以下基金部分资助:国家自然科学基金(No.11271368),北京市社会科学基金重大项目(No.15ZDA17),教育部高等学校博士学科点专项科研基金(No.20130004110007),国家社会科学基金重点项目(No.13AZD064),中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)项目成果(No.15XNL008),教育部科学技术研究重点项目(No.108120),北京市社会科学基金项目(No.12JGB051)以及兰州商学院“飞天学者特聘计划”。同时感谢教育部人文社会科学重点研究基地中国人民大学应用统计研究中心的大力支持。
评论
还没有评论。