描述
开 本: 32开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787302461005丛书名: 数量经济学系列丛书
本书的适用范围: 对于学过初级计量经济学课程的本科生可以讲授本书的第1章、第2章(2.1节、2.2节)、第3章、第4章(4.1节、4.2节)、第5章的部分内容,以及多方程部分的第11章和第14章的简单内容; 对于学过中高级计量经济学课程的硕士和博士研究生可以讲授第2章、第4章(4.3节~4.10节)、第5章、扩展的单方程分析的第6~9章、多方程部分的第10章、第12~15章。
本书全面介绍了计量经济学的主要理论和方法,将它们纳入一个完整、清晰的体系之中。本书注重将计量经济学的理论和实际经济问题相结合,提供了大量的基于经济问题的模型实例,协助教师提高教学效率,增强学生的学习兴趣和实际建模能力。本书的作者都是多年从事计量经济学教学和研究的教师,书中融入了作者们教学和科研的体会。书中大多数实际案例是作者们在实践中运用的实例和国内外的经典实例,同时基于EViews软件来介绍实际应用技巧,具有很强的可操作性。 本书可以作为本科生、硕士和博士研究生的应用计量经济学课程教材,也可作为在经济、统计、金融等领域从事定量分析的工作人员的参考书。
目录
第Ⅰ部分数据分析基础
第1章概率与统计基础
1.1随机变量
1.1.1概率分布
1.1.2随机变量的数字特征
1.1.3随机变量的联合分布
1.2从总体到样本
1.2.1基本统计量
1.2.2估计量性质
1.3一些重要的概率分布
1.3.1正态分布
1.3.2χ2分布
1.3.3t分布
1.3.4F分布
1.4统计推断
1.4.1参数估计
1.4.2假设检验
1.5EViews软件的相关操作
1.5.1单序列的统计量、检验和分布
1.5.2多序列的显示和统计量
第2章经济时间序列的处理、季节调整与分解
2.1经济时间序列的处理和频率转换方法
2.1.1经济指标几种数据类型的概念
2.1.2频率转换
2.2季节调整
2.2.1移动平均公式
2.2.2Census X13ARIMASEATS季节调整方法
2.2.3TRAMO/SEATS方法
2.3趋势分解
2.3.1HodrickPrescott滤波方法
2.3.2频谱滤波(BP滤波)方法
2.4EViews软件的相关操作
2.4.1频率转换
2.4.2X13ARIMASEATS季节调整
2.4.3TRAMO/SEATS季节调整
2.4.4HodrickPrescott滤波
2.4.5BP滤波
第Ⅱ部分基本的单方程分析
第3章基本回归模型
3.1古典线性回归模型
3.1.1一元线性回归模型
3.1.2小二乘法
3.1.3多元线性回归模型
3.1.4系数估计量的性质
3.1.5线性回归模型的检验
3.1.6AIC准则和Schwarz准则
3.2回归方程的函数形式
3.2.1双对数线性模型
3.2.2半对数模型
3.2.3双曲函数模型
3.2.4多项式回归模型
3.2.5BoxCox转换
3.3包含虚拟变量的回归模型
3.3.1回归中的虚拟变量
3.3.2季节调整的虚拟变量方法
3.4模型设定和假设检验
3.4.1系数检验
3.4.2残差检验
3.4.3模型稳定性检验
3.5方程模拟与预测
3.5.1预测误差与方差
3.5.2预测评价
3.6EViews软件的相关操作
3.6.1设定回归方程形式和估计方程
3.6.2方程输出结果
3.6.3与回归方程有关的操作
3.6.4模型设定和假设检验
3.6.5预测
第4章其他回归方法
4.1异方差
4.1.1异方差检验
4.1.2加权小二乘估计
4.1.3存在异方差时参数估计量的一致协方差
4.2二阶段小二乘法
4.3非线性小二乘法
4.4广义矩方法
4.4.1矩法估计量
4.4.2广义矩估计
4.5多项式分布滞后模型
4.6逐步小二乘回归
4.7分位数回归
4.7.1分位数回归的基本思想和系数估计
4.7.2系数协方差的估计
4.7.3模型评价和检验
4.8非参数回归模型
4.8.1密度函数的非参数估计
4.8.2一元非参数计量经济模型
4.9稳健小二乘法(robust)
4.9.1M估计
4.9.2S估计
4.9.3MM估计
4.9.4系数协方差的计算方法
4.10有限信息极大似然估计和K类估计
4.10.1有限信息极大似然估计(LIML)
4.10.2K类估计
4.11EViews软件的相关操作
4.11.1异方差检验
4.11.2加权小二乘法估计
4.11.3White异方差一致协方差和NeweyWest
异方差自相关一致协方差
4.11.4二阶段小二乘法(TSLS)估计
4.11.5非线性小二乘估计
4.11.6GMM估计
4.11.7估计包含PDLs的模型
4.11.8逐步回归估计
4.11.9分位数回归
4.11.10非参数估计
4.11.11Robust小二乘估计
4.11.12在EViews中进行LIMI和K类估计
4.12附录广义小二乘估计
第5章时间序列模型
5.1序列相关及其检验
5.1.1序列相关及其产生的后果
5.1.2序列相关的检验方法
5.1.3扰动项存在序列相关的线性回归方程的修正与估计
5.2平稳时间序列建模
5.2.1平稳时间序列的概念
5.2.2ARMA模型
5.2.3ARMA模型的平稳性
5.2.4ARMA模型的识别
5.3非平稳时间序列建模
5.3.1非平稳序列和单整
5.3.2非平稳序列的单位根检验
5.3.3突变点单位根检验(breakpoint unit root test)
5.3.4ARIMA模型
5.3.5ARFIMA模型
5.3.6自回归分布滞后模型
5.4协整和误差修正模型
5.4.1协整关系
5.4.2基于残差的协整检验
5.4.3误差修正模型(ECM)
5.5EViews软件的相关操作
5.5.1检验序列相关性
5.5.2修正序列相关
5.5.3ARMA(p,q)模型的估计
5.5.4单位根检验
5.5.5非平稳时间序列估计
5.5.6基于残差的EG协整检验(EG和PO协整检验方法)
第Ⅲ部分扩展的单方程分析
第6章条件异方差模型
6.1自回归条件异方差模型
6.1.1ARCH模型
6.1.2ARCH的检验
6.1.3GARCH模型
6.1.4IGARCH模型
6.1.5约束及回推
6.1.6GARCH模型的残差分布假设
6.1.7GARCHM模型
6.2非对称的ARCH模型
6.2.1TARCH模型
6.2.2EGARCH模型
6.2.3PARCH模型
6.2.4非对称的信息冲击曲线
6.3成分ARCH模型
6.4EViews软件的相关操作
6.4.1ARCH检验
6.4.2ARCH模型的建立
6.4.3ARCH模型的视图和过程
6.4.4ARCH模型的输出
6.4.5绘制估计的信息冲击曲线
第7章离散因变量和受限因变量模型
7.1二元选择模型
7.1.1线性概率模型及二元选择模型的形式
7.1.2二元选择模型的估计问题
7.1.3二元选择模型的变量假设检验问题
7.2排序选择模型
7.3受限因变量模型
7.3.1审查、选择性样本和截断数据
7.3.2受限因变量数据为什么不能用普通小二乘估计
7.3.3审查回归模型
7.3.4截断回归模型
7.4Heckman样本选择模型
7.5计数模型
7.5.1泊松模型的形式与参数估计
7.5.2负二项式模型的形式与参数估计
7.5.3准—极大似然估计
7.6广义线性模型
7.6.1广义线性模型的形式
7.6.2广义线性模型的参数估计
7.7EViews软件的相关操作
7.7.1二元选择模型
7.7.2排序选择模型
7.7.3审查回归模型
7.7.4截断回归模型
7.7.5Heckman选择模型
7.7.6计数模型
7.7.7广义线性模型
第8章对数极大似然估计
8.1对数极大似然估计的基本原理
8.1.1极大似然估计的基本原理
8.1.2极大似然估计量的计算方法
8.1.3优化算法
8.2对数极大似然的估计实例
8.2.1一元线性回归模型的极大似然函数
8.2.2AR(1)模型的极大似然函数
8.2.3GARCH(q,p)模型的极大似然函数
8.2.4具有异方差的一元线性回归模型的极大似然函数
8.3EViews软件的相关操作
8.3.1似然对象的建立
8.3.2似然对象的估计、视图和过程
8.3.3问题解答
第9章具有结构变化特征的回归模型
9.1间断点回归模型
9.1.1多个间断点的检验
9.1.2包含多个间断点时的方程估计
9.2门限回归模型
9.2.1门限回归(TR)模型
9.2.2自激励门限自回归(SETAR)模型
9.3转换回归模型
9.3.1转换回归的基本模型
9.3.2马尔可夫区制转换模型
9.3.3动态转换模型
9.4EViews软件的相关操作
9.4.1间断点检验和间断点模型估计
9.4.2门限模型的估计
9.4.3转换方程对象的建立与估计
第Ⅳ部分多方程分析
第10章向量自回归和向量误差修正模型
10.1向量自回归理论
10.1.1VAR模型的一般表示
10.1.2结构VAR模型(SVAR)
10.2结构VAR(SVAR)模型的识别条件
10.2.1SVAR模型的识别条件
10.2.2SVAR模型的约束形式
10.3VAR模型的检验
10.3.1Granger因果检验
10.3.2滞后阶数p的确定
10.4脉冲响应函数
10.4.1脉冲响应函数的基本思想
10.4.2VAR模型的脉冲响应函数
10.4.3广义脉冲响应函数
10.4.4SVAR模型的脉冲响应函数
10.5方差分解
10.6Johansen协整检验
10.6.1特征根迹检验(trace检验)
10.6.2特征值检验
10.6.3协整方程的形式
10.7向量误差修正模型
10.8贝叶斯VAR模型
10.8.1贝叶斯VAR模型的基本思想
10.8.2先验分布
10.9EViews软件的相关操作
10.9.1VAR模型的建立和估计
10.9.2VAR模型的视图
10.9.3VAR模型的过程
10.9.4脉冲响应函数的计算
10.9.5方差分解的实现
10.9.6协整检验
10.9.7VEC模型的建立和估计
10.9.8BVAR模型的估计
第11章基本的Panel Data模型
11.1Panel Data模型的基本原理
11.1.1Panel Data模型概述
11.1.2Panel Data模型分类
11.2模型形式设定检验
11.3变截距模型
11.3.1固定影响变截距模型
11.3.2随机影响变截距模型
11.3.3Hausman检验
11.4变系数模型
11.4.1固定影响变系数模型
11.4.2随机影响变系数模型
11.5Panel Data模型系数协方差的估计方法
11.6EViews软件的相关操作
11.6.1含有Pool对象的工作文件
11.6.2Pool对象中数据处理
11.6.3Pool对象的模型估计
第12章扩展的Panel Data模型
12.1面板数据的单位根检验
12.1.1相同根情形下的单位根检验
12.1.2不同根情形下的单位根检验
12.2面板数据的协整检验
12.2.1Pedroni检验
12.2.2Kao检验
12.2.3Fisher面板协整检验
12.3面板数据广义矩(GMM)方法
12.3.1面板数据GMM方法的基本原理
12.3.2面板数据GMM的估计方法
12.4动态面板数据回归模型
12.4.1动态面板数据回归模型简介
12.4.2动态面板数据模型的估计
12.5EViews软件的相关操作
12.5.1构建面板工作文件
12.5.2面板数据的基本分析
12.5.3面板数据模型的建立与估计
第13章状态空间模型和卡尔曼滤波
13.1状态空间模型的定义
13.2卡尔曼滤波
13.2.1Kalman滤波的一般形式
13.2.2Kalman滤波的解释和性质
13.2.3修正的Kalman滤波递推公式
13.2.4非时变模型及Kalman滤波的收敛性
13.2.5Kalman滤波的初始条件
13.3状态空间模型超参数的估计
13.3.1似然函数形式的预测误差分解
13.3.2超参数的估计方法
13.4状态空间模型的应用
13.4.1可变参数模型的状态空间表示
13.4.2季节调整的状态空间形式
13.4.3ARMAX模型的状态空间形式
13.5EViews软件的相关操作
13.5.1定义状态空间模型
13.5.2估计状态空间模型
13.5.3状态空间模型的视窗和过程
第14章联立方程模型的估计与模拟
14.1联立方程系统概述
14.1.1联立方程系统的基本概念
14.1.2联立方程系统的识别
14.1.3一个小型中国宏观经济联立方程模型
14.2联立方程系统的估计方法
14.2.1单方程估计方法
14.2.2系统估计方法
14.2.3多变量ARCH方法
14.3联立方程模型的模拟
14.3.1联立方程模型概述
14.3.2模型模拟的分类
14.3.3模型的评估
14.3.4情景分析
14.4EViews软件的相关操作
14.4.1联立方程系统的基本操作
14.4.2联立方程模型的模拟与预测
14.4.3联立方程模型的求解
14.4.4联立方程模型的数据操作
第15章主成分分析和因子分析
15.1主成分分析
15.1.1主成分分析的基本思想
15.1.2总体主成分求解及其性质
15.1.3样本的主成分
15.2因子分析
15.2.1基本的因子分析模型
15.2.2正交因子模型的性质
15.2.3因子载荷的估计方法
15.2.4因子数目的确定方法及检验
15.2.5因子旋转
15.2.6因子得分
15.3EViews软件的相关操作
15.3.1主成分分析的实现
15.3.2因子分析的实现
15.3.3因子旋转的操作
15.3.4计算因子得分
15.3.5因子视图
15.3.6因子过程
附录AEViews中的常用函数
A1. 公式中的运算符号及其含义
A2. 时间序列函数及其含义
A3. 序列描述性统计量的@函数及其含义
A4. 三角函数
A5. 统计函数
A6. 回归统计量的@函数及其含义
参考文献
第3版前言
本书第3版得到国家社会科学基金重大项目“新常态下我国宏观经济监测和预测研究”(15ZDA011)、国家自然科学基金项目“中国经济周期波动的转折点识别、阶段转换及预警研究”(71573105)的资助。近年来随着大数据的发展,在经济领域涌现出各类数据库,包含了国内外大量的宏观数据、各层次的面板数据、定期的微观调查数据(企业或个人)、越来越广泛和细分的产业数据等数据信息,这些丰富的数据信息极大地推动了计量经济学的快速发展,拓展了计量经济学的研究范围,增加了计量经济学研究的实用性,给计量经济学研究提供了更大的空间、更新的视角,注入了新的动力。目前,计量经济学和微观经济学与宏观经济学一起构成了中国经济类、管理类本科生和研究生必修的三门经济学核心课程,同时计量经济模型在经济理论研究和经济问题分析中已经被广泛应用,并取得了丰硕的成果。为了追踪和反映大数据背景下计量经济学的新发展,本书的第3版增加了一些计量经济学的新理论、方法与应用实例,对本书第2版做了较大的修改。第3版增加和修改的主要内容如下。(1) 第2章增加了两个内容: ①介绍了几种经济数据类型的概念和处理方法,以及多种数据频率的转换方法,在做经济计量分析时,对于收集到的原始经济数据往往经过处理才能使用,因此建模前需对所获得指标进行处理,并且还要对不同数据频率(如年度、季度或月度)进行数据频率转换,使其具有可信性、合理性和一致性; ②X13ARIMASEATS季节调整方法和TRAMO/SEATS季节调整方法的基本原理和功能,这节是对第2版中季节调整方法的修改。(2) 第4章增加了两个内容: ①稳健小二乘法(robust least squares),当估计回归模型时,普通小二乘估计量对异常值(奇异值)的存在是敏感的。这些异常观测值的敏感性可能会破坏变量之间的潜在统计关系,而稳健小二乘法是针对异常值而设计的,书中包括3种稳健小二乘估计: M估计、S估计和MM估计; ②有限信息极大似然估计(LIML)和K类估计方法,它们优于传统的二阶段小二乘估计。(3) 第5章增加了4个内容: ①突变点单位根检验(breakpoint unit root test),介绍了具有突变点的时间序列的基本概念、突变点单位根检验的基本原理以及几种常用的检验方法; ②ARFIMA模型,又称自回归分整动平均模型,在自回归和动平均模型的基础上,允许非整数阶的序列差分; ③自回归分布滞后模型(ARDL),可以通过建立包含多期因变量和自变量滞后的ARDL进行建模; ④介绍了基于残差的协整检验的两种方法: EngleGranger检验和PhillipsOuliaris检验方法的基本原理和检验步骤。(4) 第7章改动较大,增加了两个内容、8个实例: ①赫克曼(Heckman)以微观经济理论来解释个体数据而提出的Heckman样本选择模型; ②广义线性模型(generalized linear models, GLMs)是常见的普通线性模型的直接推广,它可适用于因变量为连续型数据和离散型数据两种情况,在实际应用中离散型因变量的情形更加常见; ③经济分析中经常会遇到大量的个体和企业的调查数据,这些数据具有很多与时间序列数据不同的特点,常存在离散选择性问题、数据审查(截断)、选择性样本等问题,一般来说需要采用微观计量经济学方法进行定量分析。因此本章增加了8个微观经济实例来说明如何运用微观计量经济学方法进行建模分析。
(5) 本书新增了第9章: 具有结构变化特征的回归模型。这章包含3个内容: ①间断点回归模型(breakpoints regression); ②门限回归模型(threshold regression,TR),以严格的统计推断方法对门限值进行参数估计与假设检验; ③区制转换模型,包含马尔可夫区制转换模型(Markov Regime Switching Model, MS)。标准的线性回归模型假定模型参数在样本区间中是不变的,但是,在时间序列分析领域,样本区间中参数出现变化(结构变化,structural change)的经验分析是非常重要的。从间断点回归模型,到门限回归模型,再到区制转换回归模型,是依次递进的。实际上,间断点回归模型是结构变化回归模型的初形式,其将时间作为一种“门限”,找出间断点后进行分段回归; 门限回归以被解释变量的滞后项、解释变量或者其他变量作为门限,不仅对于区制的划分更为科学,而且对于不同区制内被解释变量差异化影响因素的解释更为合理,重要的是打破了间断点回归模型中仅以时间作为门限变量的限制; 在门限回归模型的基础上,区制转换回归模型研究了不同区制之间的转换概率等特征,这对于预测而言是一种重要的参考。(6) 第10章增加了贝叶斯VAR(Bayesian Vector Autoregression,BVAR)模型。VAR模型的主要缺点在于需要估计的参数过多,这将导致模型的过度拟合问题: 尽管模型的样本内拟合效果良好,但所估计的系数大多不显著,而且随着预测期间的延长,样本外预测效果会迅速恶化。解决过度拟合问题的一种方法是SVAR模型,通过对参数空间施加短期约束和长期约束来减少待估参数; 另一种施加参数约束的方法是基于贝叶斯方法估计VAR模型,本章介绍了BVAR模型的基本思想、方法和应用。(7) 随着使用跨国时间序列数据研究购买力平价、经济增长收敛和国际研发溢出等问题的广泛开展,面板数据计量经济学的一个领域开始向宏观面板数据的研究拓展,同时随着定期进行微观调查的各类数据库的不断涌现,面板数据计量经济学的另一个领域也在向微观面板数据的研究深入开展。由于面板数据模型包含的内容较多,本书将面板数据模型分为两章,即第11章和第12章。其中,第12章的第3、4节为新增内容。第3节为面板数据的广义矩方法(PGMM)。面板GMM方法允许随机误差项存在异方差和序列相关,所得到的参数估计量比其他参数估计方法更合乎实际。第4节为动态面板模型的估计及检验。很多经济关系本质上都具有动态性,面板数据的优势之一就在于它可以使研究者更好地理解动态调整过程。刻画这些动态关系的面板数据回归模型,即动态面板数据回归模型具有的共同特征是回归变量中含有滞后的被解释变量。本书第12章第4节介绍了两种动态面板数据模型估计方法: Difference GMM(差分GMM)和Orthogonal Deviations GMM(正交GMM)。由于计量经济学课程的课时有限,教师通常没有足够的课时帮助学生将所学的模型方法应用于实际的经济问题中,并通过计算机软件进行建模、分析和模拟训练,进而提高运用计量模型进行分析的实际能力,导致了理论教学和实际应用之间的脱节,因此,需要再开设一门应用计量经济学或计量经济方法建模的课程。为此,本书写作的一个重要特色就是注重计量经济学的理论和实际经济问题相结合,通过全面介绍计量经济学的主要理论和方法,将它们纳入一个完整、清晰的体系之中。并在此基础上,提供了大量的基于经济问题的模型实例,协助教师提高教学效率,增强学生的学习兴趣和实际建模能力。本书的作者们都是多年从事计量经济学教学和研究的教师,融入了作者们教学和科研的体会,书中大多数实际案例是作者们在实践中运用的实例和国内外的经典实例。同时基于EViews软件来介绍实际应用技巧,具有很强的可操作性,可以作为应用计量经济学课程的教材。对于在经济、统计、金融等领域从事定量分析的工作人员,本书也是一本很好的参考书。本书的适用范围: 对于学过初级计量经济学课程的本科生可以讲授本书的第1章、第2章(2.1节、2.2节)、第3章、第4章(4.1节、4.2节)、第5章的部分内容,以及多方程部分的第11章和第14章的简单内容; 对于学过中高级计量经济学课程的硕士和博士研究生可以讲授第2章、第4章(4.3节~4.10节)、第5章、扩展的单方程分析的第6~9章、多方程部分的第10章、第12~15章。美国IHS公司2015年推出EViews 9版本软件,我们购买了该版本软件。本书的EViews软件操作部分都采用EViews 9版本软件。本书相关实例的原始数据(Excel表)、EViews工作文件和各章课件由于篇幅的原因,第2版中附录A(EViews软件基础)和附录B(EViews程序设计)被删除,网上的课件中将保留相应的内容。可以在清华大学出版社网站(www.tup.com.cn)下载。本书由下列人员编写完成本书第1版和第2版的主要作者梁云芳教授不幸因病于2013年10月去世,她所承担章节(第1版前言和第2版前言已列出)的修改、补充、增加等工作由其他作者来完成,不再标出。: 第1、3、4章,王金明; 第2、10章,陈飞; 第5章,康书隆; 第6、8、14章和附录A,刘玉红; 第7、15章,王亚芬; 第9章,张同斌; 第11、12章,孔宪丽; 第13章: 高铁梅。后由高铁梅对全书进行了审阅、修改和定稿。在本书第3版出版之际,特别感谢清华大学出版社的张伟编辑,在她的热情鼓励和大力支持下,本书第3版得以顺利出版。还有许多同行专家、硕士和博士研究生对本书给予了帮助,在这里一并表示感谢。我们把这本书奉献给所有给予我们支持和帮助的人。由于我们水平有限,错误或不当之处在所难免,诚恳地欢迎同行专家和读者批评指正,并提出宝贵的意见和建议。
高铁梅2016年11月5日
第2版前言
本书第2版得到国家自然科学基金项目的资助,项目号: 70673009。本书第1版出版以来,专家学者们提出了许多宝贵的意见和建议,使我们获益颇多。同时随着计量经济学的新发展,不断地涌现出许多新的理论与方法,为此我们查阅了大量的国内外文献,反复研究、讨论、切磋,并收集数据,进行建模分析,对本书第1版做了较大的修改,并增加了一些新内容和新例子。本书增加和修改的主要内容如下。(1) 第4章增加了分位数回归(quantile regression)模型和非参数模型。绝大多数回归模型都关注因变量的条件均值,近年来人们对于因变量条件分布的其他方面的模拟方法也越来越有兴趣,尤其是能够更加全面地描述因变量条件分布的分位数回归。同时非参数回归模型的研究也是当前计量经济学研究的一个重要方向。本书对分位数回归模型和非参数回归模型做了初步介绍,分别给出了分位数回归的多种估计方法和模型的评价与检验、非参数模型的核估计和近邻估计等方法。(2) 第6章增加了单整GARCH模型(Integrated GARCH Model,IGARCH),并增加了中国CPI(居民消费价格指数)模型的ARCH检验和修正,以及相应的TARCH模型的例子。(3) 第9章增加了具有约束条件的VEC模型(Vector Error Correction Models)的例子。为了说明如何在VEC模型中施加约束于协整关系,本书利用中国的6个宏观经济变量建立了VEC模型,通过施加约束条件来研究货币政策对各类需求的影响。(4) 第10章增加了Hausman检验和面板数据的协整检验。面板数据的协整检验方法可以分为两大类,一类是建立在Engle 和Granger二步法检验基础上的面板协整检验,具体方法主要有Pedroni检验和Kao检验; 另一类是建立在Johansen协整检验基础上的面板协整检验。(5) 第12章增加了多变量ARCH(Autoregressive Conditional Heteroskedasticity)方法。在不同的市场、资产之间,往往存在着相互影响及波动的相关关系,多变量ARCH模型能够有效地估计多个变量之间波动的相关性特征与风险特性。(6) 本书增加了第13章“主成分分析和因子分析”。在建立多元回归模型时,为了更准确地反映事物的特征,人们经常会在模型中包含较多相关解释变量,这不仅使得问题分析变得复杂,而且变量之间可能存在多重共线性,使得数据提供的信息发生重叠,甚至会抹杀事物的真正特征。为了解决这些问题,需要采用降维的思想,将所有指标的信息通过少数几个指标来反映,在低维空间将信息分解为互不相关的部分以获得更有意义的解释。主成分分析和因子分析方法可用于解决这类问题。(7) 由于2005年之前经济数据的统计口径同2004年中国的经济普查的口径不同,使得2005年前后的GDP(国内生产总值)数据不可比。国家统计局对2005年前的年度数据和季度数据进行了调整,本书采用国家统计局发布的修改后数据,对书中的相关例子做了修改。(8) 美国QMS(Quantitative Micro Software)公司2007年推出EViews6版本软件,我们购买了该版本软件。本书的EViews软件操作部分都采用EViews6版本软件。
(9) 本书相关实例的数据(Excel表)、EViews工作文件及各章课件可以在清华大学出版社网站(www.tup.com.cn)下载。本书的修改仍由各章的作者完成(作者的分工见第1版前言),新增加的第13章由梁云芳和王亚芬完成。后由我本人对全书进行了审阅、修改和定稿。在本书第2版出版之际,我们首先要感谢上海社会科学研究院的朱平芳教授、福州大学的叶阿忠教授和南开大学的张晓峒教授,他们花费了大量的时间仔细审阅和修改了本书的分位数回归、非参数回归与单位根检验的理论和方法部分,并提出了许多宝贵的修改意见; 特别要感谢清华大学出版社的龙海峰编辑,是他的热情鼓励和大力支持,使这本书得以出版。还有许多同行专家、硕士和博士研究生对本书给予了帮助,在这里一并表示感谢。我们把这本书奉献给所有给予我们支持和帮助的人。由于我们水平有限,错误或不当之处在所难免,诚恳地欢迎同行专家和读者批评指正,并提出宝贵的意见和建议。
高铁梅2009年3月6日
第1版前言
本书得到*人文社会科学重点研究基地吉林大学数量经济研究中心重大项目的资助,批准号: 01JAZJD790003; 得到国家社科基金项目的资助,批准号: 05BJY013。20世纪80年代,我国部分高等学校的经济管理类专业虽已开始陆续开设计量经济学课程,但只是在少数专业作为必修课程,而其他专业多数是作为选修课程。1998年经*高等学校经济学学科教学指导委员会讨论决定,把计量经济学确定为经济学类所有专业必修的核心课程。此后全国各高校不仅经济学类各专业普遍开设了计量经济学,而且一些管理类专业也开设了这门课程。随后陆续翻译或影印出版了一批国外著名计量经济学教材和我国学者自己编写的适应中国高等院校经济类学科的计量经济学教材,促进了计量经济学课程的建设。与此同时,《经济研究》《管理世界》《世界经济》等国内的一些重要经济学、管理学期刊也发生了重大变化,所发表论文的研究范围越来越多地将定性研究与定量分析相结合,大量运用各种计量经济模型。这些,都有力地推动了计量经济学的发展。现在,计量经济学已经成为我国经济类各专业受关注和欢迎的课程之一。计量经济学是一门实践性很强的学科,要求学生具有将经济学知识、计量经济学方法和计算机应用相结合的综合素质。目前的计量经济学课程注重理论方法的介绍,但是对如何应用模型分析实际的经济问题,却讨论得较少。在计量经济学教学中,软件的使用仍然是薄弱环节。学生学习了不少估计和检验的方法,却不知道怎样应用,对计算的结果也不能做出合理的解释,缺乏运用计量模型进行分析的实际能力。由于计量经济学课程的课时有限,不能给学生足够的时间将所学习到的计量经济方法与实际经济问题相结合,通过计算机软件进行建模、分析和模拟的训练。因此,需要再开设一门应用计量经济学或计量经济方法建模的课程,本书可以作为这门课程的教材。本书的主要特色是融理论方法与应用为一体,即方法与建模应用相结合。本书全面介绍了计量经济学的主要理论和方法,尤其是20世纪80年代以来重要的和的发展,并将它们纳入一个完整、清晰的体系之中。本书在数学描述方面适当淡化,以讲清楚方法思路为目标,不做大量的推导和证明,重点放在如何运用各种计量经济方法对实际的经济问题进行分析、建模、预测、模拟等实际操作上。本书中的实际案例大多数是作者在实践中运用的实例和国内外的经典实例,并基于EViews软件来介绍实际应用,具有很强的可操作性。
本书分为四个部分: 部分是数据分析基础,主要介绍相关的概率与统计基础知识,经济时间序列的季节调整、分解与平滑,其中包括X12季节调整方法、HP滤波和BP滤波等国际上流行的方法。第二部分是基本的单方程分析,主要介绍单方程的普通小二乘法、加权小二乘法、二阶段小二乘法、非线性小二乘法、广义矩方法、方程的检验方法和预测、序列相关及其检验、平稳时间序列建模、非平稳时间序列建模、单位根检验、协整和误差修正模型等方法。第三部分是扩展的单方程分析,包括条件异方差模型、离散因变量和受限因变量模型以及对数极大似然估计。第四部分是多方程分析,包括向量自回归和向量误差修正模型、Panel Data模型、状态空间模型和卡尔曼滤波以及联立方程模型的估计与模拟。每一章后面都给出了EViews软件的相应操作,对于没有学习过EViews软件的读者,附录A提供了EViews软件的基本操作介绍。附录B为高级研究人员介绍了EViews软件的程序设计。本书相关实例的EViews工作文件和课件可以在清华大学出版社的网站下载,供读者参考。本门课程的前期应修课程为微积分、线性代数、概率统计、计量经济学(中级和高级)、时间序列分析和经济学(宏观和微观),本书应是计量经济学(中级和高级)、时间序列分析课程的一本综合性应用教材。本书的适用范围: 对于学过计量经济学课程的本科生可以讲授本书的、二部分和第12章的部分简单内容。第三、四部分可以作为硕士研究生和博士研究生的教材来使用。本书对于在经济、统计、金融等领域从事定量分析的工作人员也是一本很好的参考书。我们写这本教材的初衷,还要从引进EViews软件说起。1998年我们课题组承担国家财政部的一个重要课题,其中要求建立一个较大型的宏观经济计量模型来模拟宏观经济政策,为此我们走访了北京多家研制计量经济模型的科研单位。当时中国社会科学院数量经济与技术经济研究所的汪同三所长、沈利生研究员,国家信息中心的梁优彩研究员等专家学者,不但热情地介绍了他们建立和维护宏观经济计量模型系统的经验,还向我们提出建议,不要自己研制软件,利用EViews3.1软件就可以很好地实现模型的开发,可以达到事半功倍的效果。我们回来后,立即从美国QMS(Quantitative Micro Software)公司购买了EViews3.1版本软件,使得我们很快研制出宏观经济计量模型,顺利完成了研究项目。1999年,我们开始为数量经济专业的硕士研究生开设本门课程,取得了很好的效果,研究生的硕士论文水平有了很大提高。2002年和2004年我们又先后从美国QMS公司购买了EViews4.0和EViews5版本软件。在6年来教学实践的基础上,我组织了我们科研课题组的几位教师编写了这本教材,希望能对我国计量经济学课程的建设贡献一份力量。本书由下列人员完成: 第1、3、4章,王金明; 第2章,陈飞; 第5章5.1~5.3节、5.5节,康书隆; 第6、8、12章、附录C,刘玉红; 第7章,王亚芬; 第9章、第5章5.4节、附录D,梁云芳; 第10章,孔宪丽; 第11章,高铁梅; 附录A、附录B,吴桂珍。后由我本人对全书进行了审阅、修改和定稿。在本书出版之际,我们首先要感谢吉林大学商学院的周光亚教授、上海金融学院的姜诗章教授,在编写本书的过程中,他们花费了大量的时间仔细审阅和修改了全书的理论和方法部分,并提出了许多宝贵的修改意见,使得本书的质量有很大提高。还要感谢吉林大学商学院张屹山院长对我们购买EViews3.1、EViews4.0和EViews5版本软件,在经费上所给予的全力支持。特别要感谢清华大学出版社的龙海峰编辑,是他的热情鼓励、帮助和细致的工作,使这本书得以出版。后要感谢清华大学出版社的几位审稿编辑,他们严谨认真的工作态度和高质量的工作效率,给我们留下了深刻的印象。还有许多同行、研究生对本书给予了帮助,在这里就不一一致谢了。我们把这本书奉献给所有给予我们支持和帮助的人。后,应该指出的是由于我们水平有限,错误或不当之处在所难免,诚恳地欢迎同行专家和读者批评指正,并提出宝贵的意见。
高铁梅2005年10月
评论
第Ⅰ部分数据分析基础
第1章概率与统计基础
第2章经济时间序列的处理、季节调整与分解
第1章概率与统计基础本章回顾一些概率知识和基本的统计概念。大多数结论只叙述而不证明,读者可以很容易找到相关书籍参考学习和理解。这些概念极为重要,是继续学习的基础、通往其他部分不可或缺的钥匙。1.1随 机 变 量随机变量(random variable)是取值具有随机性的变量。随机变量按其取值情况可以分为离散型和连续型两种类型,离散型随机变量只能取有限或可数的多个数值,连续型随机变量的取值充满一个或若干有限或无限区间。1.1.1概率分布1. 概率分布的含义
随机变量X取各个值xi的概率称为X的概率分布。对一个离散型随机变量X,可以给出如下概率分布:
P(X=xi)=pi,i=1,2,3,…(1.1.1)
例如,X代表宏观经济所处的状态,假定只有经济增长率较高的繁荣和增长率较低的衰退两种状态,X相应地取1和2两个值(图1.1.1),并假定概率分别为p,q,即
P(X=1)=p,P(X=2)=q
图1.1.1离散型概率分布
(经济状态概率分布: p=0.8,q=0.2)
由概率的性质可知,概率分布满足以下两个条件:
pi≥0,i=1,2,…
∑∞i=1pi=1(1.1.2)
可以知道,对于上面例子中的p和q,存在约束: p≥0 , q≥0 , p q=1。2. 累积分布函数对于随机变量X(无论连续还是离散)可以确定实值函数F(x),称为累积分布函数(cumulative distribution function, CDF),定义如下:
F(x)=P(X≤x)(1.1.3)
表示随机变量X小于或等于x的概率。显然,F(-∞)=0, F(+∞)=1。对于离散随机变量,累积分布函数的形式为
F(x)=∑xi≤xpi(1.1.4)
3. 连续型随机变量的分布函数及概率密度函数对于连续型随机变量,取任何特定数值的概率都是0,因此度量该随机变量在某一特定范围或区间内的概率才有实际意义。设F(x)是随机变量X的分布函数,如果对任意实数x,存在非负函数f(x)≥0,使
F(x)=∫x-∞f(t)dt(1.1.5)
就称f(x)为X的概率密度函数(PDF),且f(x)具有性质:
f(x)≥0,∫∞-∞f(x)dx=1(1.1.6)P(a令X代表身高,用厘米来度量,那么人的身高在某一区间内(比如160~170cm)的概率,由这两个值之间的密度函数之下的面积决定(图1.1.2)。
图1.1.2连续型(身高)概率分布
例1.1离散随机变量的CDF
抛币4次,求随机变量(正面朝上的次数)的概率密度函数和累积分布函数(图1.1.3和图1.1.4)。
正面朝上的次数
(X=xi )
PDFCDF
X值piX值F(x)
00≤X<11/16X≤01/1611≤X<24/16X≤15/1622≤X<36/16X≤211/1633≤X<44/16X≤315/1644≤X<51/16X≤41
图1.1.3离散型随机变量的累积分布函数
图1.1.4连续型随机变量的累积分布函数
1.1.2随机变量的数字特征有多种数值指标分别从不同角度描述随机变量分布的特征,其中重要的是数学期望(也称均值)和方差。期望是随机变量的平均值,它度量了集中趋势; 方差是随机变量偏离期望的离散程度的度量。1. 数学期望假设我们研究一个离散型随机变量X,设x1,x2,…,xN为该变量的N个取值,则均值或数学期望值是所有可能结果的加权平均值,权重为各个可能结果的发生概率,用μX代表X的数学期望,定义为
μX=E(X)=p1x1 p2x2 … pNxN=∑Ni=1pixi(1.1.8)
式中: pi为Xi发生的概率,∑pi=1。如果X是连续型随机变量,则数学期望为
μX=E(X)=∫∞-∞xf(x)dx(1.1.9)
数学期望有一个重要的性质:
E(a bX)=a bE(X)(1.1.10)
式中: a,b都是常数。除了期望之外,用来描述随机变量集中趋势的还有中位数。中位数是满足P(X≤m)≥0.5和P(X≥m)≤0.5的m的值。粗略地说,中位数比均值更接近分布的中点,它不受值影响。2. 方差对于经济变量,我们经常关心其波动性,尤其证券市场中人们十分关心投资的风险大小,这可以通过变量的方差来描述。随机变量的方差刻画了随机变量偏离均值的程度,将方差记为σ2X,对于离散的情形,方差为
σ2X=var(X)=E[X-E(X)]2=∑Ni=1pi(xi-μX)2(1.1.11)
对于连续情形,方差为
σ2X=var(X)=∫∞-∞(x-μX)2f(x)dx(1.1.12)
方差不能为负值,如果X偏离均值幅度很大,则方差就较大; 相反,则方差较小; 如果X所有的值都等于E(X),则方差为0。这意味着随机变量是常数。方差有一个重要的性质:
var(a bX)=b2var(X)(1.1.13)
经常用到的标准差σX是方差的正平方根。如果要我们猜测对一个随机变量进行一次抽样的结果,均值可能是不错的选择。但如果要给出一个区间,就可以根据希望正确的程度确定置信水平,在均值两侧延伸相应倍数的标准差产生一个区间(置信区间)。就是说虽然方差是衡量波动程度的指标,但与均值进行加减运算只能是标准差,因为标准差可以被认为和μ有相同的度量单位。对任意随机变量X和任意正常数k,切比雪夫不等式表明:
P(μ-kσ≤X≤μ kσ)≥1-1k2(1.1.14)
3. 偏度和峰度除了为常用的描述随机变量X集中趋势的期望和中位数、描述偏离均值程度的方差外,偏度S(skewness)和峰度K(kurtosis)也是描述随机变量X的数字特征。偏度S衡量了X围绕其均值的非对称性,峰度K度量凸起或平坦程度。在定义偏度S和峰度K之前,首先需要了解X的高阶矩和高阶中心矩。一般r阶矩和r阶中心矩分别定义为
E(X)r和E(X-μX)r
随机变量X的一阶矩即是数学期望值,方差是X的二阶中心矩,三阶中心矩表示为
E(X-μX)3
四阶中心矩表示为
E(X-μX)4
偏度S用三阶中心矩除以标准差的立方来计算:
S=E(X-μX)3σ3X(1.1.15)
如果概率密度函数是对称的,则S值为0; 正的S值意味着序列分布有长的右拖尾(右偏); 负的S值意味着序列分布有长的左拖尾(左偏)。峰度K定义为
K=E(X-μX)4σ4X(1.1.16)
正态分布是常见到的分布。对于正态分布,K=3,S=0。如果K值大于3,分布的凸起程度大于标准正态分布; 如果K值小于3,分布相对于标准正态分布是平坦的。因此,了解标准正态分布峰度K和偏度S有助于比较其他概率分布函数。1.1.3随机变量的联合分布对于两个或两个以上的随机变量,规律性由它们的联合分布所决定。联合分布有协方差和相关系数等重要数字特征。
例1.2两个离散随机变量的联合分布
X表示家庭收入,Y表示是否受过大学教育,1、0分别表示受过和没有受过大学教育,联合分布如下:
结果概率f(x,y)结果概率f(x,y)X=600 元,Y=10X=600 元,Y=01/4X=1500元,Y=11/8X=1500元,Y=01/8X=3000元,Y=11/3X=3000元,Y=01/6
对于两个离散的随机变量X,Y,它们的联合分布为
P(X=xi,Y=yj)=pij,i,j=1,2,…(1.1.17)
如例1.2中:
P(X=600,Y=0)=1/4
对于连续的随机变量X,Y,它们的概率分布则由联合概率密度f(x,y)决定:
P(a
1. 边际概率与联合概率函数f(x,y)相对应,fX(x),fY(y)都称为边际概率函数。如例1.2中,fX(600)应该是所有家庭收入为600元而无论是否受过大学教育的概率,即fX(600)=P(X=600)=P(X=600,Y=0) P(X=600,Y=1)=1/4。因此,从联合分布得到某一个变量(比如X)的边际密度,只需要将其对应的联合概率累加(离散)或积分(连续)起来:
fX(x)=P(X=xi)=∑∞j=1pij,Y是离散的(1.1.19)
fX(x)=∫∞-∞f(x,y)dy,Y是连续的(1.1.20)
在计量经济和时间序列分析中经常假定两个随机变量之间独立且同分布(记为i.i.d),当且仅当联合密度是边际密度的乘积时,两个随机变量才是独立的,即
f(x,y)=fX(x)fY(y)(1.1.21)
注意,这要求对所有取值都成立。对于例1.2,显然式(1.1.21)是不成立的,如f(600,0)=1/4,而fX (600)=1/4,fY (0)=13/24。因此,收入和是否受过大学教育这两个变量是不独立的。2. 条件概率函数在例1.2中,如果我们想要知道在受过大学教育的人中,收入为3000元的比例,就是要得到在给定Y=1的条件下,X=3000的概率为多少,这就归结为求条件概率的问题。这可以由下面的公式计算:
P(X=xi|Y=yj)=P(X=xi,Y=yj)P(Y=yj),离散情形(1.1.22)fX|Y(x|y)=f(x,y)fY(y),连续情形(1.1.23)
例如:
P(X=3000|Y=1)=P(X=3000,Y=1)PY(Y=1)=1/31/3 1/8=811≈0.727
这说明,在受过大学教育的条件下,X取3000的概率约为0.727。如果没有这样的条件(无条件概率或边际概率),X取3000的概率为0.5(=1/3 1/6)。这也说明X,Y是不独立的变量,Y的取值影响到X取值的概率分布。由式(1.1.21)可知,独立的两个随机变量的条件概率函数应该与无条件概率函数相同。对于连续型随机变量,也有类似性质,只要将概率函数换成概率密度即可。3. 协方差和相关系数两个随机变量X、Y的协方差定义为
cov(X,Y)=E[(X-μX)(Y-μY)](1.1.24)
式中: μX,μY分别表示X,Y的期望值。协方差度量了两个变量的同时波动。如果两个变量同方向变动(比如一个变量增加,另一个变量也增加),则协方差为正; 如果两个变量反方向变动(比如一个变量增加,另一个变量却减少),则协方差为负; 如果两个随机变量是独立的,则协方差为0。如果两个变量不是独立的,即协方差不是0,人们自然希望知道它们之间的相关程度有多大,相关系数刻画了这种特征。相关系数ρ定义如下:
ρ=cov(X,Y)σXσY(1.1.25)
式中: σX ,σY 分别为X,Y的标准差。可以看出两个变量的相关系数等于它们的协方差与各自标准差之比。相关系数是两个随机变量线性相关程度的数字特征,其符号与协方差符号相同。但相关系数经过标准化处理,已经没有量纲,其值在-1和1之间。如果是0,表明两变量不相关。1.2从总体到样本1.2.1基本统计量
统计中将所研究的对象称为总体(population)。总体的某种数量指标X,作为随机变量称为总体随机变量,通常简称为总体X,如中国人的年龄等。要想知道总体全部数据常常是困难的,甚至是做不到的。一般只能抽取一部分数据,x1,x2,…,xN,即所谓的样本(sample)。统计学的基本任务就是依据样本数据来推断总体,包括推断总体的分布及其数字特征等。1. 样本均值(mean)样本的算术平均值定义为
x-=1N∑Ni=1xi(1.2.1)
它是总体均值E(X)的一个好的估计量。在统计中,有时还使用加权平均,它是各个数据依照相对重要程度乘以相应的权重后再平均。例如,要计算一揽子商品的平均价格,就需要用每种商品的数量作为权重,价格指数的计算就是利用加权平均。除了算术平均,还有一种很重要的几何平均,即各个数据连乘积的N次方根,N是样本观测值的个数。当根据一个国家一段时期内各期经济增长率数据,要得出这一段时期的平均增长率时,一定要用几何平均来计算。另外,样本中位数(median)是一个关于中心位置的度量,即样本按从小到大排列后的中间值。对于奇数个样本来说,中位数是位于中间的数据点; 对于偶数个样本,中位数是两个中间数据的平均值。2. 样本标准差(standard deviation)样本标准差衡量了样本值对样本均值的偏离程度,记为sx,其计算公式如下:
sx=1N-1∑Ni=1xi-x-2(1.2.2)
式中: x-为样本均值。在式(1.2.2)中除以N-1而不是除以N,是因为这样得到的样本方差估计量才是无偏估计量。标准差的平方即样本方差sx2是样本二阶中心矩。类似地,样本三阶矩为
1N-1∑Ni=1(xi-x-)3(1.2.3)
样本四阶矩定义为
1N-1∑Ni=1(xi-x-)4(1.2.4)
由式(1.2.2)、式(1.2.3)和式(1.2.4),可以类似总体偏度和峰度,计算样本偏度和峰度。
例1.3基本统计量
表1.2.1列出了我国1992—2003年的实际GDP增长率,求出我国这12年的平均增长率、标准差、偏度和峰度。
表1.2.1GDP增长率(可比价格)%
年份199219931994199519961997199819992000200120022003增长率14.213.512.610.59.68.87.87.18.07.58.09.1
数据来源: 中国统计年鉴.北京: 中国统计出版社,2004.
算术均值: 9.725几何平均值: 9.467标准差: 2.45
偏度: 0.78峰度: 2.153. 样本协方差(covariance)样本协方差记为cxy ,计算公式如下:
cxy=1N-1∑Ni=1(xi-x-)(yi-y-)(1.2.5)
式中: y1,y2,…,yN是随机变量Y的N个样本。进而可以计算样本相关系数:
r=∑Ni=1(xi-x-)(yi-y-)∑Ni=1(xi-x-)2∑Ni=1(yi-y-)2=cxysxsy(1.2.6)
在进行经济分析时,经常考察两个变量之间的相关系数。如果相关系数较大,比如正相关接近1,则说明这两个变量的波动性十分相似,很多个样本点上有这样的关系: 一个变量大于其均值时,另一个变量也大于均值。波动的相似性为进一步建立模型等提供了依据。相关系数计算的是两组样本的同期相关程度。在分析经济周期问题的时候,经常区分先行、一致和滞后经济指标,用来表明经济指标与整个经济景气的同步性。这时,往往需要计算交叉相关(cross correlation)系数。序列X与Y的交叉相关系数的计算公式如下:
r(l)=cxy(l)sxsy,l=0,±1,±2,…(1.2.7)
式中:
cxy(l)=1N∑N-li=1xi-x-yi l-y-,l=0,1,2,3,…
1N∑N li=1yi-y-xi-l-x-,l=0,-1,-2,…(1.2.8)
1.2.2估计量性质在许多实际运用中,仅有来自总体的一些样本,而且要用样本矩(如样本方差)来推断总体矩(方差)。如何用有限的样本对总体进行尽可能准确的推断呢?这无疑要求我们寻找到性质优良的统计量。考虑总体任意的一个参数β,我们选择一个样本统计量作为β的估计量。评判估计量优劣通常有以下几个标准。1. 无偏性由于估计量是随机变量,不同的样本值就有不同的估计值,自然希望这些估计值的平均值是待估参数的真值,即估计量的均值等于未知参数的真值。当E(β^)=β时,称β^为β的无偏估计量,否则称为有偏估计,并称
b=E(β^)-β(1.2.9)
为估计量β^的偏倚(bias)。由于
E(x-)=1N∑Ni=1E(xi)=μX(1.2.10)
因此,x-是μX 的无偏估计。同样,可以证明式(1.2.2)定义的样本标准差所确定的样本方差是总体方差的无偏估计。无偏估计和有偏估计如图1.2.1所示。
评论
还没有评论。