描述
开 本: 16开纸 张: 胶版纸包 装: 平装是否套装: 否国际标准书号ISBN: 9787302347897
一本全面介绍IBM SPSS统计分析软件的宝典秘笈,累计6次印刷,畅销13500册
涵盖SPSS数据管理、基础统计分析和高级统计分析等应用
精讲112个实战案例,带领读者成长为数据分析的高手
提供16.4小时配套教学视频
赠送17.3小时SAS统计分析教学视频
推荐阅读(请点丛书链接查看)
(视频教学 实例 案例)
(视频教学 实例 案例)
(畅销23000册,职场效率提升100%)
(精美图表,全彩印刷)
(情景案例,超级有趣!)
本书共30章,分为3篇。第1篇为SPSS19.0软件基础篇,涵盖SPSS19.0概述、数据管理、统计描述分析及基本统计分析的报表制作;第2篇为基本统计分析方法篇,涵盖T检验、方差分析、定性资料统计推断、有序定性资料统计推断、统计图制作、诊断试验与ROC分析、缺失值分析、非参数检验、简单线性回归与相关、多重响应分析、SPSS中*化过程的实现及典型相关;第3篇为高级统计分析篇,涵盖Logistic回归、对数线性模型、生存分析与Cox模型、聚类与判别分析、主成分与因子分析、多元方差分析、时间序列分析、信度分析、对应分析、神经网络模型、曲线回归与非线性回归、多重线性回归与相关、路径分析、中介效应与调节效应分析。
本书不仅适合SPSS初学者阅读,也适合有一定基础的人员阅读。通信、金融、制造、医药、教育科研、市场调研,连锁零售和电子商务等行业的数据分析人员,可将本书作为一本易学易练的案头参考书;医药学、心理学、经济管理等专业的大中专院校的学生和教师,可将本书作为一本教材使用。
超值、大容量DVD光盘
16.4小时多媒体教学视频
《SPSS统计分析大全》实例源数据
17.3小时SAS统计分析教学视频(赠送)
第1篇 SPSS软件基础篇
第1章 SPSS 19.0概述( 教学视频:51分钟)
1.1 SPSS 19.0简介
1.1.1 SPSS 19.0统计软件的优点
1.1.2 SPSS 19.0软件新增功能
1.1.3 SPSS 19.0统计软件的环境要求
1.2 SPSS 19.0安装、启动与退出
1.2.1 SPSS 19.0安装
1.2.2 SPSS 19.0的启动
1.2.3 SPSS 19.0的退出
1.3 主要窗口和功能
1.3.1 数据编辑窗口
1.3.2 结果输出窗口
1.3.3 变量编辑窗口
1.3.4 语法编辑器窗口
1.3.5 脚本编写窗口
1.3.6 图表编辑窗口
1.4 构建数据库
1.4.1 操作步骤
1.4.2 模块解读 1
1.4.3 实例详解
第2章 数据管理( 教学视频:65分钟)
2.1 数据的打开
2.1.1 SPSS的数据文件类型
2.1.2 模块解读
2.2 数据的保存
2.2.1 SPSS数据保存
2.2.2 保存类型
2.3 数据的整理
2.3.1 数据的合并
2.3.2 数据个案的拆分
2.3.3 数据个案的排序
2.3.4 数据的分类汇总
2.3.5 数据的加权
2.3.6 重复数据的查找
2.3.7 个案的选择
2.3.8 计算新变量
2.3.9 变量值的重新编码
第3章 统计描述分析( 教学视频:21分钟)
3.1 频数分布分析(Frequencies)
3.2 描述性统计分析(Descriptives)
3.3 探索性分析(Explore)
第4章 基本统计分析的报表制作( 教学视频:28分钟)
4.1 代码本
4.1.1 模块解读
4.1.2 实例详解
4.2 在线分析处理报告(OLAP)
4.2.1 模块解读
4.2.2 实例详解
4.3 个案摘要报告
4.3.1 模块解读
4.3.2 实例详解
4.4 行形式摘要报告
4.4.1 模块解读
4.4.2 实例详解
4.5 列形式摘要报告
4.5.1 模块解读
4.5.2 实例详解
第2篇 基本统计分析方法篇
第5章 T检验( 教学视频:37分钟)
5.1 均值(Means)过程
5.2 单样本T检验
5.2.1 原理
5.2.2 模块解读
5.2.3 实例详解
5.3 独立样本T检验
5.3.1 原理
5.3.2 模块解读
5.3.3 实例详解
5.4 配对样本T检验
5.4.1 原理
5.4.2 模块解读
5.4.3 实例详解
第6章 方差分析( 教学视频:64分钟)
6.1 单因素方差分析 79
6.1.1 原理 79
6.1.2 模块解读 80
6.1.3 实例详解 83
6.2 随机区组设计方差分析 86
6.2.1 原理 86
6.2.2 模块解读 86
6.2.3 实例详解 91
6.3 析因设计方差分析 93
6.3.1 原理 93
6.3.2 模块解读 93
6.3.3 实例详解 94
6.4 交叉设计方差分析 94
6.4.1 原理 94
6.4.2 模块解读 95
6.4.3 实例详解 95
6.5 拉丁方设计方差分析 96
6.5.1 原理 96
6.5.2 模块解读 96
6.5.3 实例详解 96
6.6 协方差分析 97
6.6.1 原理 97
6.6.2 模块解读 98
6.6.3 实例详解 98
6.7 嵌套设计方差分析 99
6.7.1 原理 99
6.7.2 模块解读 100
6.7.3 实例详解 100
6.8 重复测量数据方差分析 101
6.8.1 原理 101
6.8.2 模块解读 102
6.8.3 实例详解 103
第7章 定性资料统计推断( 教学视频:42分钟)
7.1 成组设计四格表资料卡方检验 106
7.1.1 原理 106
7.1.2 模块解读 107
7.2 配对设计四格表资料卡方检验 109
7.2.1 原理 109
7.2.2 模块解读 110
7.3 成组设计行乘列表资料的卡方检验 111
7.3.1 多个样本率比较 111
7.3.2 原理 112
7.3.3 模块解读 112
7.3.4 多个构成比之间的比较 115
7.3.5 原理 115
7.3.6 模块解读 115
7.4 似然比检验和确切概率法 118
7.4.1 似然比检验 118
7.4.2 确切概率法 120
7.5 卡方检验的多重比较 123
7.5.1 原理 123
7.5.2 模块解读 124
第8章 有序定性资料统计推断( 教学视频:21分钟)
8.1 单向有序行×列表数据的分析 127
8.1.1 两组单向有序分类资料的秩和检验 127
8.1.2 多组单向有序定性资料的秩和检验 129
8.1.3 两两比较的秩和检验(T检验法) 130
8.2 双向有序属性相同行×列表数据的分析 131
8.3 双向有序属性不同行×列表数据的分析 133
8.4 SPSS软件实现有序定性资料的分析方法 134
8.5 小结 140
第9章 统计图( 教学视频:41分钟)
9.1 SPSS 19.0绘图功能简介 141
9.1.1 图表构建程序简介 142
9.1.2 图形画板模板选择程序 146
9.2 条形图(Bar) 148
9.2.1 统计图的结构 150
9.2.2 统计图的绘图原则 150
9.2.3 统计图型的选择 150
9.2.4 模块解读 151
9.2.5 统计图编辑 153
9.3 3-D条形图(3-D Bar) 156
9.4 线图(Line) 158
9.5 面积图(Area) 159
9.5.1 简单面积图 159
9.5.2 堆积面积图 159
9.6 饼图(Pie) 161
9.7 高低图(High-Low Charts) 162
9.8 箱图(Boxplot) 164
9.9 误差条图(Error bar) 165
9.10 人口金字塔图(population Pyramid) 167
9.11 散点图(Scatter) 167
9.11.1 简单分布散点图 168
9.11.2 矩阵分布散点图 168
9.11.3 简单点图 169
9.11.4 重叠分布散点图 170
9.11.5 3-D分布散点图 171
9.12 直方图(Histogram) 171
9.13 时间序列图(Time Series Plot) 172
第10章 诊断试验与ROC分析( 教学视频:13分钟)
10.1 常用诊断试验的评价指标 175
10.1.1 常用的诊断试验评价指标 175
10.1.2 提高诊断试验效率的方法 178
10.2 ROC曲线 180
10.2.1 ROC分析的基本原理 181
10.2.2 模块解读 181
10.2.3 实例详解 182
第11章 缺失值分析( 教学视频:27分钟)
11.1 缺失值分析简介 185
11.1.1 缺失值的类别 185
11.1.2 SPSS中的缺失值处理方法 186
11.2 SPSS缺失值分析 187
11.2.1 模块解读 187
11.2.2 实例详解 190
第12章 非参数检验( 教学视频:43分钟)
12.1 非参数检验简介 195
12.1.1 非参数检验和参数检验 195
12.1.2 非参数检验的优点 195
12.1.3 非参数检验的缺点 195
12.2 卡方检验 196
12.2.1 卡方检验的概念 196
12.2.2 原理和方法 196
12.2.3 模块解读 196
12.2.4 实例详解 197
12.3 二项式检验 199
12.3.1 原理 199
12.3.2 模块解读 199
12.3.3 实例详解 200
12.4 游程检验 201
12.4.1 基本概念 201
12.4.2 原理和方法 201
12.4.3 模块解读 202
12.4.4 实例详解 202
12.5 单样本K-S检验 203
12.5.1 原理和方法 203
12.5.2 模块解读 203
12.5.3 实例详解 204
12.6 两独立样本检验 205
12.6.1 原理和方法 205
12.6.2 模块解读 206
12.6.3 实例详解 207
12.7 K个独立样本检验 208
12.7.1 原理和方法 208
12.7.2 模块解读 209
12.7.3 实例详解 210
12.8 两个相关样本检验 211
12.8.1 原理与方法 211
12.8.2 模块解读 212
12.8.3 实例详解 212
12.9 K个相关样本检验 214
12.9.1 原理与方法 214
12.9.2 模块解读 215
12.9.3 实例详解 215
第13章 简单线性回归与相关( 教学视频:36分钟)
13.1 相关分析简介 217
13.1.1 基本概念 217
13.1.2 相关系数的计算 218
13.1.3 SPSS中的相应功能 219
13.2 双变量相关 219
13.2.1 原理 219
13.2.2 分析实例 221
13.2.3 Spearman等级相关系数 223
13.2.4 Kendall等级相关系数 223
13.3 偏相关分析 224
13.3.1 偏相关分析的含义 224
13.3.2 偏相关系数的计算 224
13.3.3 分析实例 225
13.4 距离相关 226
13.4.1 距离测量与相似性测量指标 227
13.4.2 分析实例 228
13.5 简单回归分析 230
13.5.1 原理 230
13.5.2 分析实例 232
13.5.3 相关与回归分析的区别和联系 233
13.6 小结 234
第14章 多重响应分析( 教学视频:21分钟)
14.1 多重响应变量定义与数据录入 235
14.2 多重响应变量集的定义 237
14.3 多重响应变量集的频率分析 239
14.4 多重响应变量交叉表分析 240
第15章 SPSS中随机化过程的实现( 教学视频:38分钟)
15.1 基本原理 243
15.2 模块解读 244
15.3 实例详解 247
15.3.1 随机抽样 247
15.3.2 随机分组 249
第16章 典型相关( 教学视频:12分钟)
16.1 原理解读 253
16.2 研究步骤 254
16.3 实例详解 254
第3篇 高级统计分析篇
第17章 Logistic回归( 教学视频:33分钟)
17.1 二项分类Logistic回归 260
17.1.1 原理 260
17.1.2 模块解读 261
17.1.3 实例详解 264
17.2 条件Logistic回归 267
17.3 有序Logistic回归 268
17.3.1 原理 269
17.3.2 模块解读 269
17.3.3 实例分析 272
17.4 多项分类Logistic回归 273
17.4.1 原理 273
17.4.2 模块解读 274
17.4.3 实例分析 275
第18章 对数线性模型( 教学视频:41分钟)
第19章 生存分析与Cox模型( 教学视频:55分钟)
第20章 聚类和判别( 教学视频:44分钟)
第21章 主成分与因子分析( 教学视频:33分钟)
第22章 多元方差分析( 教学视频:31分钟)
第23章 时间序列分析( 教学视频:35分钟)
第24章 信度分析( 教学视频:18分钟)
第25章 对应分析( 教学视频:39分钟)
第26章 神经网络模型( 教学视频:23分钟)
第27章 曲线回归与非线性回归( 教学视频:17分钟)
第28章 多重线性回归与相关( 教学视频:11分钟)
第29章 路径分析( 教学视频:13分钟)
第30章 中介效应与调节效应分析( 教学视频:33分钟)
笔者自2001年参加工作以来,一直从事统计学与SPSS统计软件的教学工作,结合自己多年的教学与科研的经验和心得体会,两年前就有想法编写一本SPSS教材,一次偶然机会,与安徽医科大学流行病与卫生统计学系主任潘发明教授表明想法,潘教授欣然同意,于是便开始本书的编写。希望各位读者能在本书的引领下跨入SPSS大门,能够将SPSS数据分析方法成功运用于自己所从事的领域,并成为一名SPSS分析专家。本书结合大量实例,详细阐述了SPSS 19.0各功能模块的应用,不论对初学者还是有一定基础的SPSS使用者,都是一本手边的参考书。
本书特色
1. 视频讲解,高效学习
为了帮助读者更加高效、直观地学习,作者为本书每章的重点内容专门录制了长达16小时的配套高清教学视频。这些视频和本书所有案例的数据文件一起收录于配书光盘中,便于读者自学和实践练习。
2.案例式教学模型
本书所有的统计分析方法,均有一到两个详实的案例进行辅助讲解与教学,便于读者学习时自己操作练习,加深对所学内容的理解。
3.内容全面、系统、深入
内容涉及面较广,共3篇30章内容,涵盖软件介绍与基本数据管理、基本统计分析和高级统计分析,不论对初学者还是进阶者均是一本颇为受益的参考书。
4.讲解由浅入深,循序渐进,适合各个层次的读者阅读
本书从SPSS简介、数据库构建、数据库管理、基本统计分析到高级统计分析,逐级深入,符合认知规律,内容梯度从易到难,讲解由浅入深,循序渐进,适合各个层次的读者阅读,并均有所获。
5.提供技术支持,答疑解惑
读者阅读本书时若有任何疑问,可发E-mail到[email protected],也可以通过[email protected]和我们取得联系,以获得帮助。
本书内容及体系结构
第1篇 SPSS软件基础篇(第1~4章)
本篇主要内容包括SPPS 19.0概述、数据管理、统计描述分析以及基本统计分析报表制作。通过本篇的学习,读者可以掌握SPSS软件的概况,学会如何构建SPSS数据库,并对数据进行管理,掌握数据统计描述的方法以及学会统计报表的制作。
第2篇 基本统计分析方法篇(第5~16章)
本篇主要内容包括T检验、方差分析、定性资料统计推断、有序定性资料统计推断、统计图制作、诊断试验与ROC分析、非参数检验、简单线性回归与相关、多重响应分析、SPSS中随机化过程的实现以及典型相关。通过本篇的学习与练习,读者可以掌握以及具备SPSS中级统计分析的能力,基本能够处理常见问题的统计分析。
第3篇 高级统计分析篇(第17~30章)
本篇主要内容包括Logistic回归、对数线性模型与Possion回归、生存分析与Cox模型、聚类与判别分析、主成分分析与因子分析、多元方差分析、时间序列分析、信度分析、对应分析、神经网络模型、曲线回归与非线性回归、路径分析与中间效应分析。这一部分是对SPSS应用能力的进一步提升,通过本篇的学习,读者能够达到SPSS应用能力的高级水平。
本书读者对象
* 医学、心理学、经济管理专业的学生和老师;
* 通信、金融、制造、医药、教育科研、市场调研、连锁零售、电子商务和电子政务等行业的数据分析人员;
* 公司与事业单位的数据分析人员;
* 临床医生;
* SPSS统计分析爱好者;
* 社会培训班学员;
* 需要一本案头手册的数据分析人员。
本书作者
本书由武松和潘发明等多位作者共同编写,由SPSS China的曾凯审核。其中,武松参与编写了第1、4、6、9、16、18、25、26、27、28、29章;潘发明参与编写了第2、3、5、7、8、10、11、12、13、17、19、20、21、22章;朱继民参与编写了第15、24章;范引光参与编写了第9章;杨林胜参与编写了第14、30章;陈道俊参与编写了第4、6、14、16、18、23、30章;王鸣瑞参与编写了第1章;范大志参与编写了第19章;丁宁参与编写了第12、21、22章;王孟菲参与编写了第23章;王亚黎参与编写了第25章;王笙参与编写了第10章;方笑丽参与编写了第28章;李明参与编写了第27章;李桂兴参与编写了第5章;刘丽参与编写了第2章;胡艳婷参与编写了第3章;杨婷参与编写了第7章;段振华参与编写了第11章;刘思参与编写了第13章;曾臻参与编写了第17章;吴珊珊参与编写了第20章;戚先伟参与编写了第26章;鲁构峰参与编写了第29章。全书由曾凯负责统稿。本书受到安徽中医药大学校级教学研究课题(NO.YB201012)资助。
编写这样的一本书极具挑战性,需要付出大量的努力,耗费大量的时间和精力。虽然我们在编写时尽可能消灭差错,但也恐百密难免一疏。若读者在阅读过程中发现任何疏漏,请及时和我们联系。
描述性统计分析是进行其他统计分析的基础和前提。在描述性分析中,通过各种统计图表及数字特征量可以对样本来自的总体特征有比较准确的把握,从而选择正确的统计推断方法。SPSS 的许多模块都可完成描述性统计分析,但专门为该目的而设计的几个模块则集中在descriptive statistics 菜单中,它们通过计算各种统计量或绘制统计图来实现描述功能,包括Frequencies、 Descriptives 和Explore 等几个过程。3.1 频数分布分析(Frequencies)频数分布分析主要通过频数分布表、条图和直方图,以及集中趋势和离散趋势的各种统计量,描述数据的分布特征。例3-1:数据文件“胆固醇.sav”记录了101 名正常成年女子的血清总胆固醇,对血清总胆固醇测量结果作描述性分析,并绘制直方图。操作过程如下。
(1)从菜单中单击“分析”|“描述统计”(Descriptive Statistics)|“频率”(Frequencies)
命令,将弹出“频率”(Frequencies)主对话框,如图3-1 所示。
图3-1 频数分布分析对话框
对话框底部有一项“显示频率表格”(Display frequency tables)复选框,SPSS 默认选
择此项。选择此项后,输出结果将显示频数分布表,否则只显示直方图,不显示频数分
布表。
(2)单击“统计量”按钮,弹出“频率:统计量”(Frequencies:Statistics)对话框,
如图3-2 所示。
在该对话框中,用户可以选择所要统计的统计量。对话框中各选项的具体意义如下。
①“百分位值”(Percentile Values)栏为复选项,在此栏中可选择多项。
四分位数(Quartile):用于计算P25、P50 和P75。
割点(Cut points):选择此项,在后面的文本框中输入数值,假设为N(N 为在2~
100 之间的整数),则计算并显示N 分位数。
百分位数(Percentile(s)):选择此项,在后面的文本框中输入数值,可以有选择
地显示百分位数。在文本框中可以输入0~100 之间的数,输入后,单击“添加”
(Add)按钮,将对应的百分位数添加到方框内的列表框中。利用“更改”(Change)
按钮和“删除”(Remove)按钮,可以对列表框中的选项进行修改和删除。
②“离散”(Dispersion)栏(复选项)包含的选项如下:
标准差(Std Deviation)
小值(Minimum)
方差(Variance)
值(Maximum)
范围(极差)(Range)
均值的标准误(S.E. Mean)
③“集中趋势”(Central Tendency)栏(复选项):包括均值(Mean)、中位数(Median)、
众数(Mode)和合计(Sum)。
“集中趋势”栏下方有一个“值为组的中点”(Values are group midpoints)复选框,
如果数据已经分组,而且数据取值为初始分组的中点,选择此项,将计算百分位数统计和
数据的中位数。
④“分布”栏(Distribution)(复选项):包括峰度(Kurtosis)和偏度(Skewness)。
(3)单击“图表”(Charts)按钮,打开“频率:图表”(Frequencies:Charts)对话
框,如图3-3 所示。
图3-2 频数分布分析中的统计量对话框 图3-3 频数分布分析中的统计图对话框
在该对话框中,用户可以选择频数分析的图表类型。该对话框中各选项的具体意义
如下。
① 图表类型(Chart Type)(单选项):包括无(None)(系统默认选项)、条形图
(Bar charts)、饼形图(Pie charts)和直方图(Histograms)。
如果选择输出“直方图”,可以选择是否在输出的直方图中添加正态分布曲线。如果
需要输出正态分布曲线,则可勾选“在直方图上显示正态曲线”复选框。
② 图表值(Chart Values)(单选项组):可选择图形中分类值的表现形式。
频率(Frequencies):如果图表类型是直方图,则直方图的纵轴为频数;如果图表
类型是饼形图,则饼形图中每块表示属于该组观测值的频数。
百分比(Percentage):如果图表类型是直方图,则直方图的纵轴为百分比;如果
图表类型是饼形图,则饼形图中每块表示该组的观测量数占总数的百分比。
(4)单击“格式”(Format)按钮,打开“频率:格式”(Frequencies:Format)对
话框,如图3-4 所示。
图3-4 频数分布分析中的频数输出格式对话框
在该对话框中,用户可以设置频率分布表的输出格式。对话框中各选项的意义如下。
①“排序方式”(Order by)栏:单选项组,用户可以选择频数分布表中数值及其对
应频率的排列顺序。
按值的升序排序(Ascending values):系统默认选项,频数分布表中将按照数值
从小到大排列。
按值的降序排序(Descending values):频数分布表中将按照数值从大到小排列。
按计数的升序排序(Ascending counts):频数分布表中将按照计数从小到大排列。
按计数的降序排序(Descending counts):频数分布表中将按照计数从大到小排列。
如果用户在“频率:图表”对话框中选择输出直方图,频数分布表将按照数值顺序
排列。
②“多个变量”(Multiple Variables)栏:单选项组,当“频率”(Frequencies)主对
话框的“变量”(Variable(s))列表框中有多个变量时,利用“多个变量”栏可以设置表
格的显示方式。
比较变量(Compare variables):系统默认选项,SPSS 将所有变量的描述统计的
结果显示在同一张表格中,方便用户进行比较分析。
按变量组织输出(Organize output by variable):SPSS 将对应每个变量分别输出单
独的描述统计表格。
在“频率:格式”对话框的底端,有一个“类别数”(Suppress tables with more than
n categories)文本框。通过输入数值,可确定频数表输出的方位,即输出数据的组数不得
大于窗口中输入的数值。类别数参数的默认值是10。
(5)主要输出结果:主要输出结果有统计量(图3-5)和直方图(图3-6)。
图3-5 血清总胆固醇测量值统计量 图3-6 血清总胆固醇测量值的频数分布直方图及正态曲线
3.2 描述性统计分析(Descriptives)
描述性统计分析主要用以计算描述集中趋势和离散趋势的各种统计量,此外还有一个
重要功能是对变量做标准化变换,即Z 变换。
例3-2:对数据文件“演员.sav”中的两个变量:“男演员年龄”和“女演员年龄”进
行描述性分析。数据描述功能的操作步骤如下。
(1)打开“分析”(Analyze)菜单,选择“描述统计”(Descriptive Statistics)子菜
单下的“描述”(Descriptives)命令,打开对话框如图3-7 所示。将变量“男演员”和“女
演员”选入右边的“变量”(Variable(s))列表框中。
图3-7 描述性统计分析对话框
“将标准化得分另存为变量”(Save standardized values
as variables)复选框:选择该项,将对“变量”(Variable(s))
列表框中被选中变量的数据进行标准化,然后将标准化的
结果保存到新变量中。新变量的变量名为原变量的变量名
前面添加字母z,并被添加在数据编辑窗口中变量的后
一列。数据标准化的计算公式为:Zi= (Xi– x )/s,通过标准
化,可以将均值为x 、标准差为s 的原变量转化成均值为
0、标准差为1 的新变量。
(2)单击“选项”(Options)按钮,将打开“描述:
选项”(Descriptives:Options)对话框,如图3-8 所示,
本例选择所有统计量。
在该对话框中,用户可以选择所要统计的统计量和图
表输出方式。具体对话框中各选项的意义如下。
在对话框中上面一行是均值(Mean)和合计
(Sum)。
“离散”(Dispersion)栏中的统计量包括:
标准差(Std Deviation) 小值(Minimum)
方差(Variance) 值(Maximum)
范围(Range) 均值的标准误(S.E. Mean)
“分布”(Distribution)栏中的统计量包括峰度(Kurtosis)和偏度(Skewness)。
“显示顺序”(Display Order)栏中,用户可以自行选择输出变量的排序方式,
包括:
① 变量列表(Variable List):在结果输出窗口中,用户选择输出的变量将按照变量
在数据编辑窗口中原来的排列顺序进行排列。
② 字母顺序(Alphabetic):在结果输出窗口中,用户选择输出的变量将按照变量名
的字母排列顺序进行排列。
③ 按均值的升序排序(Ascending Means):SPSS 将计算每个输出变量的平均值,并
按照平均值从小到大对输出变量的顺序进行排列。
④ 按均值的降序排序(Descending Means):SPSS 将计算每个输出变量的平均值,
并按照平均值从大到小对输出变量的顺序进行排列。
(3)主要输出结果:本例输出结果见图3-9。
图3-9 描述统计量
3.3 探索性分析(Explore)
探索分析是在对数据的基本特征统计量有初步了解的基础上,对数据进行的更为深入
图3-8 描述性统计分析选项对话框
详细的描述性观察分析。它在一般描述性统计指标的基础上,增加了有关数据其他特征的
文字与图形描述,显得更加细致与全面,有助于用户思考对数据进行进一步分析的方案。
主要的分析如下。
(1)观察数据的分布特征:通过绘制箱锁图和茎叶图等图形,直观地反映数据的分布
形式和数据的一些规律,包括考察数据中是否存在异常值等。过大或过小的数据均有可能
是奇异值、影响点或错误数据。寻找异常值,并分析原因,然后决定是否从分析中删除这
些数据。因为奇异值和影响点往往对分析的影响较大,不能真实地反映数据的总体特征。
(2)正态分布检验:检验数据是否服从正态分布。很多检验能够进行的前提即总体数
据分布服从正态分布。因此,检验数据是否符合正态分布,就决定了它们是否能用只对正
态分布数据适用的分析方法。
(3)方差齐性检验:用Levene 检验比较各组数据的方差是否相等,以判定数据的离散
程度是否存在差异。例如在进行独立样本的T 检验之前,就需要事先确定两组数据的方差
是否相同。如果通过分析发现各组数据的方差不同,还需要对数据进行方差分析,那么就
需要对数据进行转换使得方差尽可能相同。Levene 检验进行方差齐性检验时,不强求数据
必须服从正态分布,它先计算出各个观测值减去组内均值的差,然后再通过这些差值的绝
对值进行单因素方差分析。如果得到的显著性水平(Significance)小于0.05,那么就可以
拒绝方差相同的假设。
例3-3:对数据文件“南北差异温度.sav”中的变量“年平均温度” 按分组类变量为
“地域”进行探索性分析。
探索分析的具体操作步骤如下。
(1)打开数据文件,增加变量“地域”,选择“分析”(Analyze)菜单,单击“描述
统计”(Descriptive Statistics)子菜单下的“探索”(Explore)命令,SPSS 将弹出“探索”
(Explore)对话框,如图3-10 所示。
图3-10 探索性分析主对话框
对话框中各项含义如下。
因变量列表(Dependent List):因变量是用户所研究的目标变量。本例选入变量
“年平均温度”。
因子列表(Factor List):影响因变量的因素,本例选入变量“地域”。
标注个案(Label Cases by):标注个案是区分每个观测量的变量。本例选入变量
“城市”。
两者都(Both):默认选项,表示同时输出描述统计量的统计表格和图形。本例
选此项。统计量(Statistics):表示只输出统计表格,不输出图表。
图:表示只输出图表,不输出统计表格。
(2)单击“统计量”(Statistics)按钮,打开“探索:统计
量”(Explore:Statistics)对话框,如图3-11 所示,本例全选。
对话框中各项含义如下。
描述性(Descriptives):选择此项,将生成描述性统计
表格。表中显示样本数据的描述统计量,包括平均值、
中位数、5%调整平均数、标准误、方差、标准差、
大值、小值、组距、四分位数、峰度、偏度及峰度和
偏度的标准误。
均值的置信区间(Confidence Interval for Mean):用户
还可输入数值指定均值的置信区间的置信度,系统默认的置信度为95%。
M-估计量(M-estimators):选择此项,将计算并生成稳健估计量。M 估计在计算
时对所有观测量赋予权重,随观测量距分布中心的远近而变化,通过给远离中心
值的数据赋予较小的权重来减小异常值的影响。
界外值(Outliers):选择此项,将输出分析数据中的5 个值和5 个小值作
为异常嫌疑值。
百分位数(Percentiles):选择此项,将计算并显示指
定的百分位数,包括5%、10%、25%、50%、75%、
90%和95%等。
(3)单击“绘制”(Plots)按钮,打开“探索:图”(Explore:
Plots)对话框,如图3-12 所示。
对话框中各项含义如下。
“箱图”(Boxplots)栏(单选项组):箱图,又称
箱锁图。
按因子水平分组(Factor levels together,系统默
认):选择此项,将为每个因变量创建一个箱锁
图,在每个箱锁图内根据分组变量的不同水平的
取值创建箱形单元。
不分组(Dependents together):选择此项,将为
每个分组变量的水平创建一个箱锁图,在每个箱锁图内用不同的颜色区分不同
因变量所对应的箱形单元,方便用户进行比较。
无(None):选择此项,不创建箱图。
“描述性”(Descriptive)栏(复选项):选择该组内的选项,可以生成茎叶图和
(或)直方图。
茎叶图(Stem-and-leaf,系统默认):茎叶图主要由3 个部分组成,即频率
(Frequency)、茎(Stem)和叶(Leaf),在图中按从左到右的顺序依次排列,
图3-11 统计量对话框
图3-12 统计图对话框
在图的底端,注明了茎的宽(Stem Width)和每一叶所代表的观测量数(Each
Leaf)。图3-13 为本例分析结果之一。本例茎宽为10,每片叶子代表一例。
直方图(Histogram):直接绘制直方图。
“带检验的正态图”(Normality plots with test)复选框:选择此项,将进行正态
性检验,并生成正态Q-Q 概率图和无趋势正态Q-Q 概率图。
“伸展与级别Levene 检验”(Spread vs level with Levene Test)栏(单选项组):
对所有的展布-水平图进行方差齐性检验和数据转换,同时输出回归直线的斜率及
方差齐性的Levene 检验,但如果没有指定分组变量,则此选项无效。
无(None:不进行Levene 检验,系统默认。选择此项,SPSS 将不产生回归直
线的斜率和方差齐性检验。
幂估计(Power Estimation):对每组数据产生一个中位数的自然对数及四个分
位数的自然对数的散点图。
已转换(Transformed):变换原始数据,用户可在后面的参数框中选择数据变
换类型。
未转换(Untransformed):不变换原始数据时选择此项。
(4)单击“选项”(Options)按钮,打开“探索:选项”(Explore:Options)对话
追风箭 –
虽然是19.0版本有点老,但是不影响学习基础,讲的比较详细,也有配套练习数据。视频教材如果都是第一章那样讲法就好了,后面都像读课本。
弧光浮晨 –
很好的书,如果能把原理讲的更多一点就更好了