描述
开 本: 16开纸 张: 胶版纸包 装: 平装是否套装: 否国际标准书号ISBN: 9787030694119
内容简介
R是天生的数据分析利器,因其在统计建模和数据可视化方面的优势,它被越来越多的语言学者熟知和使用,已经成为应用语言学、心理语言学、实验语音学等研究者青睐的重要研究工具。《R在语言科学研究中的应用》在语言学量化研究视域下主要介绍了四个方面内容:①“干净、整洁”的数据框的标准;②基于ggplot2的语言数据可视化;③NHST的原理,即如何在语言研究中实现从样本到总体;④统计推断的多种应用。《R在语言科学研究中的应用》从训练数据框操作能力入手,在介绍这四个方面内容时,首先着力解决一些关键概念的理解问题,然后提供大量实例,把关键概念付诸具体应用。比如,在介绍数据框操作时,既有语言研究中常用的问卷数据处理,也有大量的反应时行为数据(E-prime)处理,这些数据都是基于笔者真实的语言研究项目。每项研究都会涉及上述四个方面内容,因此形成了一些可供后续使用的经验。
目 录
目录
前言
本书使用说明
第1章 R数据科学:数据框的操作 1
1.1 “干净、整洁”的数据框的标准 2
1.2 熟练地使用数据框操作函数 8
1.2.1 gather( )和spread( )的用法 9
1.2.2 separate( )和unite( )的用法 14
1.3 一些基础正则表达式的知识 22
1.4 数据表合并 34
1.4.1 传统的变长或变宽的表格合并 34
1.4.2 生成新变量的表格合并 40
1.4.3 不生成新变量的表格合并 46
1.4.4 集操作 50
1.5 数据框运算和操作的五个函数 53
第2章 数据框操作实例:问卷数据处理 61
2.1 案例一:汉语第三人称代词的可接受度判断实验 61
2.1.1 背景 61
2.1.2 材料 62
2.1.3 程序 63
2.1.4 数据清洁和整理 64
2.1.5 利用终数据进行描述统计 72
2.2 案例二:英语第三人称代词的可接受度判断实验 77
2.2.1 背景 77
2.2.2 材料 79
2.2.3 程序 80
2.2.4 数据清洁和整理 81
2.2.5 利用终数据进行描述统计 93
第3章 数据框操作实例:反应时行为数据处理 97
3.1 背景 98
3.1.1 被试 98
3.1.2 材料 99
3.1.3 程序 100
3.2 E-prime数据清洁和整理 100
3.3 RStudio数据清洁和整理 104
3.4 总结 118
第4章 概率分布 121
4.1 介绍 121
4.2 离散变量分布 123
4.3 连续变量分布:正态分布,t分布、F分布和X2分布 127
4.3.1 正态分布 127
4.3.2 t分布、F分布和X2分布 135
第5章 假设检验的原理 141
5.1 正态分布视域下的NHST 142
5.2 t分布、F分布以及X2分布视域下的NHST 149
5.3 总结 157
第6章 ggplot2作图 161
6.1 与实验数据关联的作图知识 162
6.1.1 基础图形语法 162
6.1.2 分页 174
6.1.3 着色 185
6.1.4 图例修改 191
6.2 实验数据之外的作图知识 196
6.2.1 theme系统 197
6.2.2 坐标体系、注解和绘制函数 205
第7章 实验设计、t检验、方差分析和回归模型 211
7.1 实验研究和实验设计 211
7.1.1 描述性研究 211
7.1.2 相关研究 212
7.1.3 界定变量之间关系的研究 214
7.1.4 实验设计 216
7.1.5 拉丁方实验设计 219
7.2 t检验 222
7.2.1 单样本t检验 222
7.2.2 独立样本t检验 226
7.2.3 配对样本t检验 228
7.2.4 t检验的效应量 230
7.2.5 t检验的统计假设的前提 234
7.3 方差分析 235
7.3.1 独立测量的单向方差分析 235
7.3.2 重复测量的单向方差分析 239
7.3.3 多自变量方差分析 244
7.4 统计模型 252
7.5 总结 255
参考文献 257
前言
本书使用说明
第1章 R数据科学:数据框的操作 1
1.1 “干净、整洁”的数据框的标准 2
1.2 熟练地使用数据框操作函数 8
1.2.1 gather( )和spread( )的用法 9
1.2.2 separate( )和unite( )的用法 14
1.3 一些基础正则表达式的知识 22
1.4 数据表合并 34
1.4.1 传统的变长或变宽的表格合并 34
1.4.2 生成新变量的表格合并 40
1.4.3 不生成新变量的表格合并 46
1.4.4 集操作 50
1.5 数据框运算和操作的五个函数 53
第2章 数据框操作实例:问卷数据处理 61
2.1 案例一:汉语第三人称代词的可接受度判断实验 61
2.1.1 背景 61
2.1.2 材料 62
2.1.3 程序 63
2.1.4 数据清洁和整理 64
2.1.5 利用终数据进行描述统计 72
2.2 案例二:英语第三人称代词的可接受度判断实验 77
2.2.1 背景 77
2.2.2 材料 79
2.2.3 程序 80
2.2.4 数据清洁和整理 81
2.2.5 利用终数据进行描述统计 93
第3章 数据框操作实例:反应时行为数据处理 97
3.1 背景 98
3.1.1 被试 98
3.1.2 材料 99
3.1.3 程序 100
3.2 E-prime数据清洁和整理 100
3.3 RStudio数据清洁和整理 104
3.4 总结 118
第4章 概率分布 121
4.1 介绍 121
4.2 离散变量分布 123
4.3 连续变量分布:正态分布,t分布、F分布和X2分布 127
4.3.1 正态分布 127
4.3.2 t分布、F分布和X2分布 135
第5章 假设检验的原理 141
5.1 正态分布视域下的NHST 142
5.2 t分布、F分布以及X2分布视域下的NHST 149
5.3 总结 157
第6章 ggplot2作图 161
6.1 与实验数据关联的作图知识 162
6.1.1 基础图形语法 162
6.1.2 分页 174
6.1.3 着色 185
6.1.4 图例修改 191
6.2 实验数据之外的作图知识 196
6.2.1 theme系统 197
6.2.2 坐标体系、注解和绘制函数 205
第7章 实验设计、t检验、方差分析和回归模型 211
7.1 实验研究和实验设计 211
7.1.1 描述性研究 211
7.1.2 相关研究 212
7.1.3 界定变量之间关系的研究 214
7.1.4 实验设计 216
7.1.5 拉丁方实验设计 219
7.2 t检验 222
7.2.1 单样本t检验 222
7.2.2 独立样本t检验 226
7.2.3 配对样本t检验 228
7.2.4 t检验的效应量 230
7.2.5 t检验的统计假设的前提 234
7.3 方差分析 235
7.3.1 独立测量的单向方差分析 235
7.3.2 重复测量的单向方差分析 239
7.3.3 多自变量方差分析 244
7.4 统计模型 252
7.5 总结 255
参考文献 257
评论
还没有评论。