描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787560098449
内容简介
购买新版:
问题驱动:问题是一切研究的开始。本书不是一本语料库技术说明书,各章节都围绕具体的研究问题和目的展开。方法、工具、步骤及技术应用,都是为了回答研究问题、达到研究目的服务的,不能为了使用语料库而使用语料库。
基于实例:本书使用的案例都来自真实的研究实践,其中一些选自作者已正式发表的论文,一些则是作者正在思考和探索的话题。我们鼓励读者参与我们的探索,并与我们分享思路,开展自己的研究。当然,我们不能保证书中每个思路都能带来有价值的发现,
往重操作:本书不仅仅是用来“读”的,更重要的是用来“做”的。*好的做法是,根据本书具体章节中呈现的方法和步骤,真正动手操作。本书所附光盘提供了所有需要的资源,用来练习是足够了。
模块化设计:尽管本书在结构上各章节循序渐进、由易人难、相互参照,但其主要内容仍然为相互独立的模块。比如不需要建库的读者可以跳过相关内容,直接阅读索引分析或主题词分析章节。但在个别情况下,考虑到内容表述的连贯性与模块的完整性,部分技术环节在相应章节有所重述。
目 录
第一部分 语料库i吾言学基本知识与语嗣库基本操作
第一章 语料库语言学基本知识
1.1 语料库语言学基本概念
1.1.1 语料库和语料库语言学
1.1.2 语料库的主要类型
1.1.3 文本
1.1.4 标注
1.1.5 词、形符、类符、类符/形符比
1.1.6 概率和频率
1.1.7 索引、索引工具和索引行
1.1.8 搭配与类联接
1.1.9 多词序列
1.1.10 语义韵
1.1.11 正则表达式
1.2 语料库应用的基本要素及步骤
1.2.1 语料库应用的基本要素
1.2.2 语料库应用的三个主要阶段
第二章 文本采集与加工
2.1 文本采集
2.1.1 创建自己的语料库
2.1.2 使用现有的语料库
2.2 文本整理
2.2.1 清洁文本与问题文本
2.2.2 单个文本的整理
2.2.3 多个文本的批量整理
2.3 元信息标注
2.3.1 元信息的构成
2.3.2 标注语言
2.4 分词、词形还原与词性赋码
2.4.1 分词
2.4.2 词形还原
2.4.3 词性赋码
第三章 语料库基本技术
3.1 语料库检索
3.1.1 简单检索
3.1.2 复杂检索
3.1.3 PatternBui Ider与PatCoLJrit
3.1.4 语料库检索中需要注意的几个问题
3.2 索引行分析基本步骤
3.2.1 索引行抽样
3.2.2 索引行分析步骤
3.3 词表及其生成
3.3.1 词表
3.3.2 词表的生成
3.3.3 词簇表
3.3.4 词簇表的生成
3.4 主题词表及其生成
3.4.1 基本准备
3.4.2 基本操作
3.5 语料库常用统计方法
3.5.1 语料库与统计方法
3.5.2 频数标
3.5.3 频数差异检验
3.5.4 搭配强度计算
第二部分 语料库在外语教学和外语学习巾的应用
第四章 语料库与外语教学:理论与方法
4.1 分词、词形还原与词性赋码
4.1.1 分词
4.1.2 词形还原
4.1.3 词性赋码
第五章 语料库基本技术
5.1 语料库检索
5.1.1 简单检索
5.1.2 复杂检索
5.1.3 PatternBui Ider与PatCoLJrit
5.1.4 语料库检索中需要注意的几个问题
5.2 索引行分析基本步骤
5.2.1 索引行抽样
5.2.2 索引行分析步骤
5.3 词表及其生
5.3.1 词表
5.3.2 词表的生成
5.3.3 词簇表
5.3.4 词簇表的生成
5.4 主题词表及其生成
5.4.1 基本准
5.4.2 基本操作
5.5 语料库常用统计方法
5.5.1 语料库与统计方法
5.5.2 频数标准化
5.5.3 频数差异检验
……
第三部分 语料库与外语研究
参考文献
附录一 CLAWS赋码集
附录二 TreeTagger 赋码集
附录三 语料库语言学常用术语汇编
附录四 常用语料库
第一章 语料库语言学基本知识
1.1 语料库语言学基本概念
1.1.1 语料库和语料库语言学
1.1.2 语料库的主要类型
1.1.3 文本
1.1.4 标注
1.1.5 词、形符、类符、类符/形符比
1.1.6 概率和频率
1.1.7 索引、索引工具和索引行
1.1.8 搭配与类联接
1.1.9 多词序列
1.1.10 语义韵
1.1.11 正则表达式
1.2 语料库应用的基本要素及步骤
1.2.1 语料库应用的基本要素
1.2.2 语料库应用的三个主要阶段
第二章 文本采集与加工
2.1 文本采集
2.1.1 创建自己的语料库
2.1.2 使用现有的语料库
2.2 文本整理
2.2.1 清洁文本与问题文本
2.2.2 单个文本的整理
2.2.3 多个文本的批量整理
2.3 元信息标注
2.3.1 元信息的构成
2.3.2 标注语言
2.4 分词、词形还原与词性赋码
2.4.1 分词
2.4.2 词形还原
2.4.3 词性赋码
第三章 语料库基本技术
3.1 语料库检索
3.1.1 简单检索
3.1.2 复杂检索
3.1.3 PatternBui Ider与PatCoLJrit
3.1.4 语料库检索中需要注意的几个问题
3.2 索引行分析基本步骤
3.2.1 索引行抽样
3.2.2 索引行分析步骤
3.3 词表及其生成
3.3.1 词表
3.3.2 词表的生成
3.3.3 词簇表
3.3.4 词簇表的生成
3.4 主题词表及其生成
3.4.1 基本准备
3.4.2 基本操作
3.5 语料库常用统计方法
3.5.1 语料库与统计方法
3.5.2 频数标
3.5.3 频数差异检验
3.5.4 搭配强度计算
第二部分 语料库在外语教学和外语学习巾的应用
第四章 语料库与外语教学:理论与方法
4.1 分词、词形还原与词性赋码
4.1.1 分词
4.1.2 词形还原
4.1.3 词性赋码
第五章 语料库基本技术
5.1 语料库检索
5.1.1 简单检索
5.1.2 复杂检索
5.1.3 PatternBui Ider与PatCoLJrit
5.1.4 语料库检索中需要注意的几个问题
5.2 索引行分析基本步骤
5.2.1 索引行抽样
5.2.2 索引行分析步骤
5.3 词表及其生
5.3.1 词表
5.3.2 词表的生成
5.3.3 词簇表
5.3.4 词簇表的生成
5.4 主题词表及其生成
5.4.1 基本准
5.4.2 基本操作
5.5 语料库常用统计方法
5.5.1 语料库与统计方法
5.5.2 频数标准化
5.5.3 频数差异检验
……
第三部分 语料库与外语研究
参考文献
附录一 CLAWS赋码集
附录二 TreeTagger 赋码集
附录三 语料库语言学常用术语汇编
附录四 常用语料库
评论
还没有评论。