描述
开 本: 16开包 装: 平装胶订国际标准书号ISBN: 9787030599551
编辑推荐
语料库,翻译学,研究
内容简介
近年来,语言变体研究受到了计算语言学界的广泛关注。《语言变体语料库构建及计算模型》从人工智能技术和语言变体相结合的视角,结合自然语言处理、机器学习、神经网络、语音识别、语料库语言学等相关技术,以作者的一系列研究成果为内容主线,系统介绍语言变体(相似语言)研究的语料库构建及计算模型。《语言变体语料库构建及计算模型》共9章,探索了相似语言及变体语料库的构建规范、多模态(语音和文本)语料库的标注、语言变体文字和语音处理的计算模型。《语言变体语料库构建及计算模型》对相似语言及语言变体中的关键技术进行较为深入的研究,提出相关问题的一些解决方法,并设计相应的算法和实验。实验表明,《语言变体语料库构建及计算模型》提出的这些方法有助于提高相似语言的分析性能,同时减少对大规模语料库的依赖性,为今后的相似语言变体分析研究奠定了重要基础,为同类研究提供了参考。
目 录
目录
第1章 相似语言及变体研究概述 1
1.1 相似语言及变体相关概念 1
1.2 相似语言及变体研究综述 2
1.2.1 语料库资源建设 2
1.2.2 计算模型 4
1.2.3 评测指标 6
1.3 本章小结 7
参考文献 7
第2章 相关技术 10
2.1 传统技术 10
2.1.1 支持向量机 10
2.1.2 统计语言模型 12
2.1.3 互信息 12
2.1.4 相似度计算 13
2.1.5 隐马尔可夫模型 15
2.2 **深度学习技术 16
2.2.1 词向量 16
2.2.2 神经网络语言模型 17
2.2.3 word2vec模型 18
2.2.4 多层感知机 19
2.2.5 循环神经网络 20
2.2.6 卷积神经网络 21
2.3 本章小结 22
参考文献 22
第3章 海峡两岸及香港地区三元组和词对齐语料库构建 24
3.1 语言变体 24
3.2 词对齐定义 27
3.3 三元组和词对齐语料库 28
3.3.1 处理框架 28
3.3.2 标注规范 29
3.3.3 三元组语料 30
3.3.4 词对齐语料 32
3.4 本章小结 34
参考文献 35
第4章 海峡两岸及香港地区词对齐抽取计算模型 37
4.1 相关工作 37
4.2 基于word2vec的两阶段词对齐抽取模型 38
4.2.1 阶段1模型 38
4.2.2 阶段2模型 40
4.3 基于词映射规则的词对齐抽取模型 40
4.3.1 词对齐算法 41
4.3.2 词映射规则后处理 41
4.4 实验设置及结果分析 43
4.4.1 实验设置 43
4.4.2 评测指标 43
4.4.3 实验结果分析 43
4.5 本章小结 49
参考文献 50
第5章 句子级中国、新加坡、马来西亚语言类型识别计算模型 52
5.1 相关工作 52
5.2 语言类型识别模型 53
5.2.1 特征抽取 53
5.2.2 分类器构建 56
5.3 实验设置及结果分析 57
5.3.1 实验设置 57
5.3.2 实验结果分析 58
5.4 本章小结 61
参考文献 61
第6章 多模态赣方言篇章平行语料库构建 63
6.1 赣方言概述 63
6.2 多模态赣方言篇章平行语料库构建 65
6.2.1 标注规范 66
6.2.2 标注过程 67
6.2.3 篇章级赣方言平行语料库标注实例 67
6.2.4 语料统计及标注质量 68
6.3 本章小结 69
参考文献 69
第7章 句子级赣方言语言类型文本识别计算模型 71
7.1 基于特征抽取的赣方言识别模型 71
7.1.1 特征抽取 71
7.1.2 分类器构建 71
7.2 基于深度学习的赣方言识别模型 71
7.3 实验设置及结果分析 72
7.3.1 实验设置 72
7.3.2 实验结果分析 73
7.4 本章小结 78
参考文献 78
第8章 赣方言语音识别计算模型 80
8.1 语音识别简介 80
8.1.1 语音识别框架 80
8.1.2 国内外研究现状 83
8.2 基Kaldi的赣方言语音识别 86
8.2.1 Kaldi简介 86
8.2.2 赣方言语音识别模型 86
8.3 实验设置及结果分析 88
8.3.1 实验设置 88
8.3.2 评测指标 89
8.3.3 实验结果分析 89
8.4 本章小结 90
参考文献 90
第9章 听音识人——端到端赣方言点识别计算模型及平台 92
9.1 基于语音识别的赣方言点识别基准模型 92
9.1.1 模型框架 92
9.1.2 基准模型实验设置 93
9.1.3 基准模型实验结果分析 94
9.2 语音驱动的赣方言识别模型 95
9.2.1 基于语音特征的模型框架 95
9.2.2 混合模型 96
9.3 实验设置及结果分析 96
9.3.1 实验设置 96
9.3.2 实验结果分析 96
9.4 听音识人——赣方言智能处理平台 100
9.4.1 PC型界面 100
9.4.2 移动型界面 102
9.5 本章小结 102
附录 计算机自动抽取的海峡两岸及香港地区三元组 105
第1章 相似语言及变体研究概述 1
1.1 相似语言及变体相关概念 1
1.2 相似语言及变体研究综述 2
1.2.1 语料库资源建设 2
1.2.2 计算模型 4
1.2.3 评测指标 6
1.3 本章小结 7
参考文献 7
第2章 相关技术 10
2.1 传统技术 10
2.1.1 支持向量机 10
2.1.2 统计语言模型 12
2.1.3 互信息 12
2.1.4 相似度计算 13
2.1.5 隐马尔可夫模型 15
2.2 **深度学习技术 16
2.2.1 词向量 16
2.2.2 神经网络语言模型 17
2.2.3 word2vec模型 18
2.2.4 多层感知机 19
2.2.5 循环神经网络 20
2.2.6 卷积神经网络 21
2.3 本章小结 22
参考文献 22
第3章 海峡两岸及香港地区三元组和词对齐语料库构建 24
3.1 语言变体 24
3.2 词对齐定义 27
3.3 三元组和词对齐语料库 28
3.3.1 处理框架 28
3.3.2 标注规范 29
3.3.3 三元组语料 30
3.3.4 词对齐语料 32
3.4 本章小结 34
参考文献 35
第4章 海峡两岸及香港地区词对齐抽取计算模型 37
4.1 相关工作 37
4.2 基于word2vec的两阶段词对齐抽取模型 38
4.2.1 阶段1模型 38
4.2.2 阶段2模型 40
4.3 基于词映射规则的词对齐抽取模型 40
4.3.1 词对齐算法 41
4.3.2 词映射规则后处理 41
4.4 实验设置及结果分析 43
4.4.1 实验设置 43
4.4.2 评测指标 43
4.4.3 实验结果分析 43
4.5 本章小结 49
参考文献 50
第5章 句子级中国、新加坡、马来西亚语言类型识别计算模型 52
5.1 相关工作 52
5.2 语言类型识别模型 53
5.2.1 特征抽取 53
5.2.2 分类器构建 56
5.3 实验设置及结果分析 57
5.3.1 实验设置 57
5.3.2 实验结果分析 58
5.4 本章小结 61
参考文献 61
第6章 多模态赣方言篇章平行语料库构建 63
6.1 赣方言概述 63
6.2 多模态赣方言篇章平行语料库构建 65
6.2.1 标注规范 66
6.2.2 标注过程 67
6.2.3 篇章级赣方言平行语料库标注实例 67
6.2.4 语料统计及标注质量 68
6.3 本章小结 69
参考文献 69
第7章 句子级赣方言语言类型文本识别计算模型 71
7.1 基于特征抽取的赣方言识别模型 71
7.1.1 特征抽取 71
7.1.2 分类器构建 71
7.2 基于深度学习的赣方言识别模型 71
7.3 实验设置及结果分析 72
7.3.1 实验设置 72
7.3.2 实验结果分析 73
7.4 本章小结 78
参考文献 78
第8章 赣方言语音识别计算模型 80
8.1 语音识别简介 80
8.1.1 语音识别框架 80
8.1.2 国内外研究现状 83
8.2 基Kaldi的赣方言语音识别 86
8.2.1 Kaldi简介 86
8.2.2 赣方言语音识别模型 86
8.3 实验设置及结果分析 88
8.3.1 实验设置 88
8.3.2 评测指标 89
8.3.3 实验结果分析 89
8.4 本章小结 90
参考文献 90
第9章 听音识人——端到端赣方言点识别计算模型及平台 92
9.1 基于语音识别的赣方言点识别基准模型 92
9.1.1 模型框架 92
9.1.2 基准模型实验设置 93
9.1.3 基准模型实验结果分析 94
9.2 语音驱动的赣方言识别模型 95
9.2.1 基于语音特征的模型框架 95
9.2.2 混合模型 96
9.3 实验设置及结果分析 96
9.3.1 实验设置 96
9.3.2 实验结果分析 96
9.4 听音识人——赣方言智能处理平台 100
9.4.1 PC型界面 100
9.4.2 移动型界面 102
9.5 本章小结 102
附录 计算机自动抽取的海峡两岸及香港地区三元组 105
评论
还没有评论。