描述
开 本: 16开包 装: 平装是否套装: 否国际标准书号ISBN: 9787030445582
编辑推荐
《现代汉语框架语义网》可供人工智能、自然语言理解、机器翻译、情报学、语言学等相关专业的科研人员和技术开发人员学习、参考。
内容简介
《现代汉语框架语义网》面向自然语言理解的需要,以框架语义理论为基础,从资源建设、自动标注到应用技术,对汉语框架语义网的相关工作进行探索和实践。介绍汉语框架语义资源建设工作,包括框架语义理论、框架语义词典和语料库的构建以及该知识库的语义Web语言表示体系等;通过大量语料分析和统计,分析汉语语言的规则形式和特点;展示汉语框架语义网本体表示、推理、集成及其应用方面的研究工作;包含汉语词元识别模块、未知框架检测模块、框架消歧模块和语义角色标注模块等技术内容。
目 录
目录
前言
第1章 框架语义学及汉语框架语义网1
1.1 框架语义学简介1
1.1.1 基于框架的语义理解1
1.1.2 框架元素的句法实现方式4
1.1.3 框架语义学和其他语义学的关系7
1.2 框架语义网8
1.2.1 框架语义网概述8
1.2.2 FrameNet的内容11
1.2.3 FrameNet的特色16
1.2.4 FrameNet的应用价值17
1.3 汉语框架语义网构建路线17
1.3.1 自底向上的构建路线17
1.3.2 语料库建设19
参考文献19
第2章 汉语框架语义网框架库的构建21
2.1 认知领域框架21
2.1.1 认知领域的界定及词语采集21
2.1.2 汉语认知领域框架示例22
2.1.3 认知领域框架-框架关系32
2.1.4 认知领域框架解析34
2.1.5 认知领域框架元素解析36
2.2 位移领域框架举例38
2.3 名物类框架举例40
2.4 修饰性框架举例42
参考文献43
第3章 汉语框架语义网例句标注规范44
3.1 标注范围44
3.1.1 目标词tgt和框架元素标注44
3.1.2 几类不用标注的情况47
3.2 支撑词标注48
3.2.1 标注范围48
3.2.2 动词目标词的支撑词48
3.2.3 名词目标词的支撑词50
3.2.4 形容词目标词的支撑词50
3.2.5 支撑词标记标注时应注意的问题51
3.3 透明成分标记51
3.4 框架元素的几种特殊标记52
3.4.1 零形式框架元素52
3.4.2 框架元素融合53
3.4.3 框架元素分裂53
3.5 句法功能标注体系53
3.5.1 主语的标注规则55
3.5.2 宾语的标注规则56
3.5.3 外部论元的分析与标注规则57
3.5.4 定语的标注规则59
3.5.5 状语的标注规则59
3.5.6 补语的标注规则59
3.5.7 中心语的标注规则60
3.5.8 兼语与兼语补语的标注规则60
3.5.9 连谓结构的标注规则60
3.5.10 插入语和被插入语的标注规则62
参考文献63
第4章 汉语框架语义网词元库的构建64
4.1 汉语框架语义网的词元64
4.1.1 名词词元64
4.1.2 动词词元65
4.1.3 形容词词元68
4.2 多义词与框架的对应关系68
4.3 词元的标注报告72
第5章 汉语阅读理解系统的构建79
5.1 阅读理解系统研究现状79
5.2 语料库的主题分类与指称指代标注80
5.2.1 文章的筛选80
5.2.2 文献的主题分类标引81
5.2.3 指称指代关系标注82
5.3 目标词的确定和框架语义标注83
5.3.1 目标词的确定83
5.3.2 框架语义标注84
5.3.3 目标词和指称指代关系标注举例85
5.4 编写篇章问句和标注问句答案87
5.5 知识获取和知识库构建方法90
5.5.1 阅读理解技术对语料库的需求分析90
5.5.2 篇章标注91
5.5.3 语义知识库的构建91
5.6 阅读理解任务评测机制93
参考文献95
第6章 汉语短语结构分析及实例库96
6.1 复杂特征集与功能合一语法96
6.2 短语结构规则形式分析与表达97
6.2.1 短语结构规则的组成97
6.2.2 短语结构规则的整体性质98
6.2.3 短语规则的约束条件100
6.2.4 短语规则的各项属性汇总100
6.2.5 短语规则实例解析101
6.2.6 短语结构规则统计分析103
6.3 短语组合模式与实例库106
6.3.1 np短语组合模式107
6.3.2 vp短语组合模式109
6.3.3 ap短语组合模式112
6.3.4 mp短语组合模式114
6.3.5 pp短语组合模式115
6.3.6 sp短语组合模式116
6.3.7 tp短语组合模式117
6.3.8 dp短语组合模式118
参考文献119
第7章 汉语句法分析及实例库120
7.1 事件描述单元120
7.1.1 事件描述单元的定义和特征120
7.1.2 事件描述单元的句法结构统计121
7.2 单句型短语的组合模式及实例库124
7.2.1 由体词性成分做谓语124
7.2.2 由形容词性成分做谓语125
7.2.3 由动词性成分做谓语126
7.2.4 由单句型短语做谓语127
7.3 单句的组合模式及实例库128
7.4 复句型短语的组合模式及实例库129
7.5 语料库中复句的统计与分析132
7.5.1 语料库中复句的统计132
7.5.2 复句关系举例133
7.6 语料库中出现的几类句法类型及其标注135
7.6.1 整句135
7.6.2 直接引语136
7.6.3 独立成分136
7.6.4 句群136
参考文献137
第8章 汉语框架语义网本体和语义网标记语言138
8.1 本体138
8.1.1 本体定义及其要素138
8.1.2 本体的类型139
8.1.3 语言学本体141
8.1.4 领域本体的作用141
8.1.5 构建本体的准则142
8.2 语义Web标记语言142
8.2.1 语义Web标记语言概述142
8.2.2 可扩展标记语言144
8.2.3 资源描述框架语言147
8.2.4 语义网描述语言OWL153
8.3 汉语框架语义网本体语义Web表示方法159
8.3.1 框架库语义Web表示159
8.3.2 词元库的语义Web表示161
8.3.3 句子库的语义Web表示162
8.4 本体开发环境与工具162
8.4.1 Java语言162
8.4.2 Jena工具包165
8.4.3 JavaScript脚本语言166
8.4.4 本体构建工具Protégé167
参考文献168
第9章 旅游领域本体语言查询技术169
9.1 旅游领域本体知识库的构建169
9.1.1 基于《中国分类主题词表》的旅游领域知识描述169
9.1.2 旅游语料收集171
9.1.3 山西旅游本体库构建172
9.2 中文问句的句法与语义分析176
9.2.1 问句的句法分析176
9.2.2 问句的语义解析和语义扩展179
9.3 中文问答系统答案库构建182
9.3.1 问句与答案句的内在联系182
9.3.2 句式转换184
9.4 中文问答句形式化描述185
9.4.1 语义网查询语言(OWL-QL)185
9.4.2 中文问答句形式化描述举例187
9.5 复杂问题分解的本体汉语框架语义网189
9.6 基于本体的语义网检索模型191
9.6.1 基于语义网的语义检索模型191
9.6.2 模型实现的关键技术194
参考文献197
第10章 汉语框架语义网自动识别技术199
10.1 汉语框架语义分析模型199
10.2 目标词识别技术202
10.2.1 未登录目标词识别流程202
10.2.2 未登录目标词识别理论依据203
10.2.3 **熵模型特征模板设计204
10.2.4 实验结果与分析206
10.3 汉语框架歧义消解209
10.3.1 框架歧义消解研究现状209
10.3.2 **熵模型在框架识别中的应用210
10.3.3 汉语框架消歧模型的实验211
10.3.4 实验结果与分析213
10.4 汉语的语义角色自动标注216
10.4.1 汉语的语义角色自动标注现状216
10.4.2 汉语框架语义角色标注任务描述217
10.4.3 条件随机场模型标注218
10.4.4 实验语料处理方案222
10.5 汉语框架语义依存图分析226
参考文献228
附录1 汉语框架语义网框架汇总表231
附录2 通用非核心框架元素241
附录3 语料库汉语词类标记集244
索引247
后记251
前言
第1章 框架语义学及汉语框架语义网1
1.1 框架语义学简介1
1.1.1 基于框架的语义理解1
1.1.2 框架元素的句法实现方式4
1.1.3 框架语义学和其他语义学的关系7
1.2 框架语义网8
1.2.1 框架语义网概述8
1.2.2 FrameNet的内容11
1.2.3 FrameNet的特色16
1.2.4 FrameNet的应用价值17
1.3 汉语框架语义网构建路线17
1.3.1 自底向上的构建路线17
1.3.2 语料库建设19
参考文献19
第2章 汉语框架语义网框架库的构建21
2.1 认知领域框架21
2.1.1 认知领域的界定及词语采集21
2.1.2 汉语认知领域框架示例22
2.1.3 认知领域框架-框架关系32
2.1.4 认知领域框架解析34
2.1.5 认知领域框架元素解析36
2.2 位移领域框架举例38
2.3 名物类框架举例40
2.4 修饰性框架举例42
参考文献43
第3章 汉语框架语义网例句标注规范44
3.1 标注范围44
3.1.1 目标词tgt和框架元素标注44
3.1.2 几类不用标注的情况47
3.2 支撑词标注48
3.2.1 标注范围48
3.2.2 动词目标词的支撑词48
3.2.3 名词目标词的支撑词50
3.2.4 形容词目标词的支撑词50
3.2.5 支撑词标记标注时应注意的问题51
3.3 透明成分标记51
3.4 框架元素的几种特殊标记52
3.4.1 零形式框架元素52
3.4.2 框架元素融合53
3.4.3 框架元素分裂53
3.5 句法功能标注体系53
3.5.1 主语的标注规则55
3.5.2 宾语的标注规则56
3.5.3 外部论元的分析与标注规则57
3.5.4 定语的标注规则59
3.5.5 状语的标注规则59
3.5.6 补语的标注规则59
3.5.7 中心语的标注规则60
3.5.8 兼语与兼语补语的标注规则60
3.5.9 连谓结构的标注规则60
3.5.10 插入语和被插入语的标注规则62
参考文献63
第4章 汉语框架语义网词元库的构建64
4.1 汉语框架语义网的词元64
4.1.1 名词词元64
4.1.2 动词词元65
4.1.3 形容词词元68
4.2 多义词与框架的对应关系68
4.3 词元的标注报告72
第5章 汉语阅读理解系统的构建79
5.1 阅读理解系统研究现状79
5.2 语料库的主题分类与指称指代标注80
5.2.1 文章的筛选80
5.2.2 文献的主题分类标引81
5.2.3 指称指代关系标注82
5.3 目标词的确定和框架语义标注83
5.3.1 目标词的确定83
5.3.2 框架语义标注84
5.3.3 目标词和指称指代关系标注举例85
5.4 编写篇章问句和标注问句答案87
5.5 知识获取和知识库构建方法90
5.5.1 阅读理解技术对语料库的需求分析90
5.5.2 篇章标注91
5.5.3 语义知识库的构建91
5.6 阅读理解任务评测机制93
参考文献95
第6章 汉语短语结构分析及实例库96
6.1 复杂特征集与功能合一语法96
6.2 短语结构规则形式分析与表达97
6.2.1 短语结构规则的组成97
6.2.2 短语结构规则的整体性质98
6.2.3 短语规则的约束条件100
6.2.4 短语规则的各项属性汇总100
6.2.5 短语规则实例解析101
6.2.6 短语结构规则统计分析103
6.3 短语组合模式与实例库106
6.3.1 np短语组合模式107
6.3.2 vp短语组合模式109
6.3.3 ap短语组合模式112
6.3.4 mp短语组合模式114
6.3.5 pp短语组合模式115
6.3.6 sp短语组合模式116
6.3.7 tp短语组合模式117
6.3.8 dp短语组合模式118
参考文献119
第7章 汉语句法分析及实例库120
7.1 事件描述单元120
7.1.1 事件描述单元的定义和特征120
7.1.2 事件描述单元的句法结构统计121
7.2 单句型短语的组合模式及实例库124
7.2.1 由体词性成分做谓语124
7.2.2 由形容词性成分做谓语125
7.2.3 由动词性成分做谓语126
7.2.4 由单句型短语做谓语127
7.3 单句的组合模式及实例库128
7.4 复句型短语的组合模式及实例库129
7.5 语料库中复句的统计与分析132
7.5.1 语料库中复句的统计132
7.5.2 复句关系举例133
7.6 语料库中出现的几类句法类型及其标注135
7.6.1 整句135
7.6.2 直接引语136
7.6.3 独立成分136
7.6.4 句群136
参考文献137
第8章 汉语框架语义网本体和语义网标记语言138
8.1 本体138
8.1.1 本体定义及其要素138
8.1.2 本体的类型139
8.1.3 语言学本体141
8.1.4 领域本体的作用141
8.1.5 构建本体的准则142
8.2 语义Web标记语言142
8.2.1 语义Web标记语言概述142
8.2.2 可扩展标记语言144
8.2.3 资源描述框架语言147
8.2.4 语义网描述语言OWL153
8.3 汉语框架语义网本体语义Web表示方法159
8.3.1 框架库语义Web表示159
8.3.2 词元库的语义Web表示161
8.3.3 句子库的语义Web表示162
8.4 本体开发环境与工具162
8.4.1 Java语言162
8.4.2 Jena工具包165
8.4.3 JavaScript脚本语言166
8.4.4 本体构建工具Protégé167
参考文献168
第9章 旅游领域本体语言查询技术169
9.1 旅游领域本体知识库的构建169
9.1.1 基于《中国分类主题词表》的旅游领域知识描述169
9.1.2 旅游语料收集171
9.1.3 山西旅游本体库构建172
9.2 中文问句的句法与语义分析176
9.2.1 问句的句法分析176
9.2.2 问句的语义解析和语义扩展179
9.3 中文问答系统答案库构建182
9.3.1 问句与答案句的内在联系182
9.3.2 句式转换184
9.4 中文问答句形式化描述185
9.4.1 语义网查询语言(OWL-QL)185
9.4.2 中文问答句形式化描述举例187
9.5 复杂问题分解的本体汉语框架语义网189
9.6 基于本体的语义网检索模型191
9.6.1 基于语义网的语义检索模型191
9.6.2 模型实现的关键技术194
参考文献197
第10章 汉语框架语义网自动识别技术199
10.1 汉语框架语义分析模型199
10.2 目标词识别技术202
10.2.1 未登录目标词识别流程202
10.2.2 未登录目标词识别理论依据203
10.2.3 **熵模型特征模板设计204
10.2.4 实验结果与分析206
10.3 汉语框架歧义消解209
10.3.1 框架歧义消解研究现状209
10.3.2 **熵模型在框架识别中的应用210
10.3.3 汉语框架消歧模型的实验211
10.3.4 实验结果与分析213
10.4 汉语的语义角色自动标注216
10.4.1 汉语的语义角色自动标注现状216
10.4.2 汉语框架语义角色标注任务描述217
10.4.3 条件随机场模型标注218
10.4.4 实验语料处理方案222
10.5 汉语框架语义依存图分析226
参考文献228
附录1 汉语框架语义网框架汇总表231
附录2 通用非核心框架元素241
附录3 语料库汉语词类标记集244
索引247
后记251
前 言
媒体评论
在线试读
第1章 框架语义学及汉语框架语义网
1.1 框架语义学简介
框架语义学(frame semantics)[1-4]是由美国语言学家菲尔墨(Fillmore)提出的研究词语意义和句法结构意义的一种理论方法,即试图用经验主义方法,寻找语言和人类经验之间的紧密关系,并研究一种可行的描述方式,表示语言和经验之间的关系。词语代表了经验的分类(范畴化),范畴中的每一个词语背后都有一定的基于知识和经验的激活性情境,框架语义学试图理解一个言语社团为何会创建一个范畴并以词语来表达它;同时通过对背景动因进行描述,来解释这个词语的意义。该理论出自经验主义语义学传统,而不是形式语义学,它和形式语义学的差别主要在于,前者强调语言与经验之间的连续性(continuity),而后者是非连续的。但它与形式主义又并不矛盾,Fillmore表示,框架语义学应该说是“先于形式化的(pre-formal)”,而不是“非形式化的(non-formalist)”。
1.1.1 基于框架的语义理解
框架语义学把词义、句子意义和文本意义统一用框架(frame)进行描述,框架是和一些激活性语境(motivating context)相一致的一个结构化的范畴系统,是存储在人类经验中的图式化情境(scenario),这种范畴系统所描述的既可能是一个实体,也可能是一种行为实践模式,甚至是一些社会制度、习俗等。Fillmore使用框架这个术语来涵盖以往讨论自然语言理解问题的文献中提过的一系列概念,如场景(scene)、图式(schema)、脚本(******)、情境、观念框架(ideational scaffolding)、认知模式(cognitive model)、民俗理论(folk theory)等,但是这些术语属于人类认知或经验范畴,框架则是语言学术语,一个框架虽然表示的是一个认知结构,但它的意义在于这个认知结构的各个部分是和词语挂钩的,为语言理解服务。
Fillmore用场景、透视域(perspective)等概念来阐释其框架语义分析系统。场景指语言之外的真实世界,如物、事件、状态、行为、变化和人们对真实世界的记忆、感觉、知觉等。场景可以是视觉形象,也可以是任何一个独立的知觉、记忆、经历、行动或物体等。句子描述的是场景,语言中的一个词、短语、句子都是对场景的描述。场景中的各参与者承担各角色,通过透视域的选择,一部分参与者进入透视域,成为核心成分,其他参与者不一定能进入句子,即使出现在句子中,也只能成为句子的外围成分。
语义联系着场景,但是场景并不等于语义,每一个句子或者每一段话语,都有一个特定的透视域,从这个特定的视角去考虑一个场景,当整个场景都在考虑之中时,人们一般也只是注意场景的某一部分,因此,透视域在框架语义学中是个比较重要的概念,下面的论述经常会涉及,所以首先介绍这个概念,例句如下:
Carla bought the computer from Sally for $100.
(Carla以100美元从Sally那里买了电脑。)
尽管这句话提及了买者(Carla)、卖者(Sally)、钱($100)和商品(the computer),但是表达的时候基本上还是站在买者的视角上进行的。同样:
Sally sold the computer to Carla for $100.
(Sally以100美元卖给Carla电脑。)
这句则是从卖者的视角进行表达的。下面可以看包含buy和sell的另外两个句子:
I bought this thing[in order to test it out].
([为了检验一下],我把那个东西买了下来。)
At least you are selling them[in order to give the money to cancer research].
(至少你是[为了筹钱做癌症研究]才卖了它们。)
**句所表达的目的是和买者有关的,而第二句的目的是和卖者有关的,可见,理解buy和sell两个词语所支撑的句子,虽然都需要在整个商品交易这个大背景下,但是视角是不同的。
文本中的所有语言成分都可以激活框架,理解一个文本,就是搜索或感知文本内容所激活的框架,并对它们进行综合的过程。先来看Fillmore[3]列举的几个以实体、社会制度或风俗为框架的词语的理解过程,*后再看它们是如何综合的。
(1)decedent(死者)。理解该词语不能仅理解为“死去的人”,也不能限于一般的法律或新闻语境,而是要将视角置于法律子领域遗产法中去理解。一般的法律语境的死者可以用the deceased(死者)来表达,而decedent用在讨论一个死者的遗产时。
(2)land(陆地)。和ground(地面)相比,land用来指“陆地”,与sea(海洋)相对;ground用来指“地面”,与air(空中)相对。因此,如果描写某人on land(在岸上),就是将视角定位于一个航海事件中,只有在海上行驶过程中,才会这样描述某人所在的位置。
(3)mufti(便衣)。mufti是指军队中通常穿制服的人穿的普通衣服,如果看到一个军官和一个普通百姓穿同样的衣服,不会说那个百姓in mufti(穿便衣),这个词语只能用来描述那个军官,mufti显然是限于和军队有关的语境的。
(4)weekend(周末)。理解这个词语需要以一定的社会制度和实践经验为背景,即日历七天为一周,一周内有五天连续时间是公众工作时间,而有连续两天是私人生活时间。如果只有一个休息日,可能不需要weekend这个词,因为人们可以简单地使用表示那一天的名词(如Sunday(星期天))来指称它。如果人们三天工作,四天休息,似乎也不可能用这个名称来表达人们用来过私人生活的这段时间。
(5)breakfast(早餐)。这也是一个以社会制度和实践经验为背景的词语,理解这个词,就是要理解三方面内容:①人们的文化生活中的一个行为(实践活动),即一日三餐;②早餐是在睡完一觉之后的一天中较早的时候进行的;③它有独特的菜单(这视民族的不同而有许多细节差异)。关于breakfast,*有趣的是,这三个条件中的任何一个都可以单独缺席,仍然允许说话者使用这个词,这就涉及“原型(prototype)”的概念,一个人可以工作一个通宵,然后在日出时吃几个鸡蛋、烤面包片,喝咖啡、橘子汁,并把这些称为breakfast,显然,“睡觉后”这个范畴特征不是强制性标准;一个人也可以从早晨开始睡,到下午三点起床,起来吃鸡蛋、烤面包片,喝咖啡和橘子汁,也可以把这称为breakfast,显然,“早晨”这个范畴特征也不是一个强制性标准;一个人还可以晚上睡觉,早晨起床,喝点卷心菜汤,吃点巧克力派,作为breakfast,显然,“早餐菜单”也不是一个强制性标准。当观察这些现象时,不是没有抓住这个词语意义的核心,而是词语给了人们一个范畴,该范畴可以用在很多不同的语境中,这些语境由一个典型用法的多方面来决定,其用法或多或少和定义的原型相匹配,但不一定完全匹配。
(6)flip strength(狂热强度)。理解这个词组,需要有特殊的背景,即色情文学。一些色情小说出版商用这个词组告诉作者,每一页中都要包含一定数量的高“性”趣词,这样,一个潜在的顾客在书店中翻flip书时,不管他从哪里翻开,都会发现这本书中充满了令他兴奋的东西。一本书中,如果每页淫秽词语的比例都比较高,那么它有比较高的flip strength,反之则flip strength比较低。
以上分别用单个的词或词组,解释了背景框架的知识。文本中的词汇在理解者大脑中会唤起如上认知框架,认知框架提供理解期待,带来角色、目的、事件类型的自然的和惯例性的结果,理解者把这些通过这种预期的抽象结构知识加以综合,得以正确理解语言。Fillmore自造了一个句子(Fillmore称“这个自造的句子多少有些可笑的意味”),说明人们是如何理解语言的:
The decedent while on land and in mufti last weekend ate a typical breakfast and read a novel high in flip strength.
(死者于上周末在陆地上,穿着便衣,吃了顿普通的早晨,读了一本狂热度高的小说。)
通过以上背景知识,理解者就可以知道这是在谈论一个已经死亡的海军公务人员,他在上周六到周日这段时间读了一本色情小说,理解者还知道关于他的其他一些事情,如他是如何打发时间的等。这个句子并没有直接给人们这些信息,必须通过对以上背景框架进行综合,才能真正理解其意义。
1.1.2 框架元素的句法实现方式
Fillmore和后来的研究者[5]用这一理论比较多的情况是描述那些由动词激活的过程性框架,关注词语激活的活动场景是什么,这个活动场景中有哪些参与者,即框架元素(frame element,FE),各个框架元素又是如何在句子中实现的,下面具体进行说明。
要理解词语的意义,首先必须具备语义框架的知识,框架为词语在语言和言语中的使用提供背景和动因。例如,动词“写”描写的是这样一种场景:一个人在某个物体的表面握着一个顶部尖锐的工具使其进行移动,在物体表面留下痕迹。在这个场景中有4个实体(4个框架元素):发出这个行为的人、实施这个行为所凭借的工具、承受这个行为的物体表面、这个行为在物体表面留下的痕迹。这是在没有上下文时,单独一个动词“写”所描述的全部场景,也就是当没有遇到任何其他的上下文条件时,一个单独的动词“写”所产生的全部想象。句子的功能在于突出框架的某些方面,如“小王正在写”突出了书写人小王这一个实体,但是理解者根据经验,仍然会完整地理解其意义,即小王正在握着一支笔,在某一物体表面移动,并且在物体表面留下痕迹,这个场景仍然有4个实体:书写人(小王)、书写工具(笔)、物体表面(纸)、在物体表面留下的痕迹(字)。同样,如“小王正在写信”,突出了书写人(小王)和在物体表面留下的痕迹(信)两个实体,但是仍然可以引出背景场景中的其他两个实体:书写工具和物体表面。可见,词语在理解者大脑中激活了一个完整的认知框架,使理解者带着这个预期的抽象结构,填入惯例性的内容,得以完整理解句子表达的事件,这种隐含语义的理解,正是框架语义学适合智能化的语言信息处理技术的一个重要原因。
书写活动,更概括一点,实际上是以人与人之间的交际、交流活动为背景的,交际活动可以是打电话、直接对话,也可以是广播、做报告、发通知等,因此,书写可以看成交际活动的一种。同时,从主体的特征来看,书写和楼房建造、生产活动、文艺创作等同属于一种有意识行为。这种抽象的框架和框架之间的联系,在人类大脑中构成了一个复杂的知识网络,解释人的推理过程。
一个框架涉及的不是个别的词,而是一类词语,它们都具有共同的认知结构,支配相同类型的语义角色。对于语言表达,*重要的就是描述框架元素在句子中与框架承担词的句法关系和框架元素自身的句法特点。下面作为示例,仔细地研究一下[言谈交际框架(speech communication frame)]。以下关于[言谈交际]框架的内容,用下划线标识框架元素名称。
[言谈交际]指的是信息传递者(speaker)把信息(message)传递给信息接收者(addressee)的活动。框架中的信息传递者、信息、信息接收者称为框架元素,相关的英语动词包括say(说),speak(说、讲),utter(说),whisper(低语),talk(谈),tell(告诉),discuss(讨论),mention(提及),ask(问),promise(许诺),order(命令),plead(请求),confess(承认),warn(警告),threaten(恐吓)等,这些都可以激活[言谈交际]框架。
描述动词的语义性
1.1 框架语义学简介
框架语义学(frame semantics)[1-4]是由美国语言学家菲尔墨(Fillmore)提出的研究词语意义和句法结构意义的一种理论方法,即试图用经验主义方法,寻找语言和人类经验之间的紧密关系,并研究一种可行的描述方式,表示语言和经验之间的关系。词语代表了经验的分类(范畴化),范畴中的每一个词语背后都有一定的基于知识和经验的激活性情境,框架语义学试图理解一个言语社团为何会创建一个范畴并以词语来表达它;同时通过对背景动因进行描述,来解释这个词语的意义。该理论出自经验主义语义学传统,而不是形式语义学,它和形式语义学的差别主要在于,前者强调语言与经验之间的连续性(continuity),而后者是非连续的。但它与形式主义又并不矛盾,Fillmore表示,框架语义学应该说是“先于形式化的(pre-formal)”,而不是“非形式化的(non-formalist)”。
1.1.1 基于框架的语义理解
框架语义学把词义、句子意义和文本意义统一用框架(frame)进行描述,框架是和一些激活性语境(motivating context)相一致的一个结构化的范畴系统,是存储在人类经验中的图式化情境(scenario),这种范畴系统所描述的既可能是一个实体,也可能是一种行为实践模式,甚至是一些社会制度、习俗等。Fillmore使用框架这个术语来涵盖以往讨论自然语言理解问题的文献中提过的一系列概念,如场景(scene)、图式(schema)、脚本(******)、情境、观念框架(ideational scaffolding)、认知模式(cognitive model)、民俗理论(folk theory)等,但是这些术语属于人类认知或经验范畴,框架则是语言学术语,一个框架虽然表示的是一个认知结构,但它的意义在于这个认知结构的各个部分是和词语挂钩的,为语言理解服务。
Fillmore用场景、透视域(perspective)等概念来阐释其框架语义分析系统。场景指语言之外的真实世界,如物、事件、状态、行为、变化和人们对真实世界的记忆、感觉、知觉等。场景可以是视觉形象,也可以是任何一个独立的知觉、记忆、经历、行动或物体等。句子描述的是场景,语言中的一个词、短语、句子都是对场景的描述。场景中的各参与者承担各角色,通过透视域的选择,一部分参与者进入透视域,成为核心成分,其他参与者不一定能进入句子,即使出现在句子中,也只能成为句子的外围成分。
语义联系着场景,但是场景并不等于语义,每一个句子或者每一段话语,都有一个特定的透视域,从这个特定的视角去考虑一个场景,当整个场景都在考虑之中时,人们一般也只是注意场景的某一部分,因此,透视域在框架语义学中是个比较重要的概念,下面的论述经常会涉及,所以首先介绍这个概念,例句如下:
Carla bought the computer from Sally for $100.
(Carla以100美元从Sally那里买了电脑。)
尽管这句话提及了买者(Carla)、卖者(Sally)、钱($100)和商品(the computer),但是表达的时候基本上还是站在买者的视角上进行的。同样:
Sally sold the computer to Carla for $100.
(Sally以100美元卖给Carla电脑。)
这句则是从卖者的视角进行表达的。下面可以看包含buy和sell的另外两个句子:
I bought this thing[in order to test it out].
([为了检验一下],我把那个东西买了下来。)
At least you are selling them[in order to give the money to cancer research].
(至少你是[为了筹钱做癌症研究]才卖了它们。)
**句所表达的目的是和买者有关的,而第二句的目的是和卖者有关的,可见,理解buy和sell两个词语所支撑的句子,虽然都需要在整个商品交易这个大背景下,但是视角是不同的。
文本中的所有语言成分都可以激活框架,理解一个文本,就是搜索或感知文本内容所激活的框架,并对它们进行综合的过程。先来看Fillmore[3]列举的几个以实体、社会制度或风俗为框架的词语的理解过程,*后再看它们是如何综合的。
(1)decedent(死者)。理解该词语不能仅理解为“死去的人”,也不能限于一般的法律或新闻语境,而是要将视角置于法律子领域遗产法中去理解。一般的法律语境的死者可以用the deceased(死者)来表达,而decedent用在讨论一个死者的遗产时。
(2)land(陆地)。和ground(地面)相比,land用来指“陆地”,与sea(海洋)相对;ground用来指“地面”,与air(空中)相对。因此,如果描写某人on land(在岸上),就是将视角定位于一个航海事件中,只有在海上行驶过程中,才会这样描述某人所在的位置。
(3)mufti(便衣)。mufti是指军队中通常穿制服的人穿的普通衣服,如果看到一个军官和一个普通百姓穿同样的衣服,不会说那个百姓in mufti(穿便衣),这个词语只能用来描述那个军官,mufti显然是限于和军队有关的语境的。
(4)weekend(周末)。理解这个词语需要以一定的社会制度和实践经验为背景,即日历七天为一周,一周内有五天连续时间是公众工作时间,而有连续两天是私人生活时间。如果只有一个休息日,可能不需要weekend这个词,因为人们可以简单地使用表示那一天的名词(如Sunday(星期天))来指称它。如果人们三天工作,四天休息,似乎也不可能用这个名称来表达人们用来过私人生活的这段时间。
(5)breakfast(早餐)。这也是一个以社会制度和实践经验为背景的词语,理解这个词,就是要理解三方面内容:①人们的文化生活中的一个行为(实践活动),即一日三餐;②早餐是在睡完一觉之后的一天中较早的时候进行的;③它有独特的菜单(这视民族的不同而有许多细节差异)。关于breakfast,*有趣的是,这三个条件中的任何一个都可以单独缺席,仍然允许说话者使用这个词,这就涉及“原型(prototype)”的概念,一个人可以工作一个通宵,然后在日出时吃几个鸡蛋、烤面包片,喝咖啡、橘子汁,并把这些称为breakfast,显然,“睡觉后”这个范畴特征不是强制性标准;一个人也可以从早晨开始睡,到下午三点起床,起来吃鸡蛋、烤面包片,喝咖啡和橘子汁,也可以把这称为breakfast,显然,“早晨”这个范畴特征也不是一个强制性标准;一个人还可以晚上睡觉,早晨起床,喝点卷心菜汤,吃点巧克力派,作为breakfast,显然,“早餐菜单”也不是一个强制性标准。当观察这些现象时,不是没有抓住这个词语意义的核心,而是词语给了人们一个范畴,该范畴可以用在很多不同的语境中,这些语境由一个典型用法的多方面来决定,其用法或多或少和定义的原型相匹配,但不一定完全匹配。
(6)flip strength(狂热强度)。理解这个词组,需要有特殊的背景,即色情文学。一些色情小说出版商用这个词组告诉作者,每一页中都要包含一定数量的高“性”趣词,这样,一个潜在的顾客在书店中翻flip书时,不管他从哪里翻开,都会发现这本书中充满了令他兴奋的东西。一本书中,如果每页淫秽词语的比例都比较高,那么它有比较高的flip strength,反之则flip strength比较低。
以上分别用单个的词或词组,解释了背景框架的知识。文本中的词汇在理解者大脑中会唤起如上认知框架,认知框架提供理解期待,带来角色、目的、事件类型的自然的和惯例性的结果,理解者把这些通过这种预期的抽象结构知识加以综合,得以正确理解语言。Fillmore自造了一个句子(Fillmore称“这个自造的句子多少有些可笑的意味”),说明人们是如何理解语言的:
The decedent while on land and in mufti last weekend ate a typical breakfast and read a novel high in flip strength.
(死者于上周末在陆地上,穿着便衣,吃了顿普通的早晨,读了一本狂热度高的小说。)
通过以上背景知识,理解者就可以知道这是在谈论一个已经死亡的海军公务人员,他在上周六到周日这段时间读了一本色情小说,理解者还知道关于他的其他一些事情,如他是如何打发时间的等。这个句子并没有直接给人们这些信息,必须通过对以上背景框架进行综合,才能真正理解其意义。
1.1.2 框架元素的句法实现方式
Fillmore和后来的研究者[5]用这一理论比较多的情况是描述那些由动词激活的过程性框架,关注词语激活的活动场景是什么,这个活动场景中有哪些参与者,即框架元素(frame element,FE),各个框架元素又是如何在句子中实现的,下面具体进行说明。
要理解词语的意义,首先必须具备语义框架的知识,框架为词语在语言和言语中的使用提供背景和动因。例如,动词“写”描写的是这样一种场景:一个人在某个物体的表面握着一个顶部尖锐的工具使其进行移动,在物体表面留下痕迹。在这个场景中有4个实体(4个框架元素):发出这个行为的人、实施这个行为所凭借的工具、承受这个行为的物体表面、这个行为在物体表面留下的痕迹。这是在没有上下文时,单独一个动词“写”所描述的全部场景,也就是当没有遇到任何其他的上下文条件时,一个单独的动词“写”所产生的全部想象。句子的功能在于突出框架的某些方面,如“小王正在写”突出了书写人小王这一个实体,但是理解者根据经验,仍然会完整地理解其意义,即小王正在握着一支笔,在某一物体表面移动,并且在物体表面留下痕迹,这个场景仍然有4个实体:书写人(小王)、书写工具(笔)、物体表面(纸)、在物体表面留下的痕迹(字)。同样,如“小王正在写信”,突出了书写人(小王)和在物体表面留下的痕迹(信)两个实体,但是仍然可以引出背景场景中的其他两个实体:书写工具和物体表面。可见,词语在理解者大脑中激活了一个完整的认知框架,使理解者带着这个预期的抽象结构,填入惯例性的内容,得以完整理解句子表达的事件,这种隐含语义的理解,正是框架语义学适合智能化的语言信息处理技术的一个重要原因。
书写活动,更概括一点,实际上是以人与人之间的交际、交流活动为背景的,交际活动可以是打电话、直接对话,也可以是广播、做报告、发通知等,因此,书写可以看成交际活动的一种。同时,从主体的特征来看,书写和楼房建造、生产活动、文艺创作等同属于一种有意识行为。这种抽象的框架和框架之间的联系,在人类大脑中构成了一个复杂的知识网络,解释人的推理过程。
一个框架涉及的不是个别的词,而是一类词语,它们都具有共同的认知结构,支配相同类型的语义角色。对于语言表达,*重要的就是描述框架元素在句子中与框架承担词的句法关系和框架元素自身的句法特点。下面作为示例,仔细地研究一下[言谈交际框架(speech communication frame)]。以下关于[言谈交际]框架的内容,用下划线标识框架元素名称。
[言谈交际]指的是信息传递者(speaker)把信息(message)传递给信息接收者(addressee)的活动。框架中的信息传递者、信息、信息接收者称为框架元素,相关的英语动词包括say(说),speak(说、讲),utter(说),whisper(低语),talk(谈),tell(告诉),discuss(讨论),mention(提及),ask(问),promise(许诺),order(命令),plead(请求),confess(承认),warn(警告),threaten(恐吓)等,这些都可以激活[言谈交际]框架。
描述动词的语义性
评论
还没有评论。