描述
开 本: 16开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787302511984丛书名: 高等学校计算机教育规划教材
产品特色
编辑推荐
1.教材第1版入选普通高等教育“十一五”*规划教材,第2版入选普通高等教育“十二五”*规划教材,被多所985、211高校采用。
2.作者硕士博士先后师从南京大学莫绍揆先生、国防科技大学陈火旺先生,打下了扎实的理论基础。目前,担任军队人工智能专业组专家。多年从事人工智能科研和教学工作,并借鉴了国内外优秀人工智能教材的习题及案例。
3.教材以基本理论与方法为主体,反映人工智能技术发展现状,以方便学生理解和培养学生具备继续学习能力为目标;教材定位力求扩大适应面。
4.用比较多的篇幅论述人工智能的应用,除包括问题状态与搜索、知识表示、知识库系统、机器学习、自然语言技术处理、机器人学等内容外,还增加了智能体、语音处理、神经网络、自然启发式优化算法、互联网智能等内容。
5.注重实践。附录I介绍了人工智能程序设计语言Prolog;附录II给出了28个人工智能课程大作业。
6.为使用本教材的老师提供了习题答案(通过清华大学出版社网站下载)。
2.作者硕士博士先后师从南京大学莫绍揆先生、国防科技大学陈火旺先生,打下了扎实的理论基础。目前,担任军队人工智能专业组专家。多年从事人工智能科研和教学工作,并借鉴了国内外优秀人工智能教材的习题及案例。
3.教材以基本理论与方法为主体,反映人工智能技术发展现状,以方便学生理解和培养学生具备继续学习能力为目标;教材定位力求扩大适应面。
4.用比较多的篇幅论述人工智能的应用,除包括问题状态与搜索、知识表示、知识库系统、机器学习、自然语言技术处理、机器人学等内容外,还增加了智能体、语音处理、神经网络、自然启发式优化算法、互联网智能等内容。
5.注重实践。附录I介绍了人工智能程序设计语言Prolog;附录II给出了28个人工智能课程大作业。
6.为使用本教材的老师提供了习题答案(通过清华大学出版社网站下载)。
内容简介
本书内容丰富,观点新颖,理论联系实际。不仅可用作高等学校计算机专业本科生和研究生学习计算机算法设计的教材,而且也适合广大工程技术人员和自学读者学习参考。
目 录
目录
第1章绪论1
1.1人工智能的定义与概况1
1.2人类智能与人工智能5
1.2.1智能信息处理系统的假设6
1.2.2人类智能的计算机模拟7
1.2.3弱人工智能和强人工智能10
1.3人工智能各学派的认知观10
1.4人工智能的研究与应用领域12
1.4.1智能感知13
1.4.2智能推理15
1.4.3智能学习19
1.4.4智能行动24
1.5人工智能发展展望29
1.5.1新一轮人工智能的发展特征29
1.5.2未来40年的人工智能问题31
1.5.3人工智能鲁棒性和伦理34
1.5.4新一代人工智能发展规划35
习题37
第2章知识表示和推理39
2.1概述39
2.1.1知识和知识表示39
2.1.2知识策略智能41
2.1.3人工智能对知识表示方法的要求42
2.1.4知识的分类42
2.1.5知识表示语言问题43
2.1.6现代逻辑学的基本研究方法44人工智能(第3版)目录2.2命题逻辑46
2.2.1语法47
2.2.2语义47
2.2.3命题演算形式系统PC49
2.3谓词逻辑50
2.3.1语法51
2.3.2语义52
2.3.3谓词逻辑形式系统FC55
2.3.4一阶谓词逻辑的应用57
2.4归结推理58
2.4.1命题演算中的归结推理58
2.4.2谓词演算中的归结推理61
2.4.3谓词演算归结反演的合理性和完备性70
2.4.4案例: 一个基于逻辑的财务顾问74
2.5产生式系统76
2.5.1产生式系统的表示77
2.5.2案例: 九宫图游戏78
2.5.3案例: 传教士和野人问题79
2.5.4产生式系统的控制策略82
2.6语义网络84
2.6.1基本命题的语义网络表示84
2.6.2连接词在语义网络中的表示86
2.6.3语义网络的推理88
2.6.4语义网络表示的特点90
2.7框架90
2.7.1框架的构成90
2.7.2框架系统的推理92
2.7.3框架表示的特点93
2.8脚本93
2.8.1脚本概念94
2.8.2案例: 饭店脚本94
2.9知识图谱96
2.9.1知识图谱及其表示97
2.9.2百度知识图谱技术方案98
2.9.3案例: 知识图谱在互联网金融行业中的应用101
2.10基于知识的系统103
2.10.1知识获取103
2.10.2知识组织105
2.10.3知识应用106
2.10.4常识知识和大规模知识处理108
2.10.5常识推理108
2.10.6案例: 知识图谱应用110
2.11小结112
习题112
第3章搜索技术123
3.1概述123
3.2盲目搜索方法128
3.3启发式搜索129
3.3.1启发性信息和评估函数130
3.3.2好优先搜索算法131
3.3.3贪婪好优先搜索算法132
3.3.4A算法和A算法132
3.3.5迭代加深A算法136
3.4问题归约和ANDOR图启发式搜索136
3.4.1问题归约的描述137
3.4.2问题的ANDOR图表示138
3.4.3AO算法139
3.5博弈143
3.5.1极大极小过程144
3.5.2α-β过程146
3.5.3效用值估计方法149
3.6案例分析149
3.6.1八皇后问题149
3.6.2洞穴探宝151
3.6.3五子棋153
习题158
第4章高级搜索161
4.1爬山法搜索161
4.2模拟退火搜索164
4.2.1模拟退火搜索的基本思想164
4.2.2模拟退火算法165
4.2.3模拟退火算法关键参数和操作的设计167
4.3遗传算法168
4.3.1遗传算法的基本思想169
4.3.2遗传算法的基本操作170
4.4案例分析175
4.4.1爬山算法求解旅行商问题175
4.4.2模拟退火算法求解旅行商问题176
4.4.3遗传算法求解旅行商问题177
习题178
第5章不确定知识表示和推理180
5.1概述180
5.1.1什么是不确定推理181
5.1.2不确定推理要解决的基本问题181
5.1.3不确定性推理方法分类183
5.2非单调逻辑184
5.2.1非单调逻辑的产生185
5.2.2缺省推理逻辑186
5.2.3非单调逻辑系统188
5.2.4非单调规则190
5.2.5案例: 有经纪人的交易191
5.3主观Bayes方法194
5.3.1全概率公式和Bayes公式194
5.3.2主观 Bayes方法196
5.4确定性理论201
5.4.1建造医学专家系统时的问题201
5.4.2CF模型202
5.4.3案例: 帆船分类专家系统207
5.5证据理论212
5.5.1假设的不确定性212
5.5.2证据的不确定性与证据组合215
5.5.3规则的不确定性216
5.5.4不确定性的传递与组合216
5.5.5证据理论案例217
5.6模糊逻辑和模糊推理219
5.6.1模糊集合及其运算219
5.6.2模糊关系220
5.6.3语言变量221
5.6.4模糊逻辑和模糊推理222
5.6.5案例: 抵押申请评估决策支持系统226
5.7小结232
习题233
第6章Agent238
6.1概述238
6.2Agent及其结构240
6.2.1Agent的定义240
6.2.2Agent要素及特性241
6.2.3Agent的结构特点243
6.2.4Agent的结构分类244
6.3Agent应用案例246
6.4Agent通信250
6.4.1通信方式250
6.4.2Agent通信语言ACL251
6.5协调与协作256
6.5.1引言256
6.5.2合同网258
6.5.3协作规划260
6.6移动Agent263
6.6.1移动Agent产生的背景264
6.6.2定义和系统组成266
6.6.3实现技术267
6.6.4移动Agent系统275
6.6.5移动Agent技术的应用场景276
6.7多Agent系统开发框架JADE278
6.7.1程序模型280
6.7.2可重用开发包281
6.7.3开发和运行的支持工具283
6.8案例: 火星探矿机器人284
6.8.1需求分析284
6.8.2设计与实现286
6.9小结291
习题292
第7章机器学习299
7.1机器学习概述299
7.1.1学习中的元素300
7.1.2目标函数的表示301
7.1.3学习任务的类型303
7.1.4机器学习的定义和发展史304
7.1.5机器学习的主要策略306
7.1.6机器学习系统的基本结构307
7.2基于符号的机器学习308
7.2.1归纳学习308
7.2.2决策树学习312
7.2.3基于范例的学习318
7.2.4解释学习323
7.2.5案例: 通过EBG学习概念cup324
7.2.6强化学习325
7.3基于神经网络的机器学习327
7.3.1神经网络概述327
7.3.2基于反向传播网络的学习332
7.3.3案例: 基于反向传播网络拟合曲线341
7.3.4深度学习348
7.3.5案例: 深度学习在计算机视觉中的应用353
7.3.6竞争网络358
7.3.7案例: 学习向量量化解决分类问题368
7.4基于统计的机器学习369
7.4.1支持向量机369
7.4.2案例: XOR问题378
7.4.3统计关系学习380
7.5小结382
习题384
第8章自然语言处理技术393
8.1自然语言理解的一般问题393
8.1.1自然语言理解的概念及意义393
8.1.2自然语言理解研究的发展395
8.1.3自然语言理解的层次396
8.2词法分析399
8.3句法分析402
8.3.1短语结构文法和Chomsky文法体系402
8.3.2句法分析树404
8.3.3转移网络405
8.4语义分析406
8.4.1语义文法406
8.4.2格文法407
8.5大规模真实文本的处理408
8.5.1语料库语言学及其特点408
8.5.2统计学方法的应用及所面临的问题410
8.5.3汉语语料库加工的基本方法411
8.5.4语义资源建设414
8.6信息搜索416
8.6.1信息搜索概述416
8.6.2搜索引擎418
8.6.3智能搜索引擎423
8.6.4搜索引擎的发展趋势429
8.7机器翻译433
8.7.1机器翻译系统概述433
8.7.2机器翻译的基本模式和方法436
8.7.3统计机器翻译439
8.7.4利用深度学习改进统计机器翻译441
8.7.5端到端神经机器翻译442
8.7.6未来展望443
8.8语音识别444
8.8.1智能语音技术概述444
8.8.2组成单词读音的基本单元445
8.8.3信号处理446
8.8.4单个单词的识别449
8.8.5隐马尔可夫模型450
8.8.6深度学习在语音识别中的应用451
8.9机器阅读理解453
8.9.1机器阅读理解评测数据集453
8.9.2机器阅读理解的一般方法453
8.9.3机器阅读理解研究展望455
8.10机器写作456
8.10.1机器原创稿件457
8.10.2机器二次创作457
8.10.3机器写作展望459
8.11聊天机器人459
8.11.1聊天机器人应用场景460
8.11.2聊天机器人系统的组成结构及关键技术461
8.11.3聊天机器人研究存在的挑战465
8.12小结465
习题467
第9章智能规划470
9.1规划问题470
9.2状态空间搜索规划474
9.3偏序规划477
9.4命题逻辑规划481
9.5分层任务网络规划484
9.6非确定性规划486
9.7时态规划488
9.8多Agent规划491
9.9案例分析495
9.9.1规划问题的建模与规划系统的求解过程495
9.9.2Shakey世界497
9.10小结499
习题499
第10章机器人学502
10.1概述502
10.1.1机器人的分类503
10.1.2机器人的特性504
10.1.3机器人学的研究领域504
10.2机器人系统505
10.2.1机器人系统的组成505
10.2.2机器人的工作空间507
10.2.3机器人的性能指标509
10.3机器人的编程模式与语言510
10.4机器人的应用与展望511
10.4.1机器人应用512
10.4.2机器人发展展望515
10.5案例分析: 仿真机器人运动控制算法519
10.5.1仿真平台使用介绍519
10.5.2仿真平台与策略程序的关系522
10.5.3策略程序的结构522
10.5.4动作函数及说明526
10.5.5策略527
10.5.6各种定位球状态的判断方法530
10.5.7比赛规则531
10.6小结533
习题533
第11章互联网智能535
11.1概述535
11.2语义网与本体538
11.2.1语义网的层次模型538
11.2.2本体的基本概念540
11.2.3本体描述语言542
11.2.4本体知识管理框架542
11.2.5本体知识管理系统Protégé543
11.2.6本体知识管理系统KAON544
11.3Web技术的演化545
11.3.1Web 1.0546
11.3.2Web 2.0547
11.3.3Web 3.0549
11.3.4互联的社会550
11.4Web挖掘551
11.4.1Web内容挖掘553
11.4.2Web结构挖掘554
11.4.3Web使用挖掘555
11.4.4互联网信息可信度问题556
11.4.5案例: 反恐作战数据挖掘556
11.4.6案例: 微博博主特征行为数据挖掘557
11.5集体智能559
11.5.1社群智能560
11.5.2集体智能系统561
11.5.3全球脑562
11.5.4互联网大脑(云脑)563
11.5.5智联网566
11.5.6案例: 智能网联汽车568
11.5.7案例: 城市计算569
11.6小结571
习题572
附录A人工智能编程语言Python577
A.1人工智能编程语言概述577
A.2Python语言优势580
A.3Python人工智能相关库580
A.4Python语法简介582
附录B手写体识别案例585
B.1MNIST数据集586
B.2Softmax回归模型587
B.3Softmax回归的程序实现589
B.4模型的训练590
B.5模型的评价591
B.6完整代码及运行结果592
参考文献594
第1章绪论1
1.1人工智能的定义与概况1
1.2人类智能与人工智能5
1.2.1智能信息处理系统的假设6
1.2.2人类智能的计算机模拟7
1.2.3弱人工智能和强人工智能10
1.3人工智能各学派的认知观10
1.4人工智能的研究与应用领域12
1.4.1智能感知13
1.4.2智能推理15
1.4.3智能学习19
1.4.4智能行动24
1.5人工智能发展展望29
1.5.1新一轮人工智能的发展特征29
1.5.2未来40年的人工智能问题31
1.5.3人工智能鲁棒性和伦理34
1.5.4新一代人工智能发展规划35
习题37
第2章知识表示和推理39
2.1概述39
2.1.1知识和知识表示39
2.1.2知识策略智能41
2.1.3人工智能对知识表示方法的要求42
2.1.4知识的分类42
2.1.5知识表示语言问题43
2.1.6现代逻辑学的基本研究方法44人工智能(第3版)目录2.2命题逻辑46
2.2.1语法47
2.2.2语义47
2.2.3命题演算形式系统PC49
2.3谓词逻辑50
2.3.1语法51
2.3.2语义52
2.3.3谓词逻辑形式系统FC55
2.3.4一阶谓词逻辑的应用57
2.4归结推理58
2.4.1命题演算中的归结推理58
2.4.2谓词演算中的归结推理61
2.4.3谓词演算归结反演的合理性和完备性70
2.4.4案例: 一个基于逻辑的财务顾问74
2.5产生式系统76
2.5.1产生式系统的表示77
2.5.2案例: 九宫图游戏78
2.5.3案例: 传教士和野人问题79
2.5.4产生式系统的控制策略82
2.6语义网络84
2.6.1基本命题的语义网络表示84
2.6.2连接词在语义网络中的表示86
2.6.3语义网络的推理88
2.6.4语义网络表示的特点90
2.7框架90
2.7.1框架的构成90
2.7.2框架系统的推理92
2.7.3框架表示的特点93
2.8脚本93
2.8.1脚本概念94
2.8.2案例: 饭店脚本94
2.9知识图谱96
2.9.1知识图谱及其表示97
2.9.2百度知识图谱技术方案98
2.9.3案例: 知识图谱在互联网金融行业中的应用101
2.10基于知识的系统103
2.10.1知识获取103
2.10.2知识组织105
2.10.3知识应用106
2.10.4常识知识和大规模知识处理108
2.10.5常识推理108
2.10.6案例: 知识图谱应用110
2.11小结112
习题112
第3章搜索技术123
3.1概述123
3.2盲目搜索方法128
3.3启发式搜索129
3.3.1启发性信息和评估函数130
3.3.2好优先搜索算法131
3.3.3贪婪好优先搜索算法132
3.3.4A算法和A算法132
3.3.5迭代加深A算法136
3.4问题归约和ANDOR图启发式搜索136
3.4.1问题归约的描述137
3.4.2问题的ANDOR图表示138
3.4.3AO算法139
3.5博弈143
3.5.1极大极小过程144
3.5.2α-β过程146
3.5.3效用值估计方法149
3.6案例分析149
3.6.1八皇后问题149
3.6.2洞穴探宝151
3.6.3五子棋153
习题158
第4章高级搜索161
4.1爬山法搜索161
4.2模拟退火搜索164
4.2.1模拟退火搜索的基本思想164
4.2.2模拟退火算法165
4.2.3模拟退火算法关键参数和操作的设计167
4.3遗传算法168
4.3.1遗传算法的基本思想169
4.3.2遗传算法的基本操作170
4.4案例分析175
4.4.1爬山算法求解旅行商问题175
4.4.2模拟退火算法求解旅行商问题176
4.4.3遗传算法求解旅行商问题177
习题178
第5章不确定知识表示和推理180
5.1概述180
5.1.1什么是不确定推理181
5.1.2不确定推理要解决的基本问题181
5.1.3不确定性推理方法分类183
5.2非单调逻辑184
5.2.1非单调逻辑的产生185
5.2.2缺省推理逻辑186
5.2.3非单调逻辑系统188
5.2.4非单调规则190
5.2.5案例: 有经纪人的交易191
5.3主观Bayes方法194
5.3.1全概率公式和Bayes公式194
5.3.2主观 Bayes方法196
5.4确定性理论201
5.4.1建造医学专家系统时的问题201
5.4.2CF模型202
5.4.3案例: 帆船分类专家系统207
5.5证据理论212
5.5.1假设的不确定性212
5.5.2证据的不确定性与证据组合215
5.5.3规则的不确定性216
5.5.4不确定性的传递与组合216
5.5.5证据理论案例217
5.6模糊逻辑和模糊推理219
5.6.1模糊集合及其运算219
5.6.2模糊关系220
5.6.3语言变量221
5.6.4模糊逻辑和模糊推理222
5.6.5案例: 抵押申请评估决策支持系统226
5.7小结232
习题233
第6章Agent238
6.1概述238
6.2Agent及其结构240
6.2.1Agent的定义240
6.2.2Agent要素及特性241
6.2.3Agent的结构特点243
6.2.4Agent的结构分类244
6.3Agent应用案例246
6.4Agent通信250
6.4.1通信方式250
6.4.2Agent通信语言ACL251
6.5协调与协作256
6.5.1引言256
6.5.2合同网258
6.5.3协作规划260
6.6移动Agent263
6.6.1移动Agent产生的背景264
6.6.2定义和系统组成266
6.6.3实现技术267
6.6.4移动Agent系统275
6.6.5移动Agent技术的应用场景276
6.7多Agent系统开发框架JADE278
6.7.1程序模型280
6.7.2可重用开发包281
6.7.3开发和运行的支持工具283
6.8案例: 火星探矿机器人284
6.8.1需求分析284
6.8.2设计与实现286
6.9小结291
习题292
第7章机器学习299
7.1机器学习概述299
7.1.1学习中的元素300
7.1.2目标函数的表示301
7.1.3学习任务的类型303
7.1.4机器学习的定义和发展史304
7.1.5机器学习的主要策略306
7.1.6机器学习系统的基本结构307
7.2基于符号的机器学习308
7.2.1归纳学习308
7.2.2决策树学习312
7.2.3基于范例的学习318
7.2.4解释学习323
7.2.5案例: 通过EBG学习概念cup324
7.2.6强化学习325
7.3基于神经网络的机器学习327
7.3.1神经网络概述327
7.3.2基于反向传播网络的学习332
7.3.3案例: 基于反向传播网络拟合曲线341
7.3.4深度学习348
7.3.5案例: 深度学习在计算机视觉中的应用353
7.3.6竞争网络358
7.3.7案例: 学习向量量化解决分类问题368
7.4基于统计的机器学习369
7.4.1支持向量机369
7.4.2案例: XOR问题378
7.4.3统计关系学习380
7.5小结382
习题384
第8章自然语言处理技术393
8.1自然语言理解的一般问题393
8.1.1自然语言理解的概念及意义393
8.1.2自然语言理解研究的发展395
8.1.3自然语言理解的层次396
8.2词法分析399
8.3句法分析402
8.3.1短语结构文法和Chomsky文法体系402
8.3.2句法分析树404
8.3.3转移网络405
8.4语义分析406
8.4.1语义文法406
8.4.2格文法407
8.5大规模真实文本的处理408
8.5.1语料库语言学及其特点408
8.5.2统计学方法的应用及所面临的问题410
8.5.3汉语语料库加工的基本方法411
8.5.4语义资源建设414
8.6信息搜索416
8.6.1信息搜索概述416
8.6.2搜索引擎418
8.6.3智能搜索引擎423
8.6.4搜索引擎的发展趋势429
8.7机器翻译433
8.7.1机器翻译系统概述433
8.7.2机器翻译的基本模式和方法436
8.7.3统计机器翻译439
8.7.4利用深度学习改进统计机器翻译441
8.7.5端到端神经机器翻译442
8.7.6未来展望443
8.8语音识别444
8.8.1智能语音技术概述444
8.8.2组成单词读音的基本单元445
8.8.3信号处理446
8.8.4单个单词的识别449
8.8.5隐马尔可夫模型450
8.8.6深度学习在语音识别中的应用451
8.9机器阅读理解453
8.9.1机器阅读理解评测数据集453
8.9.2机器阅读理解的一般方法453
8.9.3机器阅读理解研究展望455
8.10机器写作456
8.10.1机器原创稿件457
8.10.2机器二次创作457
8.10.3机器写作展望459
8.11聊天机器人459
8.11.1聊天机器人应用场景460
8.11.2聊天机器人系统的组成结构及关键技术461
8.11.3聊天机器人研究存在的挑战465
8.12小结465
习题467
第9章智能规划470
9.1规划问题470
9.2状态空间搜索规划474
9.3偏序规划477
9.4命题逻辑规划481
9.5分层任务网络规划484
9.6非确定性规划486
9.7时态规划488
9.8多Agent规划491
9.9案例分析495
9.9.1规划问题的建模与规划系统的求解过程495
9.9.2Shakey世界497
9.10小结499
习题499
第10章机器人学502
10.1概述502
10.1.1机器人的分类503
10.1.2机器人的特性504
10.1.3机器人学的研究领域504
10.2机器人系统505
10.2.1机器人系统的组成505
10.2.2机器人的工作空间507
10.2.3机器人的性能指标509
10.3机器人的编程模式与语言510
10.4机器人的应用与展望511
10.4.1机器人应用512
10.4.2机器人发展展望515
10.5案例分析: 仿真机器人运动控制算法519
10.5.1仿真平台使用介绍519
10.5.2仿真平台与策略程序的关系522
10.5.3策略程序的结构522
10.5.4动作函数及说明526
10.5.5策略527
10.5.6各种定位球状态的判断方法530
10.5.7比赛规则531
10.6小结533
习题533
第11章互联网智能535
11.1概述535
11.2语义网与本体538
11.2.1语义网的层次模型538
11.2.2本体的基本概念540
11.2.3本体描述语言542
11.2.4本体知识管理框架542
11.2.5本体知识管理系统Protégé543
11.2.6本体知识管理系统KAON544
11.3Web技术的演化545
11.3.1Web 1.0546
11.3.2Web 2.0547
11.3.3Web 3.0549
11.3.4互联的社会550
11.4Web挖掘551
11.4.1Web内容挖掘553
11.4.2Web结构挖掘554
11.4.3Web使用挖掘555
11.4.4互联网信息可信度问题556
11.4.5案例: 反恐作战数据挖掘556
11.4.6案例: 微博博主特征行为数据挖掘557
11.5集体智能559
11.5.1社群智能560
11.5.2集体智能系统561
11.5.3全球脑562
11.5.4互联网大脑(云脑)563
11.5.5智联网566
11.5.6案例: 智能网联汽车568
11.5.7案例: 城市计算569
11.6小结571
习题572
附录A人工智能编程语言Python577
A.1人工智能编程语言概述577
A.2Python语言优势580
A.3Python人工智能相关库580
A.4Python语法简介582
附录B手写体识别案例585
B.1MNIST数据集586
B.2Softmax回归模型587
B.3Softmax回归的程序实现589
B.4模型的训练590
B.5模型的评价591
B.6完整代码及运行结果592
参考文献594
前 言
在当今社会,尤其是融合了社交内容的移动互联网的普及,如何更好地连接人与信息,已成为人类社会的一个重要基础命题。个性化的信息流已经成为一种新的连接方式,人与信息、万物互联。那么,在信息流产品平台与服务这个领域,如何高效地处理、分析、挖掘、理解和组织海量文字、图片(视频),更好地连接人与信息呢?如何根据对用户的深度理解,进行信息的智能推送呢?无疑,人工智能扮演着重要角色。
从内容创作、过滤、分发、消费以及互动的每个环节,都可以使用大规模机器学习,包括文本分析、自然语言理解、计算机视觉和数据挖掘等技术,向用户进行智能推送。同时,还可以基于信息流丰富多样的应用场景和用户,持续累积大量的训练样本和数据,让机器学习系统形成闭环,不断地改善和进化,在机器人辅助内容创作、自动视频分析与理解、个性化推荐和问答等方面发展人工智能核心技术。
移动互联网时代,很多信息都藏在应用里面,虽然不能利用搜索引擎将每个App里的信息轻松找出,但是在这股潮流中涌现出一些新的应用,让我们能够重新定义信息的源头。我们可以与很多信息供应商、内容提供商、媒体创作者一起构建新的内容平台和生态系统。
当前,有更多的公司开始大规模使用人工智能做个性化推荐。因为人们使用智能手机有了很多碎片化时间,产生了学习、娱乐等需求。这些需求也产生了各式各样的应用场景。在推荐引擎领域有了一个将人与信息相连接的新机会。搜索引擎里所有的排序算法、内容分析等技术,都可用于进一步的个性化精准推荐,从而变成信息流。“信息流”是一种新的、更智能的方式,让人能够随时随地在需要时得到所需要的信息。人工智能可以做个性化推荐,使人们不受地域限制享受服务——用无所不在的超级机器智能帮助人类创作、发现、使用、分发信息,并进行社交场景的互动。
当你使用在线系统搜索网页、编辑文档、存储图片、听音乐、看视频、玩游戏,并享受着行云流水般的顺畅服务时,正有几十万到上百万台服务器坚守在大后方,为你提供着7×24小时的可靠服务。超大的规模和超高的复杂度给服务的可靠性、可用性和性能都带来了极大的挑战。可靠服务的背后是人们利用人工智能前沿技术解决大规模在线系统服务的运维问题,即利用大规模数据挖掘、机器学习等人工智能技术对纷繁复杂的运维大数据进行实时分析,为系统维护提供有效的决策方案。
随着技术的进一步发展,人工智能与人可以互相帮助,从而让彼此变得更聪明。人工智能需要很多标注数据和训练样本,在信息流的场景,人们有更多机会拿到更多标注数据以及更细颗粒度的标注,帮助人们做自然语言理解、自然语言生成、图像视频理解和图像视频生成。人将与人工智能进一步共同进化。
软件正在改变全世界,而软件产业本身正在被人工智能的发展所颠覆。越来越多的软件开发不再只是依靠软件工程师的想法、逻辑和认知,而这些软件的核心已变成非常大的模型,有上千亿的参数,有各式各样的大数据。通过训练各种各样的模型,包含统计模型、符号、逻辑、知识表达,软件产业已被人工智能化。
今天,视频、图像、文字都已经被数字化,下一个阶段就是语义化,如图像理解。在数字原始表达空间,计算机很难做语义理解,我们需要用深度学习模型来学习非线性的转化。今天人工智能的本质其实是软件产业的革命,借由大数据、大计算和机器学习训练大模型,“编写”越来越智能的软件。
人工智能(第3版)第3版序人工智能主要分三层。底层是基础架构(infrastructure),包括云计算、芯片以及TensorFlow这样的框架。中间层主要是使能技术(enabling technology),如图像识别、语音识别、语义理解、机器翻译等。基础层和中间层是互联网巨头的必争之地,如芯片领域,英特尔、英伟达、高通公司都投入巨资,竞争极其激烈。同样,云计算、框架也都不是小公司能够涉足的领地。
创业公司的机会在上层,就是拿着下两层的成果服务垂直行业,也就是所谓的“AI ”。这样的趋势在2017年展现了不少案例。数据 AI算法正在带来更多的想象。例如,英国正在用AI酿造啤酒,瑞典通过深度学习分析马匹行为,纽约通过AI定制千人千面的素食健康食品。随着AI算法和机器学习更加民主化,每一个行业都可能进一步得到“AI ”式的改变。
深入垂直行业的“AI ”又可细分为两类情况:“AI 行业”和“行业 AI”,它们之间有明显的区别。
“AI 行业”在AI技术成熟之前,这个行业、产品从未存在过。例如,自动驾驶、亚马逊的Echo智能音箱、苹果的Siri语音助手。在人工智能技术未突破前,不存在这样的产品。因为AI创造出了一条全新的产业链。
“行业 AI”就是行业本身,一直存在,产业链条成熟,只是以前完全靠人工,效率比较低,现在加入AI元素后,使得行业效率有了明显提高,如安防、医疗等领域。
“AI 行业”“行业 AI”通常因为大家起跑线一样,行业纵深会比较浅,而后者则有巨大的行业壁垒。未来行业壁垒才是人工智能创业的护城河,因为每个行业都有垂直纵深。以医疗 AI举例,什么重要?大量准确的被医生标注过的数据重要。没有数据,再天才的科学家也无用武之地。
贲可荣2012年8月智能(intelligence)是人类所特有的区别于一般生物的主要特征。智能解释为“感知、学习、理解、知道的能力,思维的能力”。智能通常被理解为“人认识客观事物并运用知识解决实际问题的能力……往往通过观察、记忆、想象、思维、判断等表现出来”。
人工智能就是用计算机模拟人的智能,因此又叫作机器智能。研究人工智能的目的,一方面是要造出具有智能的机器,另一方面是要弄清人类智能的本质。通过研究和开发人工智能,可以辅助、部分代替,甚至拓宽人的智能,使计算机更好地造福于人类。
信息经抽象结晶为知识,知识构成智能的基础。因此,信息化到知识化再到智能化,必将成为人类社会发展的趋势。人工智能已经并正在广泛而深入地结合到科学技术的各门学科和社会的各个领域中,它的概念、方法和技术正在各行各业广泛渗透。智能已成为当今各种新产品、新装备的发展方向。
随着人工智能学科的发展,课程的内容也要不断更新。在美国,由IEEE Computer Society和ACM计算教程联合工作组共同制订了《计算教程2001》(Computing Curricula 2001,CC2001) ,它主要修订了CC1991,以反映计算机领域十余年来的发展。从CC2001可以看出,人工智能课程除包括人工智能概论、问题状态与搜索、知识表示、机器人学等传统部分外,还增加了机器学习、智能体、自然语言处理、语音处理、知识库系统、神经网络、遗传算法等内容。这充分反映了CC2001对人工智能课程的重视。在我国,从20世纪70年代末开始,随着改革开放政策的实施,人工智能的教学和科研逐步展开。
本书介绍人工智能的理论、方法和技术及其应用,除了讨论那些仍然有用的和有效的基本原理和方法外,着重阐述一些新的和正在研究的人工智能方法与技术,特别是近期发展起来的方法和技术。此外,用比较多的篇幅论述人工智能的应用,包括人工智能新的应用研究。具体包括下列内容。
(1) 简述人工智能的起源与发展,讨论人工智能的定义、人工智能与计算机的关系以及人工智能的研究和应用领域。(2) 论述知识表示、推理和不确定推理的主要方法,包括谓词逻辑、产生式系统、语义网络、框架、面向对象、归结推理、非单调推理、主观Bayes方法、确定性理论、证据理论、模糊逻辑和模糊推理等。
(3) 讨论常用搜索原理,如盲目搜索、启发式搜索、minimax搜索、αβ剪枝和约束满足等,并研究一些比较高级的搜索技术,如贪婪局部搜索、局部剪枝搜索、模拟退火算法、遗传算法等。
(4) 介绍近期发展起来的已成为当前研究热点的人工智能技术和方法,即分布式人工智能与Agent、计算智能、机器学习、反向传播神经网络、Hopfield神经网络、知识发现等。
(5) 比较详细地分析人工智能的主要应用领域,涉及自动规划系统、自然语言处理、信息检索、语言翻译、语音识别、机器人等。
本书第3、4、9、10章由张彦铎撰写,其余各章由贲可荣撰写。全书由贲可荣统稿。吴荣华撰写了附录初稿。陈志刚教授对全书进行了认真审校,特此致谢。
在本书编写过程中,参考和引用了许多专家、学者的著作和论文,正文中未一一注明。在此,作者谨向相关参考文献的作者表示衷心的感谢。
不当之处,恳请读者批评指正。
从内容创作、过滤、分发、消费以及互动的每个环节,都可以使用大规模机器学习,包括文本分析、自然语言理解、计算机视觉和数据挖掘等技术,向用户进行智能推送。同时,还可以基于信息流丰富多样的应用场景和用户,持续累积大量的训练样本和数据,让机器学习系统形成闭环,不断地改善和进化,在机器人辅助内容创作、自动视频分析与理解、个性化推荐和问答等方面发展人工智能核心技术。
移动互联网时代,很多信息都藏在应用里面,虽然不能利用搜索引擎将每个App里的信息轻松找出,但是在这股潮流中涌现出一些新的应用,让我们能够重新定义信息的源头。我们可以与很多信息供应商、内容提供商、媒体创作者一起构建新的内容平台和生态系统。
当前,有更多的公司开始大规模使用人工智能做个性化推荐。因为人们使用智能手机有了很多碎片化时间,产生了学习、娱乐等需求。这些需求也产生了各式各样的应用场景。在推荐引擎领域有了一个将人与信息相连接的新机会。搜索引擎里所有的排序算法、内容分析等技术,都可用于进一步的个性化精准推荐,从而变成信息流。“信息流”是一种新的、更智能的方式,让人能够随时随地在需要时得到所需要的信息。人工智能可以做个性化推荐,使人们不受地域限制享受服务——用无所不在的超级机器智能帮助人类创作、发现、使用、分发信息,并进行社交场景的互动。
当你使用在线系统搜索网页、编辑文档、存储图片、听音乐、看视频、玩游戏,并享受着行云流水般的顺畅服务时,正有几十万到上百万台服务器坚守在大后方,为你提供着7×24小时的可靠服务。超大的规模和超高的复杂度给服务的可靠性、可用性和性能都带来了极大的挑战。可靠服务的背后是人们利用人工智能前沿技术解决大规模在线系统服务的运维问题,即利用大规模数据挖掘、机器学习等人工智能技术对纷繁复杂的运维大数据进行实时分析,为系统维护提供有效的决策方案。
随着技术的进一步发展,人工智能与人可以互相帮助,从而让彼此变得更聪明。人工智能需要很多标注数据和训练样本,在信息流的场景,人们有更多机会拿到更多标注数据以及更细颗粒度的标注,帮助人们做自然语言理解、自然语言生成、图像视频理解和图像视频生成。人将与人工智能进一步共同进化。
软件正在改变全世界,而软件产业本身正在被人工智能的发展所颠覆。越来越多的软件开发不再只是依靠软件工程师的想法、逻辑和认知,而这些软件的核心已变成非常大的模型,有上千亿的参数,有各式各样的大数据。通过训练各种各样的模型,包含统计模型、符号、逻辑、知识表达,软件产业已被人工智能化。
今天,视频、图像、文字都已经被数字化,下一个阶段就是语义化,如图像理解。在数字原始表达空间,计算机很难做语义理解,我们需要用深度学习模型来学习非线性的转化。今天人工智能的本质其实是软件产业的革命,借由大数据、大计算和机器学习训练大模型,“编写”越来越智能的软件。
人工智能(第3版)第3版序人工智能主要分三层。底层是基础架构(infrastructure),包括云计算、芯片以及TensorFlow这样的框架。中间层主要是使能技术(enabling technology),如图像识别、语音识别、语义理解、机器翻译等。基础层和中间层是互联网巨头的必争之地,如芯片领域,英特尔、英伟达、高通公司都投入巨资,竞争极其激烈。同样,云计算、框架也都不是小公司能够涉足的领地。
创业公司的机会在上层,就是拿着下两层的成果服务垂直行业,也就是所谓的“AI ”。这样的趋势在2017年展现了不少案例。数据 AI算法正在带来更多的想象。例如,英国正在用AI酿造啤酒,瑞典通过深度学习分析马匹行为,纽约通过AI定制千人千面的素食健康食品。随着AI算法和机器学习更加民主化,每一个行业都可能进一步得到“AI ”式的改变。
深入垂直行业的“AI ”又可细分为两类情况:“AI 行业”和“行业 AI”,它们之间有明显的区别。
“AI 行业”在AI技术成熟之前,这个行业、产品从未存在过。例如,自动驾驶、亚马逊的Echo智能音箱、苹果的Siri语音助手。在人工智能技术未突破前,不存在这样的产品。因为AI创造出了一条全新的产业链。
“行业 AI”就是行业本身,一直存在,产业链条成熟,只是以前完全靠人工,效率比较低,现在加入AI元素后,使得行业效率有了明显提高,如安防、医疗等领域。
“AI 行业”“行业 AI”通常因为大家起跑线一样,行业纵深会比较浅,而后者则有巨大的行业壁垒。未来行业壁垒才是人工智能创业的护城河,因为每个行业都有垂直纵深。以医疗 AI举例,什么重要?大量准确的被医生标注过的数据重要。没有数据,再天才的科学家也无用武之地。
贲可荣2012年8月智能(intelligence)是人类所特有的区别于一般生物的主要特征。智能解释为“感知、学习、理解、知道的能力,思维的能力”。智能通常被理解为“人认识客观事物并运用知识解决实际问题的能力……往往通过观察、记忆、想象、思维、判断等表现出来”。
人工智能就是用计算机模拟人的智能,因此又叫作机器智能。研究人工智能的目的,一方面是要造出具有智能的机器,另一方面是要弄清人类智能的本质。通过研究和开发人工智能,可以辅助、部分代替,甚至拓宽人的智能,使计算机更好地造福于人类。
信息经抽象结晶为知识,知识构成智能的基础。因此,信息化到知识化再到智能化,必将成为人类社会发展的趋势。人工智能已经并正在广泛而深入地结合到科学技术的各门学科和社会的各个领域中,它的概念、方法和技术正在各行各业广泛渗透。智能已成为当今各种新产品、新装备的发展方向。
随着人工智能学科的发展,课程的内容也要不断更新。在美国,由IEEE Computer Society和ACM计算教程联合工作组共同制订了《计算教程2001》(Computing Curricula 2001,CC2001) ,它主要修订了CC1991,以反映计算机领域十余年来的发展。从CC2001可以看出,人工智能课程除包括人工智能概论、问题状态与搜索、知识表示、机器人学等传统部分外,还增加了机器学习、智能体、自然语言处理、语音处理、知识库系统、神经网络、遗传算法等内容。这充分反映了CC2001对人工智能课程的重视。在我国,从20世纪70年代末开始,随着改革开放政策的实施,人工智能的教学和科研逐步展开。
本书介绍人工智能的理论、方法和技术及其应用,除了讨论那些仍然有用的和有效的基本原理和方法外,着重阐述一些新的和正在研究的人工智能方法与技术,特别是近期发展起来的方法和技术。此外,用比较多的篇幅论述人工智能的应用,包括人工智能新的应用研究。具体包括下列内容。
(1) 简述人工智能的起源与发展,讨论人工智能的定义、人工智能与计算机的关系以及人工智能的研究和应用领域。(2) 论述知识表示、推理和不确定推理的主要方法,包括谓词逻辑、产生式系统、语义网络、框架、面向对象、归结推理、非单调推理、主观Bayes方法、确定性理论、证据理论、模糊逻辑和模糊推理等。
(3) 讨论常用搜索原理,如盲目搜索、启发式搜索、minimax搜索、αβ剪枝和约束满足等,并研究一些比较高级的搜索技术,如贪婪局部搜索、局部剪枝搜索、模拟退火算法、遗传算法等。
(4) 介绍近期发展起来的已成为当前研究热点的人工智能技术和方法,即分布式人工智能与Agent、计算智能、机器学习、反向传播神经网络、Hopfield神经网络、知识发现等。
(5) 比较详细地分析人工智能的主要应用领域,涉及自动规划系统、自然语言处理、信息检索、语言翻译、语音识别、机器人等。
本书第3、4、9、10章由张彦铎撰写,其余各章由贲可荣撰写。全书由贲可荣统稿。吴荣华撰写了附录初稿。陈志刚教授对全书进行了认真审校,特此致谢。
在本书编写过程中,参考和引用了许多专家、学者的著作和论文,正文中未一一注明。在此,作者谨向相关参考文献的作者表示衷心的感谢。
不当之处,恳请读者批评指正。
作者2006年1月
在线试读
第5章
不确定知识表示和推理现有的知识表示和推理技术往往把研究和处理对象限定在特定的专业知识领域;对不具有规范表示的知识领域,现有技术的适用性就大为降低。近年来,由于实际应用的推动,知识处理研究发生了许多重大变化,已经从注重研究知识的形式转向研究知识的内容,从注重研究良构知识(wellstructured knowledge)转向研究病构知识(illstructured knowledge),从注重研究封闭性知识转向研究开放性知识,从研究内涵完整、协调和精确的知识转向研究内涵不完整、不协调和不精确的知识,这些趋势可以用“非规范知识处理”的概念概括。所谓知识的非规范性,是指知识内涵的难处理性,包括知识的不确定性(模糊知识、不确定、随机和不精确知识),或知识的不完整性(内容不完整的知识和结构不完整的知识),或知识的不协调性(含矛盾的知识、带噪声的知识和含冗余的知识),或知识非恒常性(时变知识和启发式知识)。
本章讨论处理数据的不精确(inexactness)和知识的不确定(uncertainty)所需要的一些工具和方法,主要包括在经验基础上抽象得到的确定性因子方法、基于Bayes理论的概率推理、基于信任测度函数的证据理论、基于模糊集合论的模糊推理等技术。
5.1概述
诸如“鸟是会飞的”及“常在河边走,哪能不湿鞋”这样的常识(common sense)和常识推理(common sense reasoning),我们如何形式化?
这里说的常识、常识推理与通常的逻辑推理不同。首先,常识具有不确定性。一个常识可能有众多的例外。一个常识可能是一种尚无理论依据或者缺乏充分验证的经验。其次,常识往往对环境有极强的依存性。由于常识的这种不确定性,决定了常识推理的所谓非单调性,即依据常识进行通常的逻辑推理,但保留对常识的不确定性及环境的变迁造成的推理失误的修正权。非单调推理技术试图解决不确定性推理问题。
既然人的信念常常是不确定的,就存在关于信念强度的问题,即确定性程度到底为多少。常见的方法是把指示确定性程度的数据附加到推理规则,并由此研究不确定强度的表示和计算问题。
陆汝钤院士曾主持一项国家自然科学基金重大项目“非规范知识处理的基本理论和核心技术”。所谓知识的非规范性,是指知识内涵的难处理性,它包括知识的不确定性、知识的不完整性、知识的不协调性和知识的非恒常性。该项目的主要研究目标和研究内容是,从理论、技术和示范应用3个层面对非规范知识处理进行深入研究。在理论上,要研究非规范知识的数学理论、逻辑理论和认知理论;在技术上,要研究非规范知识的表示和建模、非规范知识的获取和融合,以及非规范知识的通信和传播;在示范应用上,要研究几个特定领域的非规范知识,开发海量非规范知识库、示范性语义网上知识获取和知识编辑器,以及通用网上的知识获取和知识编辑器。
人工智能(第3版)第5章不确定知识表示和推理5.1.1什么是不确定推理
不确定性是智能问题的本质特征,无论是人类智能,还是人工智能,都离不开不确定性的处理。可以说,智能主要反映在求解不确定性问题的能力上。
推理是人类的思维过程,它是从已知事实出发,通过运用相关的知识逐步推出某个结论的过程。其中,已知事实和知识是构成推理的两个基本要素。已知事实又称为证据,用以指出推理的出发点及推理时应使用的知识;而知识是推理得以向前推进,并逐步达到终目标的依据。第2章介绍的演绎推理是一种精确的推理,因为它处理的是精确事实和知识,并运用确定的推理方法得出精确的结论。
在客观世界中,由于事物发展的随机性和复杂性,人类认识的不完全、不可靠、不精确和不一致性,自然语言中存在的模糊性和歧义性,使得现实世界中的事物以及事物之间的关系极其复杂,带来了大量的不确定性。如果采用确定性的经典逻辑处理不确定性,就需要把知识或思维行为中原本具有的不确定性划归为确定性处理,这无疑会舍去事物的某些重要属性,造成信息流失,妨碍人们做出好的决定,甚至可能做出错误的决定。大多数要求智能行为的任务都具有某种程度的不确定。不确定性可以理解为在缺少足够信息的情况下做出判断。
确定性推理是建立在经典逻辑基础上的,经典逻辑的基础之一就是集合论,集合论中的隶属概念是一个非常精确和确定的概念,一个元素是否属于某个集合是非常明确的。这在很多实际情况中是很难做到的,如高、矮、胖、瘦就很难精确地区分。因此,经典逻辑不适合用来处理不确定性。针对不同的不确定性起因,人们提出了不同的理论和方法,以建立适合描述不确定和不精确的新的逻辑模型。因此,可以说不确定推理是建立在非经典逻辑基础上的一种推理,它是对不确定性知识的运用与处理。严格地说,不确定性推理就是从不确定性初始证据出发,通过运用不确定性的知识,终推出具有一定程度的不确定性,但却是合理或者近乎合理的结论的思维过程。
5.1.2不确定推理要解决的基本问题
证据和规则的不确定性,导致所产生的结论的不确定性。不确定性推理反映了知识不确定性的动态积累和传播过程,推理的每一步都需要综合证据和规则的不确定因素,通过某种不确定性测度,寻找尽可能符合客观实际的计算模式,通过不确定测度的传递计算,终得到结果的不确定测度。
因此,在基于规则的专家系统中,不确定性表现在证据、规则和推理3个方面,需要对专家系统中的事实与规则给出不确定性描述,并在此基础上建立不确定性的传递计算方法。因此,要实现对不确定性知识的处理,必须解决不确定知识的表示问题、不确定信息的计算问题,以及不确定性表示和计算的语义解释问题。
1. 表示问题
表示问题指的是采用什么方法描述不确定性。通常有数值表示和非数值的语义表示两种方法。数值表示便于计算、比较;非数值表示是一种定性的描述。
专家系统中的“不确定性”一般分为两类: 一是规则的不确定性;二是证据的不确定性。
(1) 规则的不确定性(E→H,f(H,E)),表示相应知识的不确定性程度,称为知识或规则强度。
(2) 证据的不确定性(E,C(E)),表示证据E为真的程度。它有两种来源: 初始证据(由用户给出);前面推出的结论作为当前证据(通过计算得到)。
一般来说,证据不确定性的表示方法应与知识不确定性的表示方法保持一致,证据的不确定性通常也是一个数值表示,它代表相应证据的不确定性程度,称为动态强度。
2. 计算问题
计算问题主要指不确定性的传播与更新,即获得新信息的过程。它是在领域专家给出的规则强度和用户给出的原始证据的不确定性的基础上,定义一组函数,求出结论的不确定性度量。它主要包括如下3个方面。
1) 不确定性的传递算法
在每一步推理中,如何把证据及规则的不确定性传递给结论。在多步推理中,如何把初始证据的不确定性传给结论。
也就是说,已知规则的前提E的不确定性C(E)和规则强度f(H,E),求假设H的不确定性C(H),即定义函数f1,使得: C(H)=f1(C(E),f(H,E))2) 结论不确定性合成
推理中有时会出现这样一种情况: 用不同的知识进行推理,得到相同结论,但不确定性的程度却不相同。
即已知由两个独立的证据E1和E2求得的假设H的不确定性度量C1(H)和C2(H),求证据E1和E2的组合导致的假设H的不确定性C(H),即定义函数f2,使得: C(H)=f2(C1(E),C2(H))3) 组合证据的不确定性算法
即已知证据E1和E2的不确定性度量C(E1)和C(E2),求证据E1和E2的析取和合取的不确定性,即定义函数f3和f4,使得: C(E1∧E2)=f3(C(E1),C(E2))
C(E1∨E2)=f4(C(E1),C(E2))目前关于组合证据的不确定性的计算已经提出了多种方法,用得多的是如下3种。
(a) 小法C(E1∧E2)=min(C(E1),C(E2))
C(E1∨E2)=max(C(E1),C(E2))(b) 概率方法C(E1∧E2)=C(E1)×C(E2)
C(E1∨E2)=C(E1) C(E2)-C(E1)×C(E2)(c) 有界方法C(E1∧E2)=max{0,C(E1) C(E2)-1}
C(E1∨E2)=min{1,C(E1) C(E2)}3. 语义问题
语义问题指上述表示和计算的含义是什么,如C(H,E)可理解为当前提E为真时,对结论H为真的一种影响程度,C(E)可理解为E为真的程度。
目前,在人工智能领域,处理不确定性问题的主要数学工具有概率论和模糊数学。概率论与模糊数学研究和处理的是两种不同的不确定性。概率论研究和处理随机现象,事件本身有明确的含义,只是由于条件不充分,使得在条件和事件之间不能出现决定性的因果关系(随机性)。模糊数学研究和处理模糊现象,概念本身就没有明确的外延,一个对象是否符合这个概念是难以确定的(属于模糊的)。无论采用什么数学工具和模型,都需要对规则和证据的不确定性给出度量。
规则的不确定性度量f(H,E)需要定义在下述3个典型情况下的取值。
(1) 若E为真,则H为真,这时f(H,E)的值。
(2) 若E为真,则H为假,这时f(H,E)的值。
(3) E对H没有影响,这时f(H,E)的值。
对于证据的不确定性度量C(E),需要定义在下述3个典型情况下的取值。
(1) E为真,C(E)的值。
(2) E为假,C(E)的值。
(3) 对E一无所知,C(E)的值。
对于一个专家系统,一旦给定了上述不确定性的表示、计算及其相关的解释,就可以从初的观察证据出发,得出相应结论的不确定性程度。专家系统的不确定性推理模型指的就是证据和规则的不确定性的测度方法以及不确定性的组合计算模式。
5.1.3不确定性推理方法分类
关于不确定性推理方法的研究,主要沿两条不同的路线发展。
(1) 在推理级扩展不确定性推理的方法: 其特点是把不确定证据和不确定的知识分别与某种量度标准对应起来,并且给出更新结论不确定性算法,从而建立不确定性推理模式。通常把这一类方法统称为模型方法。
(2) 在控制策略级处理不确定性的方法: 其特点是通过识别领域中引起不确定性的某些特征及相应的控制策略限制或减少不确定性对系统产生的影响,这类方法没有处理不确定性的统一模型,其效果极大地依赖于控制策略,把这类方法统称为控制方法。
模型方法又分为数值方法及非数值方法两类。数值方法是对不确定性的一种定量表示和处理方法。非数值方法是指除数值方法外的其他各种处理不确定性的方法,如古典逻辑方法和非单调推理方法等。
在数值方法中,概率方法是重要的方法之一。概率论有着完善的理论和方法,而且具有现成的公式实现不确定性的合成和传递,因此可以用作度量不确定性的重要手段。
纯概率方法虽然有严格的理论依据,但通常要求给出事件的先验概率和条件概率,而这些数据又不易获得,因此使其应用受到限制。为了解决这个问题,人们在概率论的基础上发展起一些新的方法和理论,主要有主观概率论(又称主观Bayes方法)、可信度方法、证据理论等。
(1) 主观Bayes方法: 它是PROSPECTOR专家系统中使用的不确定推理模型,是对Bayes公式修正后形成的一种不确定推理方法,为概率论在不确定推理中的应用提供了一条途径。
(2) 可信度方法: 它是MYCIN专家系统中使用的不确定推理模型,它以确定性理论为基础,方法简单、易用。
(3) 证据理论: 它通过定义信任函数、似然函数,把知道和不知道区别开。这些函数满足比概率函数的公理弱的公理,因此,概率函数是信任函数的一个子集。
基于概率的方法虽然可以表示和处理现实世界中存在的某些不确定性,在人工智能的不确定性推理方面占有重要地位,但它们没有把事物自身具有的模糊性反映出来,也不能对其客观存在的模糊性进行有效推理。Zadeh等人提出的模糊集理论及其在此基础上发展的可能性理论弥补了这一缺憾。概率论处理的是由随机性引起的不确定性,可能性理论处理的是由模糊性引起的不确定性。可能性理论对由模糊性引起的不确定性的表示及处理开辟了一种新的解决途径,并得到广泛的应用。
5.2非单调逻辑
为了形式地表述常识,并在常识间进行有效的形式推理,20世纪70年代末,人们提出了非单调逻辑(nonmonotonic logic)。
传统逻辑系统都是单调的,因为由已知事实推出的逻辑结论绝不会在已知事实增加时反而丧失。更形式地,可定义逻辑系统的单调性如下。
定义5.1设FS为一逻辑系统,称FS是单调的(monotonic),如果对于FS的任意公式集合Γ1,Γ2,Γ1Γ2蕴涵Th(Γ1)Th(Γ2)。这里,Th(Γ)表示公式集合{A|ΓFSA},即Γ的演绎结果的集合。
已讨论的所有逻辑系统都是单调的。可是,常识推理却并不具有这种单调性。当你告诉我“a是一只鸟”时,我立即会据常识“鸟是会飞的”进行推理,做出结论“a是会飞的”。可当你又告诉我“a是一只鸵鸟”,我自然会立即撤回上述结论,相反会据常识“鸵鸟不会飞”而做出结论“a是不会飞的”。如果我足够机敏,还应对常识“鸟是会飞的”做出修正,例如,改为“鸟是会飞的,除非它是鸵鸟”。在上述推理过程中,个结论在已知事实增加时会自行撤销(而不是仍然接受它),并修改推理的依据(而不是让互相矛盾的依据共存,因而被迫接受一切断言)。
常识推理的这种特性称为非单调性,具有非单调性的推理称为非单调推理,而使用非单调推理的逻辑系统称为非单调逻辑。和定义5.1相对,可形式地定义非单调性。
定义5.2逻辑系统FS称为非单调的,如果存在公式集合Γ1和Γ2,Γ1Γ2,但Th(Γ1)Th(Γ2)。
要使机器具有智能,就应当使它具有进行常识推理的能力,具有依据“不完全的信息”和“不可靠的经验”进行推理及预测的能力,因此使机器具有这种非单调的逻辑推理机制是非常必要的。
5.2.1非单调逻辑的产生
非单调逻辑这个名词的次出现,大致是在20世纪70年代中期,但在人工智能对推理机制的模拟的研究中,非单调推理的运用则更早些。
早的Prolog版本中就已经有了“封闭系统假设”,即当系统推不出A时,便认为?瘙綈A成立。当系统的知识库扩充时,可能推出A,那时 ?瘙綈A便不再为系统所接受。
PLANNER系统则更进一步,其中设有运算THNOT,THNOT(A)表示“试图证明A,若不成功,则THNOT(A)为真”。不仅如此,为了便于在运行中更新系统,PLANNER还设有前提表和删除表,可随时删除那些系统已经导出而又在系统更改后不再成立的事实。
采用“封闭系统假设”或算符THNOT的方式都有一个明显的缺点,即必须保证“A是否可证”是可判定的,而这并不总是可以办到的。大家知道,一阶逻辑是不可判定的。此外,系统还可能遇到“循环论证”的情况。例如,系统已知A(f(x))→B(x)
B(f(x))→C(x)
C(f(x))→A(x)要证A(a)。这时系统既无法确定“A(a)可证”,也无法确定“A(a)不可证”,因为要证A(a),须证C(f(a)),B(f(f(a))),A(f(f(f(a)))),…。
在用逻辑演算刻画状态转换、动作规划时,非单调性显得尤为重要,因为状态、动作都不是一成不变的。
在规划生成系统STRIPS中,用状态变换的规则模拟机器人的动作。这些规则均由3部分组成。
(1) 前提,规则执行的前提。
(2) 删除表,规则执行后状态描述中应当删除的事实表。
(3) 添加表,规则执行后状态描述中应当添加的事实表。
例5.1表示机器人拾起一块积木的动作可用规则Pickup(x),它由以下3部分组成。
前提: ontable(x)(x在桌子上)
clear(x)(x上无他物)
handempty(机械手闲置)
删除表: ontable(x),clear(x),handempty
添加表: holding(x)(机械手持有x)
如果图51(a)的状态描述是
{ontable(A),ontable(B),handempty,clear(A),clear(B)}
那么,经过动作Pickup(A)后,其状态描述应为
{ontable(B),clear(B),holding(A)}
如图51(b)所示。
图51机器人拾起一块积木的动作前后
在实际应用中出现的这些处理非单调性的方法是很有启发意义的,它们为非单调逻辑的出现奠定了基础。到了20世纪70年代后期和80年代初,人们开始研究非单调推理,并提出多种非单调逻辑系统,较令人注目的是Reiter的缺省推理逻辑,McDermott和Doyle的非单调逻辑系统。
5.2.2缺省推理逻辑
1977年,Reiter开始研究信息不完全时的推理形式——缺省推理(default reasoning)。1980年,他正式提出了缺省推理逻辑。
下面先用一个例子说明什么是缺省推理。
例5.2如果我们仅知道鸟类中只有鸵鸟不会飞,那么当听说企鹅是鸟类的一种时,我们会得出“企鹅会飞”的结论。像这样的推理方式就是一种缺省推理。
分析例5.2中的推理可知,缺省推理是非单调的,因为当我们有了“企鹅也不会飞”的知识时,就不再会推出“企鹅会飞”的结论了。另外,例5.2中的推理之所以称为缺省推理,是因为它是依据如下形式的规则进行的。
Bird(x): Mfly(x)fly(x)x是鸟: “x会飞”与系统不矛盾x会飞)
这就是说: 如果x是鸟,并且“x会飞”与现有知识不冲突(例如,系统只知道“鸵鸟不会飞”,而x不是鸵鸟),那么可以认为x是会飞的。当系统不知道企鹅不会飞时,据此规则,便可得出企鹅会飞的结论(因为企鹅是鸟,企鹅会飞与现有知识不矛盾)。但是,当系统知道企鹅不会飞时,Mfly(企鹅)就不再成立,从而“企鹅会飞”的结论就不再能推出。
上述形式的推理规则称为缺省推理规则,它的一般形式是α(): Mβ1(),…,Mβm()w()(51)这里,α(),β1(),…,βm(),w() 均为一阶逻辑中的公式,它们所含的自由变元均在 =中。 α() 称为规则的先决条件, βi() 称为规则的缺省条件, w()称为规则的结论。这种推理规则可以说是传统逻辑中规则α()w()(52)的“非单调化”,因为规则式(52)可能有许多例外就像 Bird(x)fly(x) 那样,引入Mβi() 就是为了指出这些例外,使它们随着知识的增长而改变对某些客体特性的判断,从而改变推理的结果。 Mβi()中的M常读作“可能”,Mβi()表示就现有知识而言βi()可能成立,即?瘙綈βi()尚未出现(缺省)。
如果缺省推理规则中不含自由变元,即α,Mβi(i=1,2,…,m),w都为命题,那么称该规则为闭规则。
定义5.3一个缺省推理逻辑理论(简称缺省理论或理论)由两部分组成:
(1) 缺省推理规则集D。
(2) 公式集W,它是已知的或约定的事实集合。
缺省理论常用二元矢表示。当D中的所有规则是闭规则时,称理论为闭理论。
缺省理论是非单调的。考虑理论T=,其中 D=: MAB,W=,那么B在T中可推出,而当将?瘙綈A添入W,使W成为 W′ ={?瘙綈A},使T成为 T′=。这时尽管T′是T的扩充(已知事实集W′W),但B却不再能从T′中推出。
当然,在缺省理论中“推出”的概念与传统逻辑中的“推出”概念是有区别的,前者是非单调推理,而后者是单调推理。为了定义缺省理论中的“推出”概念,我们需要下列定义。
定义5.4设△=为一闭的缺省理论,Γ为关于D的一个算子,Γ作用于任意的命题集合S,而其值为满足下列3条性质的小命题集合 Γ(S)。
(1) W Γ(S)。
(2) Th(Γ(S))=Γ(S),这里Th(Γ(S))为命题集{A| Γ(S) FCA }。
(3) 如果D中有规则 α: Mβ1,…,MβmW,且 α∈Γ(S),?瘙綈β1,…,?瘙綈βmS,那么W∈Γ(S)。
定义5.5命题集合E称为关于D的算子Γ的固定点(fixed points),如果 Γ(E)=E。此时又称E为△=的一个扩充。
有了扩充的概念,便可定义非单调的“推出”概念。
定义5.6如果命题A包含在缺省理论△的一个扩充中,那么称A在△中可非单调地推出(以下简称“推出”),记为A(使用符号是为了区别于,表示非单调的“推出”)。
例5.3当D=: MA?瘙綈A,W=时,△=无扩充,因为可证关于△的算子Γ无固定点。若不然,设E为Γ固定点。考虑?瘙綈A∈E否?如果?瘙綈AE,那么据定义5.4之(3),?瘙綈A∈E。如果?瘙綈A∈E,则?瘙綈A必由缺省规则:MA?瘙綈A导入E(因W=),故?瘙綈AE(否则MA为假,上述规则不适用)。这是一个悖论。
例5.4设D=:MA?瘙綈B,:MB?瘙綈C,:MC?瘙綈F,W=,那么△=有的扩充E=Th({?瘙綈B,?瘙綈F})。容易验证E为关于△的Γ的固定点,当命题集S{?瘙綈B,?瘙綈C,?瘙綈F}而S≠{?瘙綈B,?瘙綈F}时,Th(S)均非Γ的关于△的固定点。
例5.5设D=:MAA,B:MCC,F∧A:MEE,C∧E:M?瘙綈A,M(F∨A)G
W={B,C→F∨A,A∧C→?瘙綈E},那么有3个扩充: E1=Th(W∪{A,C}),E2=Th(W∪{A,E}),E3=Th(W∪{C,E,G})。以下仅对E1进行说明。由于Th(W∪{A,C})有?瘙綈E,从而Th(W∪{A,C})中没有E和G(因为ME和C∧E不能成立)。这就是说,D中缺省规则在算子Γ的计算过程中无一有用,因此Γ(Th(W∪{A,C}))=Th(W∪{A,C})。
上述例子说明,并非所有缺省理论都有扩充,并非有扩充的缺省理论只有的扩充。由此看来,缺省理论的扩充变幻莫测,但是,有了下述定理,它便清晰多了。这一定理还使我们有了一个验证扩充的工具。
定理5.1设E为一阶命题集,△=为一闭的缺省理论。递归定义Ei(i=1,2,3,…)如下:E0=W
Ei 1=Th(Ei)∪w|α:Mβ1,…,Mβmw∈D,α∈Ei,?瘙綈β1,…,?瘙綈βmE那么,E为△的一个扩充当且仅当 E=∪∞i=0Ei。
在缺省理论的语构研究方面已取得了许多成果,但它的语义研究困难重重,至今未见令人满意的语义结构被赋予这一十分有趣的推理理论。
5.2.3非单调逻辑系统
1978—1982年,McDermott和Doyle就非单调推理发表了好几篇很有影响的文章。他们把自己的系统称为非单调逻辑系统,这一系统建立基于一阶逻辑之上,并引进模态词M,用MA表示A与当前已推得的定理相容(注意,在这一点上与缺省推理理论相似)。
例5.6设理论T有以下3条公理:
(1) 正值中午∧M(出太阳) →出太阳。
(2) 正值中午。
(3) 日食→?瘙綈(出太阳)。
那么,在T中可证:
(4) 出太阳。
但是,如果把
(5) 日食
添作公理,那么由(3)和(5)推得?瘙綈(出太阳),这使得M(出太阳)不能成立,于是(4)不再可证。这与传统逻辑不同。如果把(1)改为
(1) ′正值中午→出太阳
那么在添入公理(5)时系统便不一致,从而一切公式全为系统的定理。
下文将介绍,由于在非单调逻辑中允许MA与一般命题一样使用(缺省推理中,MA只在缺省推理规则中出现),使它与缺省推理理论有许多根本的不同。
从上例看出,非单调逻辑系统的关键是M意义的规定。从语法角度规定,似乎可引入下列规则(从M的直观意义出发): 如果?瘙綈A,则MA(53)但这是不适当的,因为这样做等于把一切非定理的否定接受为定理,没有什么非单调可言。McDermott和Doyle的做法是,修改式(53)为如果?瘙綈A,则MA(54)这里的表示与不同的“推出”——非单调地推出,并如下规定的意义。
以下将加入模态词M的一阶谓词演算系统记为FC,将允许使用M的一阶公式全体记为LFC,对任何公式集 ΓLFC,Th(Γ)的意义是Th(Γ)={A|ΓFCA}定义5.7对任何公式集 ΓLFC定义算子NMΓ,对任意公式集SLFCNMΓ(S)=Th(Γ∪ASΓ(S))(55)其中称ASΓ为S的假设集ASΓ(S)={MQ|Q∈LFC∧?瘙綈QS}(56)令TH(Γ)=∩({LFC}∪{S|NMΓ(S)=S})(57)这里∩C={x|S(S∈C→x∈S)}。如果P∈TH(Γ),那么称P可由Γ非单调地推出(可证),并记为ΓP。
我们对TH(Γ)的定义式(57)解释如下。TH(Γ)可以说是 NMΓ 算子的所有固定点的交,当NMΓ无固定点时,TH(Γ)=∩({LFC})=LFC,即约定NMΓ无固定点时,TH(Γ)为全体FC公式的集合。
应当指出,算子NMΓ有固定点时,ΓP是指P在算子NMΓ的每一个固定点中。这与缺省推理理论不同,P在缺省理论△中“可证”,是指P属于△的某一扩充,即在算子的某一个固定点中。
例5.7设Γ=FC∪{MC→?瘙綈C}(FC指一阶逻辑的公理、规则,其中允许使用M。以下同),那么,NMΓ无固定点。设NMΓ(S)=S′,若?瘙綈CS,那么MC∈ASΓ(S),从而?瘙綈C∈S′;反之,若?瘙綈C∈S,那么MCASΓ(S),故?瘙綈CS′。这就是说,S′不可能等于S,NMΓ无固定点。
例5.8设Γ=FC∪{A∧MB→B,C∧MD→D,A∨C},那么NMΓ有的固定点,该固定点含有B∨D,因此有ΓB∨D。值得注意的是,当缺省理论△中D=A:MBB,C:MDD,W={A∨C}时,△也有扩充(Th(A∨C)),它不含B∨D。这一差别便是由非单调逻辑中把MB,MD与A,C等看作平等的命题造成的,这使它们能代入(A1→A3)∧(A2→A3)(A1∨A2→A3)之类的重言式。相反,缺省推理就没有这种“便利”。
不确定知识表示和推理现有的知识表示和推理技术往往把研究和处理对象限定在特定的专业知识领域;对不具有规范表示的知识领域,现有技术的适用性就大为降低。近年来,由于实际应用的推动,知识处理研究发生了许多重大变化,已经从注重研究知识的形式转向研究知识的内容,从注重研究良构知识(wellstructured knowledge)转向研究病构知识(illstructured knowledge),从注重研究封闭性知识转向研究开放性知识,从研究内涵完整、协调和精确的知识转向研究内涵不完整、不协调和不精确的知识,这些趋势可以用“非规范知识处理”的概念概括。所谓知识的非规范性,是指知识内涵的难处理性,包括知识的不确定性(模糊知识、不确定、随机和不精确知识),或知识的不完整性(内容不完整的知识和结构不完整的知识),或知识的不协调性(含矛盾的知识、带噪声的知识和含冗余的知识),或知识非恒常性(时变知识和启发式知识)。
本章讨论处理数据的不精确(inexactness)和知识的不确定(uncertainty)所需要的一些工具和方法,主要包括在经验基础上抽象得到的确定性因子方法、基于Bayes理论的概率推理、基于信任测度函数的证据理论、基于模糊集合论的模糊推理等技术。
5.1概述
诸如“鸟是会飞的”及“常在河边走,哪能不湿鞋”这样的常识(common sense)和常识推理(common sense reasoning),我们如何形式化?
这里说的常识、常识推理与通常的逻辑推理不同。首先,常识具有不确定性。一个常识可能有众多的例外。一个常识可能是一种尚无理论依据或者缺乏充分验证的经验。其次,常识往往对环境有极强的依存性。由于常识的这种不确定性,决定了常识推理的所谓非单调性,即依据常识进行通常的逻辑推理,但保留对常识的不确定性及环境的变迁造成的推理失误的修正权。非单调推理技术试图解决不确定性推理问题。
既然人的信念常常是不确定的,就存在关于信念强度的问题,即确定性程度到底为多少。常见的方法是把指示确定性程度的数据附加到推理规则,并由此研究不确定强度的表示和计算问题。
陆汝钤院士曾主持一项国家自然科学基金重大项目“非规范知识处理的基本理论和核心技术”。所谓知识的非规范性,是指知识内涵的难处理性,它包括知识的不确定性、知识的不完整性、知识的不协调性和知识的非恒常性。该项目的主要研究目标和研究内容是,从理论、技术和示范应用3个层面对非规范知识处理进行深入研究。在理论上,要研究非规范知识的数学理论、逻辑理论和认知理论;在技术上,要研究非规范知识的表示和建模、非规范知识的获取和融合,以及非规范知识的通信和传播;在示范应用上,要研究几个特定领域的非规范知识,开发海量非规范知识库、示范性语义网上知识获取和知识编辑器,以及通用网上的知识获取和知识编辑器。
人工智能(第3版)第5章不确定知识表示和推理5.1.1什么是不确定推理
不确定性是智能问题的本质特征,无论是人类智能,还是人工智能,都离不开不确定性的处理。可以说,智能主要反映在求解不确定性问题的能力上。
推理是人类的思维过程,它是从已知事实出发,通过运用相关的知识逐步推出某个结论的过程。其中,已知事实和知识是构成推理的两个基本要素。已知事实又称为证据,用以指出推理的出发点及推理时应使用的知识;而知识是推理得以向前推进,并逐步达到终目标的依据。第2章介绍的演绎推理是一种精确的推理,因为它处理的是精确事实和知识,并运用确定的推理方法得出精确的结论。
在客观世界中,由于事物发展的随机性和复杂性,人类认识的不完全、不可靠、不精确和不一致性,自然语言中存在的模糊性和歧义性,使得现实世界中的事物以及事物之间的关系极其复杂,带来了大量的不确定性。如果采用确定性的经典逻辑处理不确定性,就需要把知识或思维行为中原本具有的不确定性划归为确定性处理,这无疑会舍去事物的某些重要属性,造成信息流失,妨碍人们做出好的决定,甚至可能做出错误的决定。大多数要求智能行为的任务都具有某种程度的不确定。不确定性可以理解为在缺少足够信息的情况下做出判断。
确定性推理是建立在经典逻辑基础上的,经典逻辑的基础之一就是集合论,集合论中的隶属概念是一个非常精确和确定的概念,一个元素是否属于某个集合是非常明确的。这在很多实际情况中是很难做到的,如高、矮、胖、瘦就很难精确地区分。因此,经典逻辑不适合用来处理不确定性。针对不同的不确定性起因,人们提出了不同的理论和方法,以建立适合描述不确定和不精确的新的逻辑模型。因此,可以说不确定推理是建立在非经典逻辑基础上的一种推理,它是对不确定性知识的运用与处理。严格地说,不确定性推理就是从不确定性初始证据出发,通过运用不确定性的知识,终推出具有一定程度的不确定性,但却是合理或者近乎合理的结论的思维过程。
5.1.2不确定推理要解决的基本问题
证据和规则的不确定性,导致所产生的结论的不确定性。不确定性推理反映了知识不确定性的动态积累和传播过程,推理的每一步都需要综合证据和规则的不确定因素,通过某种不确定性测度,寻找尽可能符合客观实际的计算模式,通过不确定测度的传递计算,终得到结果的不确定测度。
因此,在基于规则的专家系统中,不确定性表现在证据、规则和推理3个方面,需要对专家系统中的事实与规则给出不确定性描述,并在此基础上建立不确定性的传递计算方法。因此,要实现对不确定性知识的处理,必须解决不确定知识的表示问题、不确定信息的计算问题,以及不确定性表示和计算的语义解释问题。
1. 表示问题
表示问题指的是采用什么方法描述不确定性。通常有数值表示和非数值的语义表示两种方法。数值表示便于计算、比较;非数值表示是一种定性的描述。
专家系统中的“不确定性”一般分为两类: 一是规则的不确定性;二是证据的不确定性。
(1) 规则的不确定性(E→H,f(H,E)),表示相应知识的不确定性程度,称为知识或规则强度。
(2) 证据的不确定性(E,C(E)),表示证据E为真的程度。它有两种来源: 初始证据(由用户给出);前面推出的结论作为当前证据(通过计算得到)。
一般来说,证据不确定性的表示方法应与知识不确定性的表示方法保持一致,证据的不确定性通常也是一个数值表示,它代表相应证据的不确定性程度,称为动态强度。
2. 计算问题
计算问题主要指不确定性的传播与更新,即获得新信息的过程。它是在领域专家给出的规则强度和用户给出的原始证据的不确定性的基础上,定义一组函数,求出结论的不确定性度量。它主要包括如下3个方面。
1) 不确定性的传递算法
在每一步推理中,如何把证据及规则的不确定性传递给结论。在多步推理中,如何把初始证据的不确定性传给结论。
也就是说,已知规则的前提E的不确定性C(E)和规则强度f(H,E),求假设H的不确定性C(H),即定义函数f1,使得: C(H)=f1(C(E),f(H,E))2) 结论不确定性合成
推理中有时会出现这样一种情况: 用不同的知识进行推理,得到相同结论,但不确定性的程度却不相同。
即已知由两个独立的证据E1和E2求得的假设H的不确定性度量C1(H)和C2(H),求证据E1和E2的组合导致的假设H的不确定性C(H),即定义函数f2,使得: C(H)=f2(C1(E),C2(H))3) 组合证据的不确定性算法
即已知证据E1和E2的不确定性度量C(E1)和C(E2),求证据E1和E2的析取和合取的不确定性,即定义函数f3和f4,使得: C(E1∧E2)=f3(C(E1),C(E2))
C(E1∨E2)=f4(C(E1),C(E2))目前关于组合证据的不确定性的计算已经提出了多种方法,用得多的是如下3种。
(a) 小法C(E1∧E2)=min(C(E1),C(E2))
C(E1∨E2)=max(C(E1),C(E2))(b) 概率方法C(E1∧E2)=C(E1)×C(E2)
C(E1∨E2)=C(E1) C(E2)-C(E1)×C(E2)(c) 有界方法C(E1∧E2)=max{0,C(E1) C(E2)-1}
C(E1∨E2)=min{1,C(E1) C(E2)}3. 语义问题
语义问题指上述表示和计算的含义是什么,如C(H,E)可理解为当前提E为真时,对结论H为真的一种影响程度,C(E)可理解为E为真的程度。
目前,在人工智能领域,处理不确定性问题的主要数学工具有概率论和模糊数学。概率论与模糊数学研究和处理的是两种不同的不确定性。概率论研究和处理随机现象,事件本身有明确的含义,只是由于条件不充分,使得在条件和事件之间不能出现决定性的因果关系(随机性)。模糊数学研究和处理模糊现象,概念本身就没有明确的外延,一个对象是否符合这个概念是难以确定的(属于模糊的)。无论采用什么数学工具和模型,都需要对规则和证据的不确定性给出度量。
规则的不确定性度量f(H,E)需要定义在下述3个典型情况下的取值。
(1) 若E为真,则H为真,这时f(H,E)的值。
(2) 若E为真,则H为假,这时f(H,E)的值。
(3) E对H没有影响,这时f(H,E)的值。
对于证据的不确定性度量C(E),需要定义在下述3个典型情况下的取值。
(1) E为真,C(E)的值。
(2) E为假,C(E)的值。
(3) 对E一无所知,C(E)的值。
对于一个专家系统,一旦给定了上述不确定性的表示、计算及其相关的解释,就可以从初的观察证据出发,得出相应结论的不确定性程度。专家系统的不确定性推理模型指的就是证据和规则的不确定性的测度方法以及不确定性的组合计算模式。
5.1.3不确定性推理方法分类
关于不确定性推理方法的研究,主要沿两条不同的路线发展。
(1) 在推理级扩展不确定性推理的方法: 其特点是把不确定证据和不确定的知识分别与某种量度标准对应起来,并且给出更新结论不确定性算法,从而建立不确定性推理模式。通常把这一类方法统称为模型方法。
(2) 在控制策略级处理不确定性的方法: 其特点是通过识别领域中引起不确定性的某些特征及相应的控制策略限制或减少不确定性对系统产生的影响,这类方法没有处理不确定性的统一模型,其效果极大地依赖于控制策略,把这类方法统称为控制方法。
模型方法又分为数值方法及非数值方法两类。数值方法是对不确定性的一种定量表示和处理方法。非数值方法是指除数值方法外的其他各种处理不确定性的方法,如古典逻辑方法和非单调推理方法等。
在数值方法中,概率方法是重要的方法之一。概率论有着完善的理论和方法,而且具有现成的公式实现不确定性的合成和传递,因此可以用作度量不确定性的重要手段。
纯概率方法虽然有严格的理论依据,但通常要求给出事件的先验概率和条件概率,而这些数据又不易获得,因此使其应用受到限制。为了解决这个问题,人们在概率论的基础上发展起一些新的方法和理论,主要有主观概率论(又称主观Bayes方法)、可信度方法、证据理论等。
(1) 主观Bayes方法: 它是PROSPECTOR专家系统中使用的不确定推理模型,是对Bayes公式修正后形成的一种不确定推理方法,为概率论在不确定推理中的应用提供了一条途径。
(2) 可信度方法: 它是MYCIN专家系统中使用的不确定推理模型,它以确定性理论为基础,方法简单、易用。
(3) 证据理论: 它通过定义信任函数、似然函数,把知道和不知道区别开。这些函数满足比概率函数的公理弱的公理,因此,概率函数是信任函数的一个子集。
基于概率的方法虽然可以表示和处理现实世界中存在的某些不确定性,在人工智能的不确定性推理方面占有重要地位,但它们没有把事物自身具有的模糊性反映出来,也不能对其客观存在的模糊性进行有效推理。Zadeh等人提出的模糊集理论及其在此基础上发展的可能性理论弥补了这一缺憾。概率论处理的是由随机性引起的不确定性,可能性理论处理的是由模糊性引起的不确定性。可能性理论对由模糊性引起的不确定性的表示及处理开辟了一种新的解决途径,并得到广泛的应用。
5.2非单调逻辑
为了形式地表述常识,并在常识间进行有效的形式推理,20世纪70年代末,人们提出了非单调逻辑(nonmonotonic logic)。
传统逻辑系统都是单调的,因为由已知事实推出的逻辑结论绝不会在已知事实增加时反而丧失。更形式地,可定义逻辑系统的单调性如下。
定义5.1设FS为一逻辑系统,称FS是单调的(monotonic),如果对于FS的任意公式集合Γ1,Γ2,Γ1Γ2蕴涵Th(Γ1)Th(Γ2)。这里,Th(Γ)表示公式集合{A|ΓFSA},即Γ的演绎结果的集合。
已讨论的所有逻辑系统都是单调的。可是,常识推理却并不具有这种单调性。当你告诉我“a是一只鸟”时,我立即会据常识“鸟是会飞的”进行推理,做出结论“a是会飞的”。可当你又告诉我“a是一只鸵鸟”,我自然会立即撤回上述结论,相反会据常识“鸵鸟不会飞”而做出结论“a是不会飞的”。如果我足够机敏,还应对常识“鸟是会飞的”做出修正,例如,改为“鸟是会飞的,除非它是鸵鸟”。在上述推理过程中,个结论在已知事实增加时会自行撤销(而不是仍然接受它),并修改推理的依据(而不是让互相矛盾的依据共存,因而被迫接受一切断言)。
常识推理的这种特性称为非单调性,具有非单调性的推理称为非单调推理,而使用非单调推理的逻辑系统称为非单调逻辑。和定义5.1相对,可形式地定义非单调性。
定义5.2逻辑系统FS称为非单调的,如果存在公式集合Γ1和Γ2,Γ1Γ2,但Th(Γ1)Th(Γ2)。
要使机器具有智能,就应当使它具有进行常识推理的能力,具有依据“不完全的信息”和“不可靠的经验”进行推理及预测的能力,因此使机器具有这种非单调的逻辑推理机制是非常必要的。
5.2.1非单调逻辑的产生
非单调逻辑这个名词的次出现,大致是在20世纪70年代中期,但在人工智能对推理机制的模拟的研究中,非单调推理的运用则更早些。
早的Prolog版本中就已经有了“封闭系统假设”,即当系统推不出A时,便认为?瘙綈A成立。当系统的知识库扩充时,可能推出A,那时 ?瘙綈A便不再为系统所接受。
PLANNER系统则更进一步,其中设有运算THNOT,THNOT(A)表示“试图证明A,若不成功,则THNOT(A)为真”。不仅如此,为了便于在运行中更新系统,PLANNER还设有前提表和删除表,可随时删除那些系统已经导出而又在系统更改后不再成立的事实。
采用“封闭系统假设”或算符THNOT的方式都有一个明显的缺点,即必须保证“A是否可证”是可判定的,而这并不总是可以办到的。大家知道,一阶逻辑是不可判定的。此外,系统还可能遇到“循环论证”的情况。例如,系统已知A(f(x))→B(x)
B(f(x))→C(x)
C(f(x))→A(x)要证A(a)。这时系统既无法确定“A(a)可证”,也无法确定“A(a)不可证”,因为要证A(a),须证C(f(a)),B(f(f(a))),A(f(f(f(a)))),…。
在用逻辑演算刻画状态转换、动作规划时,非单调性显得尤为重要,因为状态、动作都不是一成不变的。
在规划生成系统STRIPS中,用状态变换的规则模拟机器人的动作。这些规则均由3部分组成。
(1) 前提,规则执行的前提。
(2) 删除表,规则执行后状态描述中应当删除的事实表。
(3) 添加表,规则执行后状态描述中应当添加的事实表。
例5.1表示机器人拾起一块积木的动作可用规则Pickup(x),它由以下3部分组成。
前提: ontable(x)(x在桌子上)
clear(x)(x上无他物)
handempty(机械手闲置)
删除表: ontable(x),clear(x),handempty
添加表: holding(x)(机械手持有x)
如果图51(a)的状态描述是
{ontable(A),ontable(B),handempty,clear(A),clear(B)}
那么,经过动作Pickup(A)后,其状态描述应为
{ontable(B),clear(B),holding(A)}
如图51(b)所示。
图51机器人拾起一块积木的动作前后
在实际应用中出现的这些处理非单调性的方法是很有启发意义的,它们为非单调逻辑的出现奠定了基础。到了20世纪70年代后期和80年代初,人们开始研究非单调推理,并提出多种非单调逻辑系统,较令人注目的是Reiter的缺省推理逻辑,McDermott和Doyle的非单调逻辑系统。
5.2.2缺省推理逻辑
1977年,Reiter开始研究信息不完全时的推理形式——缺省推理(default reasoning)。1980年,他正式提出了缺省推理逻辑。
下面先用一个例子说明什么是缺省推理。
例5.2如果我们仅知道鸟类中只有鸵鸟不会飞,那么当听说企鹅是鸟类的一种时,我们会得出“企鹅会飞”的结论。像这样的推理方式就是一种缺省推理。
分析例5.2中的推理可知,缺省推理是非单调的,因为当我们有了“企鹅也不会飞”的知识时,就不再会推出“企鹅会飞”的结论了。另外,例5.2中的推理之所以称为缺省推理,是因为它是依据如下形式的规则进行的。
Bird(x): Mfly(x)fly(x)x是鸟: “x会飞”与系统不矛盾x会飞)
这就是说: 如果x是鸟,并且“x会飞”与现有知识不冲突(例如,系统只知道“鸵鸟不会飞”,而x不是鸵鸟),那么可以认为x是会飞的。当系统不知道企鹅不会飞时,据此规则,便可得出企鹅会飞的结论(因为企鹅是鸟,企鹅会飞与现有知识不矛盾)。但是,当系统知道企鹅不会飞时,Mfly(企鹅)就不再成立,从而“企鹅会飞”的结论就不再能推出。
上述形式的推理规则称为缺省推理规则,它的一般形式是α(): Mβ1(),…,Mβm()w()(51)这里,α(),β1(),…,βm(),w() 均为一阶逻辑中的公式,它们所含的自由变元均在 =中。 α() 称为规则的先决条件, βi() 称为规则的缺省条件, w()称为规则的结论。这种推理规则可以说是传统逻辑中规则α()w()(52)的“非单调化”,因为规则式(52)可能有许多例外就像 Bird(x)fly(x) 那样,引入Mβi() 就是为了指出这些例外,使它们随着知识的增长而改变对某些客体特性的判断,从而改变推理的结果。 Mβi()中的M常读作“可能”,Mβi()表示就现有知识而言βi()可能成立,即?瘙綈βi()尚未出现(缺省)。
如果缺省推理规则中不含自由变元,即α,Mβi(i=1,2,…,m),w都为命题,那么称该规则为闭规则。
定义5.3一个缺省推理逻辑理论(简称缺省理论或理论)由两部分组成:
(1) 缺省推理规则集D。
(2) 公式集W,它是已知的或约定的事实集合。
缺省理论常用二元矢表示。当D中的所有规则是闭规则时,称理论为闭理论。
缺省理论是非单调的。考虑理论T=,其中 D=: MAB,W=,那么B在T中可推出,而当将?瘙綈A添入W,使W成为 W′ ={?瘙綈A},使T成为 T′=。这时尽管T′是T的扩充(已知事实集W′W),但B却不再能从T′中推出。
当然,在缺省理论中“推出”的概念与传统逻辑中的“推出”概念是有区别的,前者是非单调推理,而后者是单调推理。为了定义缺省理论中的“推出”概念,我们需要下列定义。
定义5.4设△=为一闭的缺省理论,Γ为关于D的一个算子,Γ作用于任意的命题集合S,而其值为满足下列3条性质的小命题集合 Γ(S)。
(1) W Γ(S)。
(2) Th(Γ(S))=Γ(S),这里Th(Γ(S))为命题集{A| Γ(S) FCA }。
(3) 如果D中有规则 α: Mβ1,…,MβmW,且 α∈Γ(S),?瘙綈β1,…,?瘙綈βmS,那么W∈Γ(S)。
定义5.5命题集合E称为关于D的算子Γ的固定点(fixed points),如果 Γ(E)=E。此时又称E为△=的一个扩充。
有了扩充的概念,便可定义非单调的“推出”概念。
定义5.6如果命题A包含在缺省理论△的一个扩充中,那么称A在△中可非单调地推出(以下简称“推出”),记为A(使用符号是为了区别于,表示非单调的“推出”)。
例5.3当D=: MA?瘙綈A,W=时,△=无扩充,因为可证关于△的算子Γ无固定点。若不然,设E为Γ固定点。考虑?瘙綈A∈E否?如果?瘙綈AE,那么据定义5.4之(3),?瘙綈A∈E。如果?瘙綈A∈E,则?瘙綈A必由缺省规则:MA?瘙綈A导入E(因W=),故?瘙綈AE(否则MA为假,上述规则不适用)。这是一个悖论。
例5.4设D=:MA?瘙綈B,:MB?瘙綈C,:MC?瘙綈F,W=,那么△=有的扩充E=Th({?瘙綈B,?瘙綈F})。容易验证E为关于△的Γ的固定点,当命题集S{?瘙綈B,?瘙綈C,?瘙綈F}而S≠{?瘙綈B,?瘙綈F}时,Th(S)均非Γ的关于△的固定点。
例5.5设D=:MAA,B:MCC,F∧A:MEE,C∧E:M?瘙綈A,M(F∨A)G
W={B,C→F∨A,A∧C→?瘙綈E},那么有3个扩充: E1=Th(W∪{A,C}),E2=Th(W∪{A,E}),E3=Th(W∪{C,E,G})。以下仅对E1进行说明。由于Th(W∪{A,C})有?瘙綈E,从而Th(W∪{A,C})中没有E和G(因为ME和C∧E不能成立)。这就是说,D中缺省规则在算子Γ的计算过程中无一有用,因此Γ(Th(W∪{A,C}))=Th(W∪{A,C})。
上述例子说明,并非所有缺省理论都有扩充,并非有扩充的缺省理论只有的扩充。由此看来,缺省理论的扩充变幻莫测,但是,有了下述定理,它便清晰多了。这一定理还使我们有了一个验证扩充的工具。
定理5.1设E为一阶命题集,△=为一闭的缺省理论。递归定义Ei(i=1,2,3,…)如下:E0=W
Ei 1=Th(Ei)∪w|α:Mβ1,…,Mβmw∈D,α∈Ei,?瘙綈β1,…,?瘙綈βmE那么,E为△的一个扩充当且仅当 E=∪∞i=0Ei。
在缺省理论的语构研究方面已取得了许多成果,但它的语义研究困难重重,至今未见令人满意的语义结构被赋予这一十分有趣的推理理论。
5.2.3非单调逻辑系统
1978—1982年,McDermott和Doyle就非单调推理发表了好几篇很有影响的文章。他们把自己的系统称为非单调逻辑系统,这一系统建立基于一阶逻辑之上,并引进模态词M,用MA表示A与当前已推得的定理相容(注意,在这一点上与缺省推理理论相似)。
例5.6设理论T有以下3条公理:
(1) 正值中午∧M(出太阳) →出太阳。
(2) 正值中午。
(3) 日食→?瘙綈(出太阳)。
那么,在T中可证:
(4) 出太阳。
但是,如果把
(5) 日食
添作公理,那么由(3)和(5)推得?瘙綈(出太阳),这使得M(出太阳)不能成立,于是(4)不再可证。这与传统逻辑不同。如果把(1)改为
(1) ′正值中午→出太阳
那么在添入公理(5)时系统便不一致,从而一切公式全为系统的定理。
下文将介绍,由于在非单调逻辑中允许MA与一般命题一样使用(缺省推理中,MA只在缺省推理规则中出现),使它与缺省推理理论有许多根本的不同。
从上例看出,非单调逻辑系统的关键是M意义的规定。从语法角度规定,似乎可引入下列规则(从M的直观意义出发): 如果?瘙綈A,则MA(53)但这是不适当的,因为这样做等于把一切非定理的否定接受为定理,没有什么非单调可言。McDermott和Doyle的做法是,修改式(53)为如果?瘙綈A,则MA(54)这里的表示与不同的“推出”——非单调地推出,并如下规定的意义。
以下将加入模态词M的一阶谓词演算系统记为FC,将允许使用M的一阶公式全体记为LFC,对任何公式集 ΓLFC,Th(Γ)的意义是Th(Γ)={A|ΓFCA}定义5.7对任何公式集 ΓLFC定义算子NMΓ,对任意公式集SLFCNMΓ(S)=Th(Γ∪ASΓ(S))(55)其中称ASΓ为S的假设集ASΓ(S)={MQ|Q∈LFC∧?瘙綈QS}(56)令TH(Γ)=∩({LFC}∪{S|NMΓ(S)=S})(57)这里∩C={x|S(S∈C→x∈S)}。如果P∈TH(Γ),那么称P可由Γ非单调地推出(可证),并记为ΓP。
我们对TH(Γ)的定义式(57)解释如下。TH(Γ)可以说是 NMΓ 算子的所有固定点的交,当NMΓ无固定点时,TH(Γ)=∩({LFC})=LFC,即约定NMΓ无固定点时,TH(Γ)为全体FC公式的集合。
应当指出,算子NMΓ有固定点时,ΓP是指P在算子NMΓ的每一个固定点中。这与缺省推理理论不同,P在缺省理论△中“可证”,是指P属于△的某一扩充,即在算子的某一个固定点中。
例5.7设Γ=FC∪{MC→?瘙綈C}(FC指一阶逻辑的公理、规则,其中允许使用M。以下同),那么,NMΓ无固定点。设NMΓ(S)=S′,若?瘙綈CS,那么MC∈ASΓ(S),从而?瘙綈C∈S′;反之,若?瘙綈C∈S,那么MCASΓ(S),故?瘙綈CS′。这就是说,S′不可能等于S,NMΓ无固定点。
例5.8设Γ=FC∪{A∧MB→B,C∧MD→D,A∨C},那么NMΓ有的固定点,该固定点含有B∨D,因此有ΓB∨D。值得注意的是,当缺省理论△中D=A:MBB,C:MDD,W={A∨C}时,△也有扩充(Th(A∨C)),它不含B∨D。这一差别便是由非单调逻辑中把MB,MD与A,C等看作平等的命题造成的,这使它们能代入(A1→A3)∧(A2→A3)(A1∨A2→A3)之类的重言式。相反,缺省推理就没有这种“便利”。
评论
还没有评论。