描述
开 本: 32开纸 张: 胶版纸包 装: 平装-胶订是否套装: 否国际标准书号ISBN: 9787302467595丛书名: 高等院校信息管理与信息系统专业系列教材
本书可作为高等院校信息管理与信息系统专业、计算机专业、管理类专业本科生和研究生的教材,也可作为计算机应用开发人员的参考书。”
目录
第1章决策支持系统综述1
1.1决策支持系统的形成1
1.1.1管理信息系统1
1.1.2管理科学/运筹学3
1.1.3决策支持系统4
1.1.4专家系统5
1.1.5智能决策支持系统5
1.1.6数据仓库型决策支持系统7
1.1.7综合决策支持系统9
1.1.8网络型决策支持系统9
1.2决策支持系统的概念10
1.2.1决策问题的结构化分类10
1.2.2决策支持系统的定义11
1.2.3决策支持系统与管理科学/运筹学的关系12
1.2.4决策支持系统与管理信息系统的关系12
1.2.5几个典型的决策支持系统13
1.3决策科学与决策支持系统17
1.3.1决策与决策科学17
1.3.2决策过程与决策支持系统20
1.3.3决策体系与决策支持系统24
1.3.4决策支持系统的技术基础26
习题129
第2章决策资源与决策支持30
2.1决策资源30
2.1.1数据资源30
2.1.2模型资源32
2.1.3知识资源39
2.2决策支持44
2.2.1决策支持的概念44
2.2.2决策资源的决策支持44
2.2.3决策方案的决策支持50
2.3模型实验的决策支持51
2.3.1模型的建立与WhatIf分析52
2.3.2模型组的决策支持54
2.4模型组合方案的决策支持55
2.4.1经济优化方案的决策支持55
2.4.2产品优化方案的决策支持57
2.4.3多模型辅助决策系统61
习题262
第3章决策支持系统64
3.1决策支持系统结构64
3.1.1决策支持系统结构形式64
3.1.2决策支持系统的结构比较71
3.1.3决策支持系统统一的基本结构形式72
3.2决策支持系统的数据部件与综合部件73
3.2.1数据库系统在决策支持系统中的作用73
3.2.2人机交互与问题综合系统78
3.2.3决策支持系统的综合部件83
3.3模型库系统84
3.3.1模型库84
3.3.2模型库的组织和存储87
3.3.3模型库管理系统89
3.4组合模型的决策支持系统93
3.4.1模型组合技术93
3.4.2模型组合的程序设计95
3.4.3决策支持系统的决策支持96
3.5决策支持系统实例97
3.5.1物资申请和库存的计划汇总97
3.5.2制定物资的分配方案98
3.5.3物资调拨预处理99
3.5.4制定物资运输方案100
3.5.5制定物资调拨方案101
3.5.6物资分配调拨决策支持系统结构与决策支持101
3.5.7复杂化学系统多尺度模型实例104
习题3104
第4章智能决策支持系统106
4.1专家系统的决策支持106
4.1.1专家系统的原理106
4.1.2产生式规则专家系统108
4.1.3建模专家系统111
4.2神经网络的决策支持113
4.2.1神经网络原理113
4.2.2反向传播模型115
4.2.3神经网络专家系统及实例117
4.2.4神经网络的容错性121
4.3智能决策支持系统原理与实例123
4.3.1智能决策支持系统概念123
4.3.2智能决策支持系统结构124
4.3.3专家系统与决策支持系统的集成126
4.3.4智能决策支持系统实例128
习题4133
第5章数据仓库型决策支持系统135
5.1数据仓库基本原理135
5.1.1数据仓库的概念135
5.1.2数据仓库结构136
5.1.3元数据138
5.1.4数据仓库的存储139
5.1.5数据仓库系统141
5.2联机分析处理143
5.2.1基本概念143
5.2.2联机分析处理的决策支持: 多维数据分析149
5.2.3联机分析处理应用实例152
5.3数据仓库的决策支持153
5.3.1查询与报表154
5.3.2多维分析与原因分析155
5.3.3预测未来156
5.3.4实时决策156
5.3.5自动决策157
5.4数据挖掘157
5.4.1知识发现和数据挖掘的概念158
5.4.2数据挖掘的方法和技术159
5.4.3数据挖掘的知识表示163
5.5数据挖掘的决策支持165
5.5.1数据挖掘的决策支持分类165
5.5.2决策树的挖掘及其应用168
5.5.3关联规则及应用173
5.6数据仓库型决策支持系统178
5.6.1数据仓库型决策支持系统的原理和结构179
5.6.2数据仓库型决策支持系统简例180
5.6.3数据仓库型决策支持系统实例185
习题5188
第6章综合决策支持系统与网络型决策支持系统189
6.1智能决策支持系统与数据仓库型决策支持系统的开发技术189
6.1.1从基本决策支持系统到智能决策支持系统189
6.1.2智能决策支持系统的开发技术190
6.1.3数据仓库的关键技术191
6.2综合决策支持系统196
6.2.1智能决策支持系统与数据仓库型决策支持系统的特点比较196
6.2.2数据仓库与数学模型198
6.2.3综合决策支持系统原理、结构和定义199
6.3网络型决策支持系统201
6.3.1客户机/服务器结构与数据库服务器201
6.3.2网络型决策支持系统的原理205
6.3.3网络型决策支持系统体系207
习题6211
第7章云计算和大数据的决策支持212
7.1云计算的决策支持212
7.1.1云计算的兴起212
7.1.2云计算的IT服务216
7.1.3云计算的决策支持218
7.2大数据的决策支持220
7.2.1大数据时代的来临220
7.2.2从数据到决策的大数据时代221
7.2.3大数据的决策支持方式226
7.3从事物相关中决策与创新228
7.3.1寻找相关事物228
7.3.2科学发现中的相关性230
7.3.3从矛盾中决策和创新233
习题7237
第8章决策支持系统开发的计算思维238
8.1软件的计算思维238
8.1.1计算思维的概念238
8.1.2软件进化中的计算思维241
8.2决策支持系统开发的计算思维251
8.2.1决策支持系统开发过程的计算思维251
8.2.2决策支持系统的实现技术257
8.2.3数据仓库开发过程的计算思维261
8.3决策支持系统开发工具与实例的计算思维266
8.3.1网络型决策支持系统快速开发平台CSDSSP266
8.3.2网络型决策支持系统实例274
8.3.3网络型决策支持系统的分析对比277
习题8278
附录A各章习题中部分问答题参考答案279
附录B部分章习题中设计题和计算题答案295
在多维数据模型中,一部分数据是数量值,如销售量、投资额、收入等。而这些数量值是依赖于一组“维”的,这些维提供了数量值的上下文关系。例如,销售量与城市、商品名称、销售时间有关,这些相关的维唯一决定了这个销售数量值。因此,多维数据视图就是这些由多个维构成的多维空间中存放着数量值。数据仓库数据的存储示意图如图5.4所示,图中的小格内存储的数据可以假设为商品的销售量。多维数据模型的另一个特点是对一个或多个维所做的集合运算。例如,对总销售量按城市进行统计和排序。这些运算还包括对于同样维所限定的数量值的比较(如销售与预算)。一般来说,时间维是一个有特殊意义的维,它对决策中的趋势分析很重要。对于逻辑上的多维数据模型,可以使用不同的存储机制和表示模式来实现多维数据模型。目前,使用的多维数据模型主要有星形模型、雪花模型、星网模型等。1. 星形模型大多数的数据仓库都采用“星形模型”。星形模型是由“事实表”(大表)以及多个“维表”(小表)所组成。“事实表”中存放大量关于企业的事实数据(数量数据)。通常都很大,而且非规范化程度很高。例如,多个时期的数据可能会出现在同一个表中。“维表”中存放描述性数据,维表是围绕事实表建立的较小的表。图5.5所示的是一个星形数据模型实例。图5.5星形数据模型实例事实表有大量的行(记录),然而维表相对来说有较少的行(记录)。星形模型存取数据速度快,主要在于针对各个维做了大量的预处理,如按照维进行预先的统计、分类、排序等,如按照汽车的型号、颜色、代理商进行预先的销售量统计,作报表时速度会很快。2. 雪花模型雪花模型是对星形模型的扩展,雪花模型对星形模型的维表进一步层次化,原来的各维表可能被扩展为小的事实表,形成一些局部的“层次”区域。它的优点是最大限度地减少数据存储量,以及把较小的维表联合在一起来改善查询性能。在上面星形模型的数据中,对“产品表”“日期表”“地区表”进行扩展形成雪花模型数据,如图5.6所示。使用数据仓库的工具完成一些简单的二维或三维查询,既满足了用户对复杂的数据仓库查询的需求,又能够完成一些简单查询功能而不用访问过多的数据。图5.6雪花数据模型实例3. 星网模型星网模型是将多个星形模型连接起来形成网状结构。多个星形模型通过相同的维,如时间维,连接多个事实表。5.1.5数据仓库系统数据仓库系统由数据仓库、仓库管理和分析工具3部分组成,其结构形式如图5.7所示。图5.7数据仓库系统结构图数据仓库的数据来源于多个数据源。源数据包括企业内部数据、市场调查报告以及各种文档之类的外部数据。1. 数据仓库管理系统在确定数据仓库信息需求之后,首先进行数据建模,确定从源数据到数据仓库的数据抽取、清理和转换过程,划分维数以及确定数据仓库的物理存储结构。元数据是数据仓库的核心,它用于存储数据模型,定义数据结构、转换规划、仓库结构、控制信息等。仓库的管理包括对数据的安全、归档、备份、维护、恢复等工作,这些工作需通过数据仓库管理系统(DWMS)来完成。数据仓库管理系统由以下几部分组成。1) 定义部分定义部分用于定义和建立数据仓库系统。它包括设计和定义数据仓库的数据库、定义数据来源、确定从源数据向数据仓库复制数据时的清理和增强规则。2) 数据获取部分该部件把数据从源数据中提取出来,依定义部件的规则,抽取、转换和装载数据进入数据仓库。3) 管理部分它用于管理数据仓库的工作,包括对数据仓库中数据的管理、将仓库数据取出给分布的DSS用户、对仓库数据的安全、归档、备份、恢复等处理工作。4) 目录部分数据仓库的目录数据是元数据,由以下3方面组成。(1) 技术目录: 由定义部分生成,关于数据源、目标、清理规则、变换规则以及数据源和仓库之间的映像信息。(2) 业务目录: 由仓库管理员生成,包括仓库数据的来源及当前值、预定义的查询和报表细节、合法性要求等。(3) 信息引导器: 使用户容易访问仓库数据。包括查询和引导功能,利用固定查询或建立新的查询,生成暂时的或永久的仓库数据集合的能力等。该部分是数据仓库使用能力的关键因素。5) 数据库管理系统部分数据仓库的存储形式仍为关系型数据库,因此需要利用数据库管理系统。由于数据仓库含大量的数据,要求数据库管理系统产品提供高速性能。2. 数据仓库工具集由于数据仓库的数据量大,必须有一套功能很强的分析工具集来实现从数据仓库中提供辅助决策的信息,完成决策支持的各种要求。分析工具集包括以下两类工具。1) 查询工具数据仓库的查询不是指对记录级数据的查询,而是指对分析要求的查询。一般包括以下两类工具。(1) 可视化工具: 以图形化方式展示数据,可以帮助了解数据的结构、关系以及动态性。(2) 多维分析工具(OLAP工具): 通过对信息的多种可能的观察形式进行快速、一致和交互性的存取,这样便于用户对数据进行深入的分析和观察。多维数据的每一维代表对数据的一个特定的观察视角,如时间、地域、商品等。2) 挖掘工具从大量数据中挖掘具有规律性的知识,需要利用数据挖掘(Data Mining)工具。3. 数据仓库的运行结构数据仓库应用是一个典型的客户/服务器(C/S)结构形式。数据仓库采用服务器结构,客户端所做的工作有: 客户交互、格式化查询、结果显示、报表生成等。服务器端完成各种辅助决策的SQL查询、复杂的计算和各类综合功能等。现在,越来越普通的一种形式是3层C/S结构形式,即在客户与数据仓库服务器之间增加一个多维数据分析服务器,如图5.8所示。图5.8数据仓库应用的3层C/S结构多维数据分析服务器将加强和规范化决策支持的服务工作,集中和简化了原客户端和数据仓库服务器的部分工作,降低了系统数据传输量。这种结构形式工作效率更高。5.2联机分析处理联机分析处理(On Line Analytical Processing,OLAP)的概念最早是由关系数据库之父E.F.Codd于1993年提出的。当时,Codd认为随着企业数据量的急剧增加,联机事务处理已经不能满足终端用户对数据库查询分析的需要,决策分析需要对关系数据库进行大量的计算才能得到结果,而且查询的结果并不能满足决策者所提出的问题。因此Codd提出了多维数据库和多维分析的概念,即多维数据分析的概念。在数据仓库系统中,联机分析处理是重要的数据分析工具,它的基本思想是企业的决策者应能灵活地操纵企业的数据,从多方面和多角度以多维的形式来观察企业的状态和了解企业的变化。5.2.1基本概念近十几年来,人们利用信息技术生产和收集数据的能力大幅度提高,大量的数据库被用于商业管理、政府办公、科学研究和工程开发等,这一势头仍将持续发展下去。于是,一个新的挑战被提了出来: 在信息爆炸时代,如何才能不被信息的汪洋大海所淹没,从中及时发现有用的知识或者规律,提高信息利用率呢?要想使数据真正成为一个决策资源,只有充分利用它为一个组织的业务决策和战略发展服务才行,否则大量的数据可能成为包袱,甚至成为垃圾。联机分析处理是解决这类问题的最有力工具之一。联机分析处理专门设计用于支持复杂的分析操作,侧重对分析人员和高层管理人员的要求,快速、灵活地进行大数据量的复杂查询处理,并且以一种直观易懂的形式将查询结果提供给决策制定人,以便他们准确掌握企业(公司)的经营状况,了解市场需求,制定正确方案,增加效益。联机分析处理软件以它先进的分析功能和多维形式提供数据的能力,正作为一种支持企业关键商业决策的解决方案而迅速崛起。1. 联机分析处理的定义在决策活动中,决策人员需要的数据往往不是单一指标的值,他们希望能够从多个角度观察某个指标或者某个值,或者找出这些指标之间的关系。例如,决策者可能想知道“东北地区和西南地区今年一季度和去年一季度在销售总额上的对比情况,并且销售额按10万~50万元、50万~100万元,以及100万元以上分组”。上面的问题是比较有代表性的,决策所需数据总是与一些统计指标如销售总额、观察角度(如销售区域、时间)和不同级别的统计有关,我们将这些观察数据的角度称之为维。可以说决策数据是多维数据,多维数据分析是决策分析的主要内容。但传统的关系数据库系统及其查询工具对于管理和应用这样复杂的数据显得力不从心。联机分析处理是在联机事务处理的基础上发展起来的,联机事务处理是以数据库为基础的,面对的是操作人员和低层管理人员,在网络上对基本数据的查询和增、删、改等进行处理。而联机分析处理是以数据仓库为基础的数据分析处理。它有两个特点: 一是在线联机(On Line),体现为对用户请求的快速响应和交互式操作,它的实现是由客户机/服务器这种体系结构来完成的;二是多维分析(Multidimension Analysis),这也是联机分析处理的核心所在。联机分析处理超越了联机事务处理的查询和报表的功能,它的决策支持能力更强。在多维数据环境中,联机分析处理为终端用户提供了复杂的数据分析功能。通过联机分析处理,高层管理人员能够通过浏览、分析数据去发现数据的变化趋势、特征以及一些潜在的信息,从而更好地帮助他们了解商业活动的变化。目前,比较普遍接受的联机分析处理的定义有两种。1) 联机分析处理理事会给出的定义联机分析处理是一种软件技术,它使分析人员能够迅速、一致、交互地从各个方面(维,即坐标)观察信息,以达到深入理解数据的目的。这些信息是从原始数据转换过来的,按照用户的理解,它反映了企业真实的方方面面(多维)。企业用户的观点要求数据是多维的。拿销售来说,不仅可从生产这方面看,还与地点、时间等有关,这就是为什么要求联机分析处理模型是多维的原因。这种多维用户视图通过一种更为直观的分析模型进行分析和设计。联机分析处理的大部分策略都是将关系型的或普通的数据进行多维数据存储,以便于进行分析,从而达到联机分析处理的目的。这种多维数据库,也被看成超立方体。沿着各个维方向存储数据,它允许用户沿事物的维的要求能方便地分析数据。2) 联机分析处理的简单定义近年来,随着人们对联机分析处理理解的不断深入,有些学者提出了更为简要的定义,第3版前言决策支持系统在于实现科学决策。它和管理信息系统、专家系统构成了信息系统的三大支柱。管理信息系统是社会中管理领域的基础技术,使计算机走向了社会;专家系统使人工智能走向了实用,奠定了人工智能发展的基础;决策支持系统是决策科学的基础,为科学决策提供了有力支撑。决策支持系统从兴起到现在共三十多年的发展,已经历了基本决策支持系统、智能决策支持系统、数据仓库型决策支持系统、综合决策支持系统和网络型决策支持系统5个阶段。基本决策支持系统以模型库系统为核心,以多模型和数据库的组合形成方案辅助决策,开创了用计算机技术实现科学决策的时代。智能决策支持系统把基本决策支持系统和专家系统结合起来,提高了辅助决策的效果。专家系统的概念比决策支持系统的概念出现得更早和更成熟,实质上起到了代替人类专家进行决策的效果,以定性方式辅助决策。基本决策支持系统是在运筹学单模型辅助决策的基础上发展起来的,突出的是定量方式辅助决策。智能决策支持系统强化了定量和定性相结合的辅助决策的效果。数据仓库型决策支持系统是20世纪90年代兴起的,以数据仓库的大量数据为基础,结合多维数据分析以及数据挖掘技术,起到了有效的辅助决策效果。当时这股旋风有代替传统决策支持系统(智能决策支持系统)的势头。但是,它和传统决策支持系统走的两条路不可能覆盖。因此,把数据仓库型决策支持系统和智能决策支持系统结合起来的综合决策支持系统成为了决策支持系统发展新方向。目前,在开发的数据仓库型决策支持系统中,也在通过逐渐增加数学模型来提高辅助决策的效果。随着互联网技术的发展,网络型决策支持系统随之兴起。数据仓库型决策支持系统的数据仓库和数据挖掘都已经以服务器形式在网络上提供服务了。目前,各类数据库也已经采用服务器形式,再使模型库和知识库也以服务器形式在网络上提供服务,这样自然就形成了网络型决策支持系统。网络的最大好处就在于,它能为大家提供大量的共享资源,包括决策资源(模型、知识、数据等),这就会为开发决策支持系统带来极大的便利。开发者只需在自己的客户端上按决策问题的要求,编制总控制程序,调用网络上所需要的决策资源,组合成解决问题的方案,并在网络上运行,即可完成网络型决策支持系统的辅助决策。这种新技术对于改变方案或者提出多个方案都是很容易完成的。它为决策支持系统的发展起了极大的推动作用。本书较第2版增加了云计算与大数据的决策支持内容。云计算为存储大数据提供了支持,为分析大数据提供了工具。大数据是为决策服务的,不但为领导者提供决策支持,也开创了为个人提供决策支持,从而开创了决策支持新时代。本书对第2版中技术性较强的内容做了较大的压缩和修改,使内容更通俗易懂。书中增加了各章的部分习题答案。这些答案涉及决策支持系统与计算机有关的知识。附录A是思考题的参考答案,起到开拓思路的作用;附录B是设计题和计算题的答案。希望学生通过“决策支持系统”课程的学习,能够自行设计决策支持系统方案,即能够画出决策支持系统流程图,特别是总控制流程是如何调用模型和数据组成方案的。这样,学生就基本上掌握了决策支持系统的原理与应用。 本书作者从1987年开始到现在一直从事决策支持系统(DSS)的研究和开发,得到国家863计划、“八五”“九五”“十五”等国防预研项目和国家自然科学基金项目的资助,并取得了一系列的科研成果: 1989年研制出“决策支持系统开发工具(GFKDDSS)”和“专家系统工具(TOES)”;1995年研制出“分布式多媒体智能决策支持系统开发平台(DMIDSSP)”;1999年研制出“基于客户机/服务器的决策支持系统快速开发平台(CSDSSP)”。这样,GFKDDSS工具的单机上的模型库系统上升到网络上的CSDSSP平台的广义模型服务器,从而可以在网络上为多个客户端提供模型服务和知识服务;GFKDDSS工具的集成语言编制DSS总控程序,上升到网络上客户端的可视化系统生成工具,能够快速地制作应用系统的框架流程,既能够可视化运行应用系统,又可快速改变系统方案,大大提高了决策支持效果。我们又利用Web Services技术,在异构环境下(开发语言差异、平台差异、通信协议差异和数据表示差异),开发了新的网络型决策支持系统,这使得DSS的开发不受异构环境的影响,使决策支持能力更强。我们在研究云计算和大数据时,不但感觉到大数据对国家和大企业决策的重要性,也感觉到大数据对个人决策的价值,这主要体现在相关信息对于个人决策时的作用。三十多年来在决策支持系统的研究中,参加科研项目并做出贡献的有陈亮、张明安、罗端红、陆飙、杨桂聪、曹泽文、赵东升、胡爱国、黄金才、赵新昱、何义、钟鸣、邹雯、马建军、赛英、高人伯、赵健、刘钢等同志和廖建文老师。他们的工作丰富了本书的内容,也深化了对决策支持系统的论识。我和他们共同为我国决策支持系统的发展,做出了积极的贡献。清华大学出版社对本书的出版给予了极大支持,在此表示感谢。
陈文伟2017年1月
在多维数据模型中,一部分数据是数量值,如销售量、投资额、收入等。而这些数量值是依赖于一组“维”的,这些维提供了数量值的上下文关系。例如,销售量与城市、商品名称、销售时间有关,这些相关的维唯一决定了这个销售数量值。因此,多维数据视图就是这些由多个维构成的多维空间中存放着数量值。数据仓库数据的存储示意图如图5.4所示,图中的小格内存储的数据可以假设为商品的销售量。多维数据模型的另一个特点是对一个或多个维所做的集合运算。例如,对总销售量按城市进行统计和排序。这些运算还包括对于同样维所限定的数量值的比较(如销售与预算)。一般来说,时间维是一个有特殊意义的维,它对决策中的趋势分析很重要。对于逻辑上的多维数据模型,可以使用不同的存储机制和表示模式来实现多维数据模型。目前,使用的多维数据模型主要有星形模型、雪花模型、星网模型等。1. 星形模型大多数的数据仓库都采用“星形模型”。星形模型是由“事实表”(大表)以及多个“维表”(小表)所组成。“事实表”中存放大量关于企业的事实数据(数量数据)。通常都很大,而且非规范化程度很高。例如,多个时期的数据可能会出现在同一个表中。“维表”中存放描述性数据,维表是围绕事实表建立的较小的表。图5.5所示的是一个星形数据模型实例。图5.5星形数据模型实例事实表有大量的行(记录),然而维表相对来说有较少的行(记录)。星形模型存取数据速度快,主要在于针对各个维做了大量的预处理,如按照维进行预先的统计、分类、排序等,如按照汽车的型号、颜色、代理商进行预先的销售量统计,作报表时速度会很快。2. 雪花模型雪花模型是对星形模型的扩展,雪花模型对星形模型的维表进一步层次化,原来的各维表可能被扩展为小的事实表,形成一些局部的“层次”区域。它的优点是最大限度地减少数据存储量,以及把较小的维表联合在一起来改善查询性能。在上面星形模型的数据中,对“产品表”“日期表”“地区表”进行扩展形成雪花模型数据,如图5.6所示。使用数据仓库的工具完成一些简单的二维或三维查询,既满足了用户对复杂的数据仓库查询的需求,又能够完成一些简单查询功能而不用访问过多的数据。图5.6雪花数据模型实例3. 星网模型星网模型是将多个星形模型连接起来形成网状结构。多个星形模型通过相同的维,如时间维,连接多个事实表。5.1.5数据仓库系统数据仓库系统由数据仓库、仓库管理和分析工具3部分组成,其结构形式如图5.7所示。图5.7数据仓库系统结构图数据仓库的数据来源于多个数据源。源数据包括企业内部数据、市场调查报告以及各种文档之类的外部数据。1. 数据仓库管理系统在确定数据仓库信息需求之后,首先进行数据建模,确定从源数据到数据仓库的数据抽取、清理和转换过程,划分维数以及确定数据仓库的物理存储结构。元数据是数据仓库的核心,它用于存储数据模型,定义数据结构、转换规划、仓库结构、控制信息等。仓库的管理包括对数据的安全、归档、备份、维护、恢复等工作,这些工作需通过数据仓库管理系统(DWMS)来完成。数据仓库管理系统由以下几部分组成。1) 定义部分定义部分用于定义和建立数据仓库系统。它包括设计和定义数据仓库的数据库、定义数据来源、确定从源数据向数据仓库复制数据时的清理和增强规则。2) 数据获取部分该部件把数据从源数据中提取出来,依定义部件的规则,抽取、转换和装载数据进入数据仓库。3) 管理部分它用于管理数据仓库的工作,包括对数据仓库中数据的管理、将仓库数据取出给分布的DSS用户、对仓库数据的安全、归档、备份、恢复等处理工作。4) 目录部分数据仓库的目录数据是元数据,由以下3方面组成。(1) 技术目录: 由定义部分生成,关于数据源、目标、清理规则、变换规则以及数据源和仓库之间的映像信息。(2) 业务目录: 由仓库管理员生成,包括仓库数据的来源及当前值、预定义的查询和报表细节、合法性要求等。(3) 信息引导器: 使用户容易访问仓库数据。包括查询和引导功能,利用固定查询或建立新的查询,生成暂时的或永久的仓库数据集合的能力等。该部分是数据仓库使用能力的关键因素。5) 数据库管理系统部分数据仓库的存储形式仍为关系型数据库,因此需要利用数据库管理系统。由于数据仓库含大量的数据,要求数据库管理系统产品提供高速性能。2. 数据仓库工具集由于数据仓库的数据量大,必须有一套功能很强的分析工具集来实现从数据仓库中提供辅助决策的信息,完成决策支持的各种要求。分析工具集包括以下两类工具。1) 查询工具数据仓库的查询不是指对记录级数据的查询,而是指对分析要求的查询。一般包括以下两类工具。(1) 可视化工具: 以图形化方式展示数据,可以帮助了解数据的结构、关系以及动态性。(2) 多维分析工具(OLAP工具): 通过对信息的多种可能的观察形式进行快速、一致和交互性的存取,这样便于用户对数据进行深入的分析和观察。多维数据的每一维代表对数据的一个特定的观察视角,如时间、地域、商品等。2) 挖掘工具从大量数据中挖掘具有规律性的知识,需要利用数据挖掘(Data Mining)工具。3. 数据仓库的运行结构数据仓库应用是一个典型的客户/服务器(C/S)结构形式。数据仓库采用服务器结构,客户端所做的工作有: 客户交互、格式化查询、结果显示、报表生成等。服务器端完成各种辅助决策的SQL查询、复杂的计算和各类综合功能等。现在,越来越普通的一种形式是3层C/S结构形式,即在客户与数据仓库服务器之间增加一个多维数据分析服务器,如图5.8所示。图5.8数据仓库应用的3层C/S结构多维数据分析服务器将加强和规范化决策支持的服务工作,集中和简化了原客户端和数据仓库服务器的部分工作,降低了系统数据传输量。这种结构形式工作效率更高。5.2联机分析处理联机分析处理(On Line Analytical Processing,OLAP)的概念最早是由关系数据库之父E.F.Codd于1993年提出的。当时,Codd认为随着企业数据量的急剧增加,联机事务处理已经不能满足终端用户对数据库查询分析的需要,决策分析需要对关系数据库进行大量的计算才能得到结果,而且查询的结果并不能满足决策者所提出的问题。因此Codd提出了多维数据库和多维分析的概念,即多维数据分析的概念。在数据仓库系统中,联机分析处理是重要的数据分析工具,它的基本思想是企业的决策者应能灵活地操纵企业的数据,从多方面和多角度以多维的形式来观察企业的状态和了解企业的变化。5.2.1基本概念近十几年来,人们利用信息技术生产和收集数据的能力大幅度提高,大量的数据库被用于商业管理、政府办公、科学研究和工程开发等,这一势头仍将持续发展下去。于是,一个新的挑战被提了出来: 在信息爆炸时代,如何才能不被信息的汪洋大海所淹没,从中及时发现有用的知识或者规律,提高信息利用率呢?要想使数据真正成为一个决策资源,只有充分利用它为一个组织的业务决策和战略发展服务才行,否则大量的数据可能成为包袱,甚至成为垃圾。联机分析处理是解决这类问题的最有力工具之一。联机分析处理专门设计用于支持复杂的分析操作,侧重对分析人员和高层管理人员的要求,快速、灵活地进行大数据量的复杂查询处理,并且以一种直观易懂的形式将查询结果提供给决策制定人,以便他们准确掌握企业(公司)的经营状况,了解市场需求,制定正确方案,增加效益。联机分析处理软件以它先进的分析功能和多维形式提供数据的能力,正作为一种支持企业关键商业决策的解决方案而迅速崛起。1. 联机分析处理的定义在决策活动中,决策人员需要的数据往往不是单一指标的值,他们希望能够从多个角度观察某个指标或者某个值,或者找出这些指标之间的关系。例如,决策者可能想知道“东北地区和西南地区今年一季度和去年一季度在销售总额上的对比情况,并且销售额按10万~50万元、50万~100万元,以及100万元以上分组”。上面的问题是比较有代表性的,决策所需数据总是与一些统计指标如销售总额、观察角度(如销售区域、时间)和不同级别的统计有关,我们将这些观察数据的角度称之为维。可以说决策数据是多维数据,多维数据分析是决策分析的主要内容。但传统的关系数据库系统及其查询工具对于管理和应用这样复杂的数据显得力不从心。联机分析处理是在联机事务处理的基础上发展起来的,联机事务处理是以数据库为基础的,面对的是操作人员和低层管理人员,在网络上对基本数据的查询和增、删、改等进行处理。而联机分析处理是以数据仓库为基础的数据分析处理。它有两个特点: 一是在线联机(On Line),体现为对用户请求的快速响应和交互式操作,它的实现是由客户机/服务器这种体系结构来完成的;二是多维分析(Multidimension Analysis),这也是联机分析处理的核心所在。联机分析处理超越了联机事务处理的查询和报表的功能,它的决策支持能力更强。在多维数据环境中,联机分析处理为终端用户提供了复杂的数据分析功能。通过联机分析处理,高层管理人员能够通过浏览、分析数据去发现数据的变化趋势、特征以及一些潜在的信息,从而更好地帮助他们了解商业活动的变化。目前,比较普遍接受的联机分析处理的定义有两种。1) 联机分析处理理事会给出的定义联机分析处理是一种软件技术,它使分析人员能够迅速、一致、交互地从各个方面(维,即坐标)观察信息,以达到深入理解数据的目的。这些信息是从原始数据转换过来的,按照用户的理解,它反映了企业真实的方方面面(多维)。企业用户的观点要求数据是多维的。拿销售来说,不仅可从生产这方面看,还与地点、时间等有关,这就是为什么要求联机分析处理模型是多维的原因。这种多维用户视图通过一种更为直观的分析模型进行分析和设计。联机分析处理的大部分策略都是将关系型的或普通的数据进行多维数据存储,以便于进行分析,从而达到联机分析处理的目的。这种多维数据库,也被看成超立方体。沿着各个维方向存储数据,它允许用户沿事物的维的要求能方便地分析数据。2) 联机分析处理的简单定义近年来,随着人们对联机分析处理理解的不断深入,有些学者提出了更为简要的定义,
评论
还没有评论。