描述
开 本: 16开纸 张: 胶版纸包 装: 平装是否套装: 否国际标准书号ISBN: 9787111483403丛书名: 数据分析技术丛书
编辑推荐
《深入解析SAS:数据处理、分析优化与商业应用》
SAS软件研究开发(北京)有限公司资深技术人员经验结晶,SAP大中国区商业创新首席架构师鲁百年强烈推荐。
实战性强,结合商业案例细致呈现SAS的优化建模方法,深入讲解SAS数据处理、统计分析及时间序列,涵盖引领大数据潮流的SAS高性能分析,以及智能分析平台、解决方案、平台的安全性与高可用性等重要领域。
更多精彩,点击进入华章品牌店查阅>>
内容简介
《深入解析SAS:数据处理、分析优化与商业应用》是国内市场目前一本由SAS公司在中国的员工创作、全面系统地剖析SAS技术的著作。作者团队结合自身实际工作的经验体会和大量生动的实践案例,通俗易懂、循序渐进地对SAS的核心技术模块和架构体系进行了全方位的介绍、总结与分享,帮助读者深刻领会和掌握使用SAS进行数据挖掘与优化的专业知识,同时培养读者运用这些专业知识解决商业问题和实施商业项目的能力。
《深入解析SAS:数据处理、分析优化与商业应用》共28章,分为四个部分:SAS编程(第1~8章)系统介绍了运用SAS进行数据读入、处理和展现等内容,掌握这一部分内容可以满足大部分实际项目中数据处理的需要;SAS统计分析和时间序列预测(第9~18章)全面介绍了多种常见统计方法的基本原理和利用SAS去实现的具体技术,包括描述性统计分析、参数估计与假设检验、方差分析、主成分分析与因子分析、聚类分析、判别分析、回归分析、时间序列分析等,并给出了相应的实践案例,从而让熟悉统计理论的读者有能力将其应用到实际中去;SAS优化建模(第19~24章)对于从事优化的读者来说,将是很好的帮助。这一部分主要介绍了运用SAS/OR建模,以及求解线性规划、混合整数规划问题的方法及实例,通过对常见的优化问题进行全面的阐述,帮助读者掌握优化思路和技巧;SAS商业应用(第25~28章)从项目实施角度探讨了如何设计满足安全性、高可用性和高性能需求的SAS应用,让读者领会解决实际问题的方法。
《深入解析SAS:数据处理、分析优化与商业应用》共28章,分为四个部分:SAS编程(第1~8章)系统介绍了运用SAS进行数据读入、处理和展现等内容,掌握这一部分内容可以满足大部分实际项目中数据处理的需要;SAS统计分析和时间序列预测(第9~18章)全面介绍了多种常见统计方法的基本原理和利用SAS去实现的具体技术,包括描述性统计分析、参数估计与假设检验、方差分析、主成分分析与因子分析、聚类分析、判别分析、回归分析、时间序列分析等,并给出了相应的实践案例,从而让熟悉统计理论的读者有能力将其应用到实际中去;SAS优化建模(第19~24章)对于从事优化的读者来说,将是很好的帮助。这一部分主要介绍了运用SAS/OR建模,以及求解线性规划、混合整数规划问题的方法及实例,通过对常见的优化问题进行全面的阐述,帮助读者掌握优化思路和技巧;SAS商业应用(第25~28章)从项目实施角度探讨了如何设计满足安全性、高可用性和高性能需求的SAS应用,让读者领会解决实际问题的方法。
目 录
前言
篇 SAS编程和数据处理
第1章 Base SAS基础
1.1 SAS系统简介
1.2 启动SAS软件
1.2.1 SAS窗口环境模式
1.2.2 非交互模式
1.2.3 批处理模式
1.2.4 交互式行模式
1.2.5 配置文件和AUTOEXEC文件
1.3 SAS窗口环境
1.3.1 SAS资源管理器
1.3.2 程序编辑器
1.3.3 日志
1.3.4 结果
1.3.5 输出
1.4 SAS文件和逻辑库
1.5 一个简单的SAS程序
1.6 SAS Studio
1.7 本章小结
第2章 读取外部数据到SAS数据集
2.1 SAS编程基本概念
2.1.1 SAS逻辑库
2.1.2 SAS数据集
2.1.3 SAS逻辑库和数据集管理
2.1.4 SAS系统选项
2.1.5 SAS程序结构
2.2 通过DATA步读取数据
2.2.1 DATA步处理
2.2.2 读取外部文本文件中的数据(初级)
2.2.3 读取外部文本文件中的数据(高级)
2.3 通过IMPORT过程读取外部文件数据
2.4 访问关系型数据库系统中的数据
2.5 SAS程序错误及处理
2.5.1 良好的SAS编程风格
2.5.2 常见错误及处理
2.6 本章小结
……
第3章 对单个数据集的处理
第4章 对多个数据集的处理
第5章 数据汇总与展现
第6章 SAS SQL语言
第7章 SAS宏语言
第8章 开发多语言支持的SAS程序
第二篇 SAS统计分析和时间序列预测
第9章 描述性统计分析
第10章 参数估计与假设检验
第11章 方差分析
第12章 主成分分析与因子分析
第13章 聚类分析
第14章 判别分析
第15章 回归分析
第16章 LOGISTIC回归分析
第17章 时间序列分析
第18章 SAS数据挖掘的—般流程
第三篇 SAS优化建模
第19章 运筹学概述
第20章 线性规划
第21章 运用PROC OPTMODEL建立线性规划模型
第22章 PROC OPTMODEL程序设计
第23章 整数线性规划和混合整数线性规划
第24章 优化建模实例
第四篇 SAS智能平台架构体系
第25章 SAS智能平台及行业解决方案
第26章 SAS应用的架构规划
第27章 SAS智能平台安全管理
第28章 SAS智能平台的高可用性
篇 SAS编程和数据处理
第1章 Base SAS基础
1.1 SAS系统简介
1.2 启动SAS软件
1.2.1 SAS窗口环境模式
1.2.2 非交互模式
1.2.3 批处理模式
1.2.4 交互式行模式
1.2.5 配置文件和AUTOEXEC文件
1.3 SAS窗口环境
1.3.1 SAS资源管理器
1.3.2 程序编辑器
1.3.3 日志
1.3.4 结果
1.3.5 输出
1.4 SAS文件和逻辑库
1.5 一个简单的SAS程序
1.6 SAS Studio
1.7 本章小结
第2章 读取外部数据到SAS数据集
2.1 SAS编程基本概念
2.1.1 SAS逻辑库
2.1.2 SAS数据集
2.1.3 SAS逻辑库和数据集管理
2.1.4 SAS系统选项
2.1.5 SAS程序结构
2.2 通过DATA步读取数据
2.2.1 DATA步处理
2.2.2 读取外部文本文件中的数据(初级)
2.2.3 读取外部文本文件中的数据(高级)
2.3 通过IMPORT过程读取外部文件数据
2.4 访问关系型数据库系统中的数据
2.5 SAS程序错误及处理
2.5.1 良好的SAS编程风格
2.5.2 常见错误及处理
2.6 本章小结
……
第3章 对单个数据集的处理
第4章 对多个数据集的处理
第5章 数据汇总与展现
第6章 SAS SQL语言
第7章 SAS宏语言
第8章 开发多语言支持的SAS程序
第二篇 SAS统计分析和时间序列预测
第9章 描述性统计分析
第10章 参数估计与假设检验
第11章 方差分析
第12章 主成分分析与因子分析
第13章 聚类分析
第14章 判别分析
第15章 回归分析
第16章 LOGISTIC回归分析
第17章 时间序列分析
第18章 SAS数据挖掘的—般流程
第三篇 SAS优化建模
第19章 运筹学概述
第20章 线性规划
第21章 运用PROC OPTMODEL建立线性规划模型
第22章 PROC OPTMODEL程序设计
第23章 整数线性规划和混合整数线性规划
第24章 优化建模实例
第四篇 SAS智能平台架构体系
第25章 SAS智能平台及行业解决方案
第26章 SAS应用的架构规划
第27章 SAS智能平台安全管理
第28章 SAS智能平台的高可用性
媒体评论
SAS引领大数据时代的发展,产品线覆盖了数据分析的各个方面,包括高性能分析、可视化分析和云计算等诸多新领域。但是从何处开始学习SAS、如何在实际工作中使用和部署SAS,却让很多初学者感到困惑,这时如果有长期使用SAS的专业人员把他们的宝贵经验分享出来,将会给大家更多的指导和帮助。而本书的几位作者恰好具有优秀的专业背景和丰富的SAS实践经验,其中,夏坤庄先生有5年多的时间在客户一线从事SAS产品咨询和项目实施工作;且在近的9年中,他作为SAS研发北京中心客户职能部的总监,在进行产品研发的同时还在对SAS全球客户提供技术支持。而其他几位作者作为夏坤庄先生的同事,同样有着丰富的实践经验。本书的实战指导性非常强,它的结构体现了SAS核心内容的学习路线图,内容包括了SAS的核心技术模块乃至整体架构体系,并运用了很多源自实际应用的案例,非常适合广大数据分析从业者的需要。
—— 刘政博士,SAS软件研究开发(北京)有限公司总经理
我与本书作者之一夏坤庄先生在我行的一个大型项目中有着成功的合作。合作过程中,夏坤庄展现出了卓越的专业能力、项目把握能力及一丝不苟的敬业精神,以至于我团队中那些昔日的成员即使现在已身为分行或支行的行长,仍然会尊敬地回忆当年的夏工是如何手把手教导他们设计和开发的。现在,夏坤庄及其团队通过本书将他们丰富的知识和成功经验进行了总结和提炼,在对简单和优美的追求中,完成了对SAS系统的完整和深入介绍,满足了复杂的数据分析和大数据应用时代的要求。本书是不可错过的优美之作!
—— 张晓波,中国工商银行软件开发中心上海研发支持部总经理、《计算机上的银行》作者
大数据时代的核心是数据的分析和利用,分析利用的关键是模型和挖掘。本书不但通俗易懂地向大家介绍了数据分析的方法和应用案例,而且通过对 SAS高性能及SAS应用架构规划的解析,对如何将数据分析的方法和应用部署到大数据环境中,满足海量数据和大规模运算的要求做了清楚的介绍。是一本难得的好书!
—— 鲁百年博士,SAP大中国区商业创新首席架构师
本书将统计分析和SAS应用成功地结合在了一起,既能够让熟悉统计理论的学习者有信心和能力将统计方法应用到现实中去,也能够让熟悉SAS的人有底气和理论高度在商业环境中选择和运用统计的分析方法。尤为难得的是,本书涵盖了预测及优化的丰富内容,并且结合复杂生动的案例对理论和方法进行了阐述。无论是对数据分析和SAS的初学者来说,还是对有不错基础的从业人员来说,本书都是很好的学习材料!
—— 赵彦云博士,中国人民大学统计学院院长、中国人民大学竞争力与评价研究中心主任
中国统计学会副会长
—— 刘政博士,SAS软件研究开发(北京)有限公司总经理
我与本书作者之一夏坤庄先生在我行的一个大型项目中有着成功的合作。合作过程中,夏坤庄展现出了卓越的专业能力、项目把握能力及一丝不苟的敬业精神,以至于我团队中那些昔日的成员即使现在已身为分行或支行的行长,仍然会尊敬地回忆当年的夏工是如何手把手教导他们设计和开发的。现在,夏坤庄及其团队通过本书将他们丰富的知识和成功经验进行了总结和提炼,在对简单和优美的追求中,完成了对SAS系统的完整和深入介绍,满足了复杂的数据分析和大数据应用时代的要求。本书是不可错过的优美之作!
—— 张晓波,中国工商银行软件开发中心上海研发支持部总经理、《计算机上的银行》作者
大数据时代的核心是数据的分析和利用,分析利用的关键是模型和挖掘。本书不但通俗易懂地向大家介绍了数据分析的方法和应用案例,而且通过对 SAS高性能及SAS应用架构规划的解析,对如何将数据分析的方法和应用部署到大数据环境中,满足海量数据和大规模运算的要求做了清楚的介绍。是一本难得的好书!
—— 鲁百年博士,SAP大中国区商业创新首席架构师
本书将统计分析和SAS应用成功地结合在了一起,既能够让熟悉统计理论的学习者有信心和能力将统计方法应用到现实中去,也能够让熟悉SAS的人有底气和理论高度在商业环境中选择和运用统计的分析方法。尤为难得的是,本书涵盖了预测及优化的丰富内容,并且结合复杂生动的案例对理论和方法进行了阐述。无论是对数据分析和SAS的初学者来说,还是对有不错基础的从业人员来说,本书都是很好的学习材料!
—— 赵彦云博士,中国人民大学统计学院院长、中国人民大学竞争力与评价研究中心主任
中国统计学会副会长
在线试读
篇 Part 1
SAS编程和数据处理
第1章 Base SAS基础
第2章 读取外部数据到SAS数据集
第3章 对单个数据集的处理
第4章 对多个数据集的处理
第5章 数据汇总与展现
第6章 SAS SQL语言
第7章 SAS宏语言
第8章 开发多语言支持的SAS程序
第1章
Base SAS基础
本章将从SAS系统开始,介绍Base SAS的组成部分,并以Windows环境为例介绍SAS窗口环境、SAS逻辑库、数据集、目录(Catalog)等SAS中常用的概念。在了解了这些基础知识之后,会引导读者使用以上的知识编写一段简单代码,提交执行,并查看日志及运行结果。后将用简短的篇幅简单介绍SAS推出但将会承担重要角色的SAS Studio的基本功能。
需要注意的是,本书中描述的内容会包括Windows和UNIX(和Linux)操作系统,如果在Windows和UNIX环境下的操作或命令有所不同,将会专门说明。本书内容未专门考虑Mainframe,因为其操作使用模式相差很多,而且读者会较少接触和使用Mainframe环境,但书中对SAS软件和产品的描述、编程概念和程序语言以及给出的代码在Mainframe环境下同样适用。关于SAS的版本,本书是基于写作时发布的版SAS 9.4来展开的,除非特别说明,书中内容也同样适用于较早的版本SAS 9.3和SAS 9.2。
本章对Base SAS窗口环境进行了着重介绍,目的在于让读者学会如何使用SAS窗口环境开发、运行SAS代码,并查看结果和检查代码运行日志。但是书中不会介绍每个菜单、子菜单、工具栏以及其他在Base SAS软件中出现的元素和功能,因为读者在实际学习和工作中可以很方便地通过SAS软件提供的帮助文件进行了解。
1.1 SAS系统简介
SAS提供了一套集成的可扩展的解决方案和使用灵活、功能强大的SAS编程语言,用于执行如下任务:数据输入和获取、数据转换处理和管理、报表绘制和图形、统计和数学分析、商业规划、预测、运筹优化,以及应用开发等。
SAS可以在多种操作系统下运行,包括Windows、UNIX、Linux以及Mainframe等。同时,SAS程序代码具有很好的移植性,在一种环境下开发的SAS代码可以在其他操作系统下运行。
SAS系统的核心Base SAS由以下部分组成。
DATA步:用于处理和管理数据。
SAS过程(Procedure):用于分析、处理和制作报表。
可扩展和定制SAS软件程序的宏语言(Macro Facility):可以减少程序文本,使SAS程序编写得更有效且易于维护,便于编写更为复杂的程序逻辑。
DATA步调试器:当提交的DATA步运行出错或产生的输出结果与预期不一致时,可以借助它来跟踪DATA步的执行情况,从而帮助发现程序逻辑中的错误。
输出交付系统(Output Delivery System,ODS):该系统会产生各种易于访问的格式输出,例如,HTML文件、传统的列表输出、PostScript文件、RTF文件和输出数据集等。
SAS窗口环境:它是一个开发和测试SAS程序的交互式图形用户界面,本节后面会有更进一步的介绍。
这其中,前面3个是SAS语言的主要元素,本篇后面的章节会专门介绍。
Base SAS软件提供数据处理过程和基础的统计过程FREQ、MEAN、CORR及UNIVARIATE等,可以与其他的SAS产品一起使用,从而实现更强大的数据读取、分析、优化、展示等功能。下面列出了部分常用的SAS产品,用于实现数据读取、统计分析、优化和信息展示等功能。
(1)SAS/ACCESS接口
提供与各种第三方数据源进行交互的功能。例如各种关系型数据库,诸如Oracle、DB2、Teradata等;ERP系统诸如SAP R/3、PeopleSoft等;同样对于Hadoop等也有专门的ACCESS接口。对于不同的数据源,ACCESS接口需要单独的软件使用许可。SAS与第三方的数据源进行交互时,将直接调用该数据库或应用厂商提供的客户端对数据进行访问,从而保证了与数据访问的效率。此外,SAS/ACCESS还提供接口访问Microsoft Access数据库文件和Excel工作簿文件中的数据。
(2)SAS/GRAPH
SAS/GRAPH是SAS系统的数据可视化和展现(图形)组件,用于数据和信息展现,并且它可通过二维和三维图形(包括图表、散点图和地图),可视化地展现数据值之间的关系。还可创建文本幻灯片、生成各种图形输出,并可提供实用程序和管理输出。
(3)SAS/STAT
SAS/STAT软件提供了全面的统计分析方法,共有超过75个统计分析过程,包括T检验、方差分析(ANOVA过程)、聚类分析(CLUSTER过程、VARCLUSTER和FASTCLUS过程)、因子分析(FACTOR过程)、回归分析(REG过程)、逻辑斯蒂(LOGISTIC过程)等。SAS/STAT软件还包括效能和样品容量分析(PSS)应用程序。该软件不断被更新,以反映新的研究成果和方法。
(4)SAS/ETS
提供用于经济计量分析、时间序列分析和预测(ESM过程、ARIMA过程和UCM过程等)、系统建模与仿真(MODEL过程)、离散选择分析、定性有限因变量模型分析、时间序列数据的季节性调整、财务分析和报告、访问经济和金融数据库及时间序列数据的管理。除了以上过程外,SAS/ETS软件还包括对经济和金融数据库以及互动环境的无缝访问,从而进行时间序列预测及投资分析。
(5)SAS/OR
SAS/OR专注于运筹与优化。SAS/OR提供的OPTMODEL建模语言用于构建、解决和维护化模型的建模环境,通过OPTMODEL过程的各种求解器或单个过程,例如OPTLP、OPTMILP、OPTMILP过程,解决线性规划、混合整数规划、非线性规划等问题。
以Base SAS软件和以上产品与技术作为基础,构建在SAS智能平台(SAS Intelligence Platform)上的SAS许多商业解决方案,可以帮助各类商业客户和其他组织机构解决诸多业务领域的特定问题,例如客户智能、风险管理、供应链、零售等。关于SAS商业解决方案的内容,在本书的第四篇会有相应的介绍。
1.2 启动SAS软件
SAS有多种运行模式:SAS窗口环境模式、非交互式模式、批处理模式及交互式行模式,下面会一一介绍。除了上面提到的4种模式外,SAS还可运行在对象服务器模式里, SAS元数据服务器、工作区服务器、存储过程服务器和OLAP服务器都是属于这种模式。关于这些服务器,在本书第四篇会进行讨论。
1.2.1 SAS窗口环境模式
SAS窗口环境是SAS提供的一种交互式图形界面,是在Windows环境下使用SAS编辑或提交SAS程序语句方便也是常用的模式。在SAS窗口环境中,用户可以通过程序编辑器编辑并提交SAS语句,程序语句的执行状态、执行时间等日志信息及put语句的输出会显示在日志窗口,同时还会提供在线帮助等。本章下一节会使用Windows环境下的窗口环境作为示例,详细介绍SAS窗口环境的各个窗口功能及其使用。
在Windows环境下启动SAS窗口环境和启动其他Windows应用程序一样有多种方式,可通过“开始”菜单里的快捷方式、命令行等方式进行。在安装SAS软件时,SAS软件安装程序会提示选择要安装的SAS语言版本。如果当前操作环境下安装了多种语言的SAS,英文的SAS可以通过“开始”“程序”SASSAS 9.4 (English) 启动。启动所有语言(包括英文)的SAS软件时,其快捷方式位于“开始”“程序”SASAdditional Languages中。例如,启动Windows操作环境下简体中文SAS软件的快捷方式为:“开始”“程序”SASAdditional LanguagesSAS 9.4 (Chinese (Simplified)),如图1.1所示。
此外,还可以使用命令行方式启动SAS窗口环境。在下面给出的Windows和UNIX操作环境下的命令后,都可以指定其他系统选项来定制要启动的SAS会话。例如,选项-NODATE表示在该SAS会话中产生的输出页面里不显示日期,选项-CONFIG指定SAS配置文件,以在启动时加载配置文件中更多的系统选项等。
Windows环境
UNIX环境
#/opt/SASHome/SASFoundation/9.4/sas -dms
UNIX环境下的命令行若不加选项-DMS,则会进入SAS的显示管理系统。当使用Windows机器通过Telnet远程登录SAS软件所在的UNIX主机时,如果需要使用SAS窗口环境,可以在该Windows机器上启动X-Windows软件,例如Exceed、XMing、Cygwin等,并设置当前Telnet会话的DISPLAY环境变量到该Windows机器上。这样,所启动的SAS窗口环境会重定向到该Windows操作系统。当启动SAS的显示管理系统时,在该Windows环境下会弹出类似的SAS窗口环境。在初次使用X-Windows窗口时会有些不习惯,有些操作与Windows环境下的SAS窗口稍有差异,但大部分都很类似。
在UNIX环境下,更多使用的是非交互模式或批处理模式,或者其他的工具。例如,可使用Windows环境下的客户端程序SAS Enterprise Guide将SAS代码提交到UNIX服务器上。
……
SAS编程和数据处理
第1章 Base SAS基础
第2章 读取外部数据到SAS数据集
第3章 对单个数据集的处理
第4章 对多个数据集的处理
第5章 数据汇总与展现
第6章 SAS SQL语言
第7章 SAS宏语言
第8章 开发多语言支持的SAS程序
第1章
Base SAS基础
本章将从SAS系统开始,介绍Base SAS的组成部分,并以Windows环境为例介绍SAS窗口环境、SAS逻辑库、数据集、目录(Catalog)等SAS中常用的概念。在了解了这些基础知识之后,会引导读者使用以上的知识编写一段简单代码,提交执行,并查看日志及运行结果。后将用简短的篇幅简单介绍SAS推出但将会承担重要角色的SAS Studio的基本功能。
需要注意的是,本书中描述的内容会包括Windows和UNIX(和Linux)操作系统,如果在Windows和UNIX环境下的操作或命令有所不同,将会专门说明。本书内容未专门考虑Mainframe,因为其操作使用模式相差很多,而且读者会较少接触和使用Mainframe环境,但书中对SAS软件和产品的描述、编程概念和程序语言以及给出的代码在Mainframe环境下同样适用。关于SAS的版本,本书是基于写作时发布的版SAS 9.4来展开的,除非特别说明,书中内容也同样适用于较早的版本SAS 9.3和SAS 9.2。
本章对Base SAS窗口环境进行了着重介绍,目的在于让读者学会如何使用SAS窗口环境开发、运行SAS代码,并查看结果和检查代码运行日志。但是书中不会介绍每个菜单、子菜单、工具栏以及其他在Base SAS软件中出现的元素和功能,因为读者在实际学习和工作中可以很方便地通过SAS软件提供的帮助文件进行了解。
1.1 SAS系统简介
SAS提供了一套集成的可扩展的解决方案和使用灵活、功能强大的SAS编程语言,用于执行如下任务:数据输入和获取、数据转换处理和管理、报表绘制和图形、统计和数学分析、商业规划、预测、运筹优化,以及应用开发等。
SAS可以在多种操作系统下运行,包括Windows、UNIX、Linux以及Mainframe等。同时,SAS程序代码具有很好的移植性,在一种环境下开发的SAS代码可以在其他操作系统下运行。
SAS系统的核心Base SAS由以下部分组成。
DATA步:用于处理和管理数据。
SAS过程(Procedure):用于分析、处理和制作报表。
可扩展和定制SAS软件程序的宏语言(Macro Facility):可以减少程序文本,使SAS程序编写得更有效且易于维护,便于编写更为复杂的程序逻辑。
DATA步调试器:当提交的DATA步运行出错或产生的输出结果与预期不一致时,可以借助它来跟踪DATA步的执行情况,从而帮助发现程序逻辑中的错误。
输出交付系统(Output Delivery System,ODS):该系统会产生各种易于访问的格式输出,例如,HTML文件、传统的列表输出、PostScript文件、RTF文件和输出数据集等。
SAS窗口环境:它是一个开发和测试SAS程序的交互式图形用户界面,本节后面会有更进一步的介绍。
这其中,前面3个是SAS语言的主要元素,本篇后面的章节会专门介绍。
Base SAS软件提供数据处理过程和基础的统计过程FREQ、MEAN、CORR及UNIVARIATE等,可以与其他的SAS产品一起使用,从而实现更强大的数据读取、分析、优化、展示等功能。下面列出了部分常用的SAS产品,用于实现数据读取、统计分析、优化和信息展示等功能。
(1)SAS/ACCESS接口
提供与各种第三方数据源进行交互的功能。例如各种关系型数据库,诸如Oracle、DB2、Teradata等;ERP系统诸如SAP R/3、PeopleSoft等;同样对于Hadoop等也有专门的ACCESS接口。对于不同的数据源,ACCESS接口需要单独的软件使用许可。SAS与第三方的数据源进行交互时,将直接调用该数据库或应用厂商提供的客户端对数据进行访问,从而保证了与数据访问的效率。此外,SAS/ACCESS还提供接口访问Microsoft Access数据库文件和Excel工作簿文件中的数据。
(2)SAS/GRAPH
SAS/GRAPH是SAS系统的数据可视化和展现(图形)组件,用于数据和信息展现,并且它可通过二维和三维图形(包括图表、散点图和地图),可视化地展现数据值之间的关系。还可创建文本幻灯片、生成各种图形输出,并可提供实用程序和管理输出。
(3)SAS/STAT
SAS/STAT软件提供了全面的统计分析方法,共有超过75个统计分析过程,包括T检验、方差分析(ANOVA过程)、聚类分析(CLUSTER过程、VARCLUSTER和FASTCLUS过程)、因子分析(FACTOR过程)、回归分析(REG过程)、逻辑斯蒂(LOGISTIC过程)等。SAS/STAT软件还包括效能和样品容量分析(PSS)应用程序。该软件不断被更新,以反映新的研究成果和方法。
(4)SAS/ETS
提供用于经济计量分析、时间序列分析和预测(ESM过程、ARIMA过程和UCM过程等)、系统建模与仿真(MODEL过程)、离散选择分析、定性有限因变量模型分析、时间序列数据的季节性调整、财务分析和报告、访问经济和金融数据库及时间序列数据的管理。除了以上过程外,SAS/ETS软件还包括对经济和金融数据库以及互动环境的无缝访问,从而进行时间序列预测及投资分析。
(5)SAS/OR
SAS/OR专注于运筹与优化。SAS/OR提供的OPTMODEL建模语言用于构建、解决和维护化模型的建模环境,通过OPTMODEL过程的各种求解器或单个过程,例如OPTLP、OPTMILP、OPTMILP过程,解决线性规划、混合整数规划、非线性规划等问题。
以Base SAS软件和以上产品与技术作为基础,构建在SAS智能平台(SAS Intelligence Platform)上的SAS许多商业解决方案,可以帮助各类商业客户和其他组织机构解决诸多业务领域的特定问题,例如客户智能、风险管理、供应链、零售等。关于SAS商业解决方案的内容,在本书的第四篇会有相应的介绍。
1.2 启动SAS软件
SAS有多种运行模式:SAS窗口环境模式、非交互式模式、批处理模式及交互式行模式,下面会一一介绍。除了上面提到的4种模式外,SAS还可运行在对象服务器模式里, SAS元数据服务器、工作区服务器、存储过程服务器和OLAP服务器都是属于这种模式。关于这些服务器,在本书第四篇会进行讨论。
1.2.1 SAS窗口环境模式
SAS窗口环境是SAS提供的一种交互式图形界面,是在Windows环境下使用SAS编辑或提交SAS程序语句方便也是常用的模式。在SAS窗口环境中,用户可以通过程序编辑器编辑并提交SAS语句,程序语句的执行状态、执行时间等日志信息及put语句的输出会显示在日志窗口,同时还会提供在线帮助等。本章下一节会使用Windows环境下的窗口环境作为示例,详细介绍SAS窗口环境的各个窗口功能及其使用。
在Windows环境下启动SAS窗口环境和启动其他Windows应用程序一样有多种方式,可通过“开始”菜单里的快捷方式、命令行等方式进行。在安装SAS软件时,SAS软件安装程序会提示选择要安装的SAS语言版本。如果当前操作环境下安装了多种语言的SAS,英文的SAS可以通过“开始”“程序”SASSAS 9.4 (English) 启动。启动所有语言(包括英文)的SAS软件时,其快捷方式位于“开始”“程序”SASAdditional Languages中。例如,启动Windows操作环境下简体中文SAS软件的快捷方式为:“开始”“程序”SASAdditional LanguagesSAS 9.4 (Chinese (Simplified)),如图1.1所示。
此外,还可以使用命令行方式启动SAS窗口环境。在下面给出的Windows和UNIX操作环境下的命令后,都可以指定其他系统选项来定制要启动的SAS会话。例如,选项-NODATE表示在该SAS会话中产生的输出页面里不显示日期,选项-CONFIG指定SAS配置文件,以在启动时加载配置文件中更多的系统选项等。
Windows环境
UNIX环境
#/opt/SASHome/SASFoundation/9.4/sas -dms
UNIX环境下的命令行若不加选项-DMS,则会进入SAS的显示管理系统。当使用Windows机器通过Telnet远程登录SAS软件所在的UNIX主机时,如果需要使用SAS窗口环境,可以在该Windows机器上启动X-Windows软件,例如Exceed、XMing、Cygwin等,并设置当前Telnet会话的DISPLAY环境变量到该Windows机器上。这样,所启动的SAS窗口环境会重定向到该Windows操作系统。当启动SAS的显示管理系统时,在该Windows环境下会弹出类似的SAS窗口环境。在初次使用X-Windows窗口时会有些不习惯,有些操作与Windows环境下的SAS窗口稍有差异,但大部分都很类似。
在UNIX环境下,更多使用的是非交互模式或批处理模式,或者其他的工具。例如,可使用Windows环境下的客户端程序SAS Enterprise Guide将SAS代码提交到UNIX服务器上。
……
评论
还没有评论。