内容简介
《高等院校信息技术规划教材:SAS数据挖掘与分析》囊括了SAS编程方面极为详尽的命令语句,是数据的科学挖掘和统计分析方面的一本不可多得的教科书。《高等院校信息技术规划教材:SAS数据挖掘与分析》的前8章介绍了数据挖掘和统计分析所用的各类命令语句,第9~17章着重介绍如何用命令语句及其对话框进行常用的初统计和专业统计,并对统计结果进行了科学准确的分析。《高等院校信息技术规划教材:SAS数据挖掘与分析》面向全国高校统计学、医学、心理学、市场营销学、人文社会学、信息管理学及财经学等专业的本科生和研究生,可作为这些专业及其他非计算机专业学生必选的统计教材,也是数据挖掘和信息分析方面的利器。
目录
第1章 SAS编程的语法知识1.1 SAS(StatisticalAnalysisSystem)概述1.2 观测值、变量常量1.3 SAS的操作符1.4 SAS数据挖掘常用的语句习题第2章 数据挖掘的预备知识2.1 DATA语句2.2 INPUT语句2.3 LENGTH语句2.4 用LABEL语句指定变量标签2.5 用PROCFORMAT过程指定数据标签2.6 用MISSING语句宣告缺失值2.7 注释语句2.8 创建新变量2.9 缺失值不参与运算2.1 0求和语句2.1 1删除变量2.1 2用INFILE语句读取外部文件的数据习题第3章 数据挖掘时的跳转与循环3.1 IF语句3.1.1 IFTHEN语句3.1.2 IFTHEN/ELSE语句3.2 GOTO语句3.3 link语句3.4 RETURN语句3.5 删除部分个案3.5.1 删除数据集里暂时不用的个案3.5.2 用IF语句挖掘部分数字型的个案3.6 循环语句3.7 数组3.7.1 下标变量的下标3.7.2 在DOEND循环中使用数组3.7.3 多维数组习题第4章 建立数据仓库4.1 建立数据集4.2 数据的分组及分组标记4.2.1 分组控制4.2.2 数据的分组标记4.3 数据的排序4.4 数据集的连接4.4.1 变量相同时的连接4.4.2 变量不同时的连接4.4.3 变量值相同时的个案连接4.5 数据集合二而一4.5.1 按个案号配对合并变量4.5.2 用BY语句进行匹配合并4.6 用FILE语句控制输出文件4.7 OUTPUT语句4.7.1 OUTPUT语句格式4.7.2 一个个案的变量分几行输出4.7.3 一个DATA步创建多个数据集4.8 用DATASETS过程修改数据集4.9 查阅数据集的信息习题第5章 数据挖掘的过程引论5.1 DATA语句5.2 INFILE语句5.3 INPUT语句5.3.1 用INPUT语句定义固定格式的变量5.3.2 用INPUT语句定义自由格式的变量5.3.3 用INPUT语句指定格式化的输入方式5.3.4 INPUT语句含有挖掘功能5.4 用LABEL语句定义变量标签5.5 用FORMAT及VALUE语句定义数值标签5.5.1 定义数值标签5.5.2 指定格式化输入5.5.3 用FORMAT语句指定变量值的格式5.6 用TITLE语句显示标题5.7 数据挖掘常用的统计过程5.7.1 用PROCFREQ过程做简单的频数分布5.7.2 用PROCCHART过程画图5.7.3 用PROCPLOT过程画散点图5.7.4 用PROCMEANS过程统计均值分布5.7.5 用PROCRANK过程统计秩和分布5.7.6 用PROCTABULATE制表5.7.7 用PROCUNIVARIATE过程做详尽的频数分布5.7.8 用PROCDBF过程调用dbase数据库数据5.7.9 用PROCPRINT过程显示数据集的信息5.7.1 0用PROCSORT过程对数据排序5.7.1 1用PROCSTANDARD过程对变量标准化5.5.1 2用TRANSPOSE过程转置数据习题第6章 通过描述统计挖掘数据6.1 用FREQ过程做单双变量的频数统计6.1.1 FREQ过程命令6.1.2 FREQ过程与其他过程的连用6.2 单变量频数分布6.3 双变量交叉汇总和结合测量6.3.1 双变量频数统计的过程命令6.3.2 定类-定类双变量交叉汇总与结合测量6.3.3 定比-定比双变量交叉汇总与结合测量6.3.4 定序-定序双变量交叉汇总与结合测量6.4 再用UNIVARIATE过程详细描述单变量6.4.1 举例6.4.2 UNIVARIATE过程命令6.4.3 计算方法6.5 进一步用PROCCHART过程描述单变量6.5.1 PROCCHART过程命令6.5.2 CHART的选项6.6 用MEANS过程比较两个均值6.6.1 应用实例6.6.2 MEANS过程命令6.7 用PROCPLOT过程画散点图6.8 用RANK过程进行非参数检验6.8.1 什么是秩分6.8.2 RANK过程命令6.8.3 秩分计算6.8.4 运用举例习题第7章 均值比较与T检验7.1 均值比较的方法7.1.1 配对样本的均值比较7.1.2 两个独立样本的均值差检验7.2 MEANS过程及其t统计量7.3 TTEST过程及其t检验7.4 非参数检验7.4.1 用NPAR1WAY过程做非参数检验7.4.2 举例习题第8章 方差分析8.1 用ANOVA做均衡数据的方差分析8.1.1 ANOVA过程命令8.1.2 单因素方差分析8.1.3 双因素方差分析8.1.4 三因素方差分析8.1.5 R*C交互因素的方差分析8.1.6 多个实验组与对照组的均值比较8.1.7 用SNK的Q检验法比较组间均值8.2 用GLM进