内容简介
《数据分析与R软件》的主要内容包括描述性统计分析、非参数统计及常用的多元统计分析方法,如回归分析、主成分分析、聚类分析、判别分析等。这些统计方法是进行数据处理的必要技术,是进一步深造与统计相关专业的基础,是金融、统计、计算机等行业必不可少的分析处理工具之一。应用实例通过通用统计软件R实现。R软件是免费的统计软件,是用于统计分析和制图的软件。
《数据分析与R软件》可作为信息与计算科学、应用数学、统计学等专业数据分析类课程的基础教材,也可作为对统计数据分析有较高要求的本科学生和工科硕士研究生各专业的选修教材,还可作为统计、管理、经济、金融、生物、心理、医疗等科研和工程技术人员的参考读物。
目录
总序
前言
第1章 探索性数据分析
1.1 数字特征
1.1.1 一维数据的数字特征
1.1.2 一维总体的数字特征
1.1.3 多元数据的数字特征
1.1.4 多元总体的数字特征
1.2 数据的分布
1.2.1 频数(频率)分布表与直方图
1.2.2 茎叶图、五数总括、箱线图
1.2.3 经验分布、QQ图及分布拟合检验
1.3 多元数据的图示
1.3.1 轮廓图
1.3.2 蛛网图
1.3.3 调和曲线图
习题1
第2章 非参数统计
2.1 单样本问题
2.1.1 符号检验
2.1.2 趋势检验
2.1.3 游程检验
2.1.4 对称中心的检验
2.2 两样本问题
2.2.1 独立样本位置参数的检验
2.2.2 独立样本刻度参数的检验
2.2.3 配对样本位置参数的检验
2.3 多样本问题
2.3.1 多个独立样本的检验
2.3.2 多个相关样本的检验
2.4 秩相关分析
2.4.1 Spearman秩相关系数
2.4.2 Kendall τ秩相关系数
2.5 二维列联表
2.5.1 Pearson χ2独立性检验
2.5.2 Fisher检验
习题2
第3章 回归分析
3.1 多元线性回归分析
3.1.1 多元线性回归模型
3.1.2 参数估计
3.1.3 回归模型的检验
3.1.4 回归诊断
3.2 自变量的选择与逐步回归
3.2.1 穷举法
3.2.2 逐步回归法
3.3 非线性回归模型
3.3.1 内在线性回归模型
3.3.2 内在非线性回归模型
3.4 Logistic回归模型
3.4.1 线性Logistic回归模型
3.4.2 参数的似然估计
习题3
第4章 主成分分析
4.1 总体主成分
4.1.1 总体主成分定义
4.1.2 总体主成分求法
4.1.3 总体主成分的性质
4.1.4 标准化变量的主成分
4.2 样本主成分
习题4
第5章 因子分析
5.1 因子分析模型
5.2 参数的统计意义及估计方法
5.2.1 参数的统计意义
5.2.2 因子载荷矩阵的估计
5.3 样本数据的因子分析
5.4 因子旋转
5.5 因子得分
5.5.1 加权二乘法
5.5.2 回归法
习题5
第6章 聚类分析
6.1 聚类分析的基本思想
6.2 聚类统计量
6.2.1 Q型聚类统计量——距离
6.2.2 R型聚类统计量——相似系数
6.3 系统聚类法
6.4 快速聚类法
6.4.1 凝聚点的选择
6.4.2 计算步骤
习题6
第7章 判别分析
7.1 距离判别
7.1.1 两个总体距离判别
7.1.2 多个总体距离判别
7.2 Bayes判别
7.2.1 两个总体Bayes判别
7.2.2 多个总体Bayes判别
7.3 Fisher判别
7.3.1 Fisher判别的基本思想
7.3.2 线性判别函数的求法
7.3.3 Fisher判别准则
7.4 逐步判别
7.4.1 逐步判别的基本思想
7.4.2 逐步判别的步骤
7.5 判别法则的评价
习题7
第8章 相关分析
8.1 相关系数的估计和检验
8.2 偏相关与复相关系数
8.2.1 偏相关系数
8.2.2 复相关系数
8.3 典型相关分析
8.3.1 典型相关分析的基本思想
8.3.2 总体的典型相关分析
8.3.3 样本典型相关分析
8.3.4 典型相关系数的显著性检验
习题8
第9章 R软件的使用
9.1 R软件简介
9.2 R软件界面简介
9.3 对象及它们的模式和属性
9.4 向量运算及相关函数
9.4.1 向量
9.4.2 产生有规律序列
9.4.3 逻辑向量
9.4.4 缺失数据
9.4.5 字符型向量
9.4.6 向量的下标系统
9.5 因子
9.6 数组和矩阵
9.6.1 数组
9.6.2 数组的下标系统
9.6.3 矩阵
9.6.4 与数组(矩阵)运算的相关函数
9.7 列表与数据框
9.8 从文件中读取数据
9.8.1 文本文件
9.8.2 其他格式数据文件
9.9 写数据文件
9.10 成组、循环和条件控制
9.10.1 成组表达式
9.10.2 控制语句