内容简介
薛薇博士编著的这本《基于R的统计分析与数据 挖掘》聚焦当今备受国内外数据分析师和数据应用者 关注的R语言,关注如何借助R实现统计分析和数据挖 掘。它既不是仅侧重理论讲解的统计分析和数据挖掘 教科书,也不是仅侧重R编程操作的使用手册,而是 以数据分析贯穿全书的两者的有机结合。
本书在于:以数据模拟的直观方式论述方法 原理的同时,通过案例强化R的操作实践性;在以解 决应用问题为目标讨论R操作的同时,通过原理论述 强化模型结果的解读理解。
《基于R的统计分析与数据挖掘》定位于统计分 析和数据挖掘的学习者、实践者和研究者,旨在使读 者理解统计分析原理,熟练操控R软件,拓展数据应 用,提升研究水平。
目录
第1章 关于R
1.1 为什么选择R
1.2 如何学习R
1.3 R入门必备
1.4 小结
第2章 R的数据组织
2.1 R的数据对象
2.2 创建和访问R的数据对象
2.3 从文本文件读数据
2.4 外部数据的导入
2.5 R数据组织的其他问题
2.6 小结
第3章 R的数据管理
3.1 数据合并
3.2 数据排序
3.3 缺失数据报告
3.4 变量计算
3.5 变量值的重编码
3.6 数据筛选
3.7 数据保存
3.8 数据管理中控制流程
3.9 小结
第4章 R的基本数据分析:描述和相关
4.1 数值型单变量的描述
4.2 分类型单变量的描述
4.3 两数值型变量相关性的分析
4.4 两分类型变量相关性的分析
4.5 小结
第5章 R的基本数据分析:可视化
5.1 绘图基础
5.2 数值型单变量分布的可视化
5.3 分类型变量分布和相关性的可视化
5.4 两数值型变量相关性的可视化
5.5 lattice绘图
5.6 小结
第6章 R的两均值比较检验
6.1 两独立样本的均值检验
6.2 两配对样本的均值检验
6.3 样本均值检验的功效分析
6.4 两总体分布差异的非参数检验
6.5 两样本均值差的置换检验
6.6 两样本均值差的自举法检验
6.7 小结
第7章 R的方差分析
7.1 单因素方差分析
7.2 单因素协方差分析
7.3 多因素方差分析
7.4 小结
第8章 R的回归分析:一般线性模型
8.1 回归分析概述
8.2 建立线性回归模型
8.3 线性回归方程的检验
8.4 回归诊断:误差项是否满足高斯马尔科夫假定
8.5 回归诊断:诊断数据中的异常观测点
8.6 回归诊断:多重共线性的诊断
8.7 回归建模策略
8.8 回归模型验证
8.9 带虚拟变量的线性回归分析
8.10 小结
第9章 R的回归分析:广义线性模型
9.1 广义线性模型概述
9.2 logistic回归分析:连接函数和参数估计
9.3 logistic回归分析:解读模型和模型检验
9.4 logistic回归分析:R函数和示例
9.5 logistic回归分析:回归诊断
9.6 泊松回归分析
9.7 广义线性模型的交叉验证
9.8 小结
第10章 R的聚类分析
10.1 聚类分析概述
10.2 K-Means聚类
10.3 层次聚类
10.4 两步聚类
10.5 小结
第11章 R的因子分析:变量降维
11.1 因子分析概述
11.2 构造因子变量:基于主成分分析法
11.3 构造因子变量:基于主轴因子法
11.4 因子变量的命名
11.5 计算因子得分
11.6 小结
第12章 R的线性判别分析:分类模型
12.1 距离判别
12.2 Fisher判别
12.3 小结
第13章 R的决策树:预测模型
13.1 决策树算法概述
13.2 分类回归树的生长过程
13.3 分类回归树的剪枝
13.4 建立分类回归树的R函数和示例
13.5 建立分类回归树的组合预测模型
13.6 随机森林
13.7 小结
第14章 R的人工神经网络:预测和聚类
14.1 人工神经网络概述
14.2 B-P反向传播网络
14.3 B-P反向传播网络的R函数和示例
14.4 SOM自组织映射网络
14.5 小结