内容简介
本书是一本基于R实现全部例题计算与分析的统计学教材,书中例题的解答给出了R的详细程序和结果。全书内容共11章,包括数据的描述性分析方法、推断方法以及实际中常用的一些统计方法等。每章均以一个实际问题入手引入本章要介绍的内容,在写法上立足于统计应用,避免统计公式的推导,力求通俗易懂。本书可作为高等院校经济管理类专业本科生统计学课程的教材使用,也可作为其他文科专业及部分理、工、农、林、医、药专业的教材或参考书,对广大实际工作者也参考价值。
目录
第1 章数据与统计学
问题与思考: 怎样理解统计结论
1.1 统计学及其应用
1.1.1 什么是统计学
1.1.2
统计学的应用
1.2 数据及其来源
1.2.1 变量与数据
1.2.2 数据的来源
1.3 R 简介
1.3.1 R
的初步使用
1.3.2 数据的读入与保存
1.3.3 数据的使用和编辑
1.3.4 包的安装和加载
1.3.5
函数的编写
主要术语
思考与练习
第2 章数据的描述性分析: 图表展示
问题与思考: 怎样用图表看数据
2.1
类别数据的图表展示
2.1.1 用频数分布表观察类别数据
2.1.2 用图形展示类别数据
2.2 数值数据的图表展示
2.2.1
用频数分布表观察数据分布
2.2.2 用图形展示数值数据
2.3 使用图表的注意事项
主要术语
思考与练习
第3
章数据的描述性分析: 概括性度量
问题与思考: 怎样分析学生的考试成绩
3.1 水平的描述
3.1.1 平均数
3.1.2
中位数和分位数
3.1.3 水平代表值的选择
3.2 差异的描述
3.2.1 极差和四分位差
3.2.2 方差和标准差
3.2.3
变异系数
3.2.4 标准得分
3.3 分布形状的描述
3.4 数据的综合描述
主要术语
思考与练习
第4
章随机变量的概率分布
问题与思考: 彩票中奖的概率有多大
4.1 什么是概率
4.2 随机变量的概率分布
4.2.1
随机变量及其概括性度量
4.2.2 随机变量的概率分布
4.2.3 其他几个重要的统计分布
4.3 样本统计量的概率分布
4.3.1
统计量及其分布
4.3.2 其他统计量的分布
4.3.3 统计量的标准误差
主要术语
思考与练习
第5
章参数估计
问题与思考: 科学家做出重大贡献的年龄是多少
5.1 参数估计的基本原理
5.1.1 点估计与区间估计
5.1.2
评价估计量的标准
5.2 总体均值的区间估计
5.2.1 一个总体均值的估计
5.2.2 两个总体均值之差的估计
5.3
总体比例的区间估计
5.3.1 一个总体比例的估计
5.3.2 两个总体比例之差的估计
5.4 总体方差的区间估计
5.4.1
一个总体方差的估计
5.4.2 两个总体方差比的估计
5.5 样本量的确定
5.5.1 估计总体均值时样本量的确定
5.5.2
估计总体比例时样本量的确定
主要术语
思考与练习
第6 章假设检验
问题与思考: 你相信饮用水瓶子标签上的说法吗
6.1
假设检验的基本原理
6.1.1 怎样提出假设
6.1.2 怎样做出决策
6.1.3 怎样表述决策结果
6.2
总体均值的检验
6.2.1 一个总体均值的检验
6.2.2 两个总体均值之差的检验
6.3 总体比例的检验
6.3.1
一个总体比例的检验
6.3.2 两个总体比例之差的检验
6.4 总体方差的检验
6.4.1 一个总体方差的检验
6.4.2
两个总体方差比的检验
主要术语
思考与练习
第7 章类别变量分析
问题与思考: 网购满意度与地区有关系吗
7.1
一个类别变量的拟合优度检验
7.1.1 期望频数相等
7.1.2 期望频数不等
7.2 两个类别变量的独立性检验
7.2.1
列联表与?2 独立性检验
7.2.2 应用?2 检验的注意事项
7.3 两个类别变量的相关性度量
7.3.1 ' 系数和Cramer's V
系数
7.3.2 列联系数
主要术语
思考与练习
第8 章方差分析
问题与思考:
超市位置和竞争者数量对销售额有影响吗
8.1 方差分析的基本原理
8.1.1 什么是方差分析
8.1
摘要与插图
当你用R 来学习统计时, 你一定会爱上R, 因为它是那么令人着迷, 让你难舍难分, 不离不弃; 当你用R 来学习统计时, 你一定会感到神奇, 因为它有如此多的选择,让你无所适从, 力所不及; 当你用R 来学习统计时, 你也一定会爱上统计, 因为它是一种思想, 一种文化, 让你发现它的内涵, 它的逻辑, 它的乐趣, 它的魅力; 无论你爱它还是不爱它, 它总是让你难言放弃, 因为它充满着无穷奥秘, 伴随着诗情画意, 这就是R, 这就是统计.统计学是一门既有趣又十分有用的学科. 但在计算机时代到来前, 计算问题使统计的应用受到极大限制, 很多人也由于计算问题对统计学望而却步. 然而, 在计算机和互联网普及的今天, 尤其是统计软件的使用, 不仅促进了统计科学的发展, 也使得统计教学和学习发生了革命性变化. 软件的使用可以让我们从繁杂的统计计算中解脱出来,从而可以拿出更多的时间去理解统计方法的思想和原理. 当我们把那些繁杂但属于简单劳动的计算交给计算机\" 的时候, 就会发现统计的学习和应用并不困难.
实现统计分析的软件有多种, 包括一些的商业统计软件, 如SAS, SPSS 等. 但由于这些软件价格不菲, 多数人难以接近. 幸运的是, R 的出现使价格问题不复存在,这为多数人学习统计提供了良好的条件.
R是基于R 语言的一种的免费统计软件, 它不仅提供了丰富的数据分析技术, 功能十分强大, 而且与多数统计软件相比, R 的更新速度快, 使用更灵活, 可以包含很多方法的实现方案, 它的绘图功能是任何其他统计软件都无法比拟的. 同时, 读者自己开发的一些新的统计模型, 也可以很方便地通过在R 中编程实现模型的求解.由于其功能强大和使用灵活, R 在实际工作和科学研究的很多领域被越来越多的人使用. 可以说, R 将逐渐成为数据分析软件的主流.
本书是一本基于R 实现全部例题计算的统计学教材, 书中每个例题的解答都给出了R的详细程序和结果. 全书共11 章内容, 包括数据的描述性分析方法、推断方法以及实际中常用的一些统计方法等. R 是一个庞大的、在不断发展和完善的统计平台和编程语言, 即是对同一问题也会有多个不同的R 包来实现, 其中编写的R 程序也会因人而异. Robert I. Kabacoff在其所著的《R 语言实战》一书中写道: \R 大的地方(也有可能是人头疼的地方) 就是, 其中永远都有学不完的东西." 本书R 的使用尽可能体现其灵活性和多样性, 对同类数据或变量的分析尽可能多地使用不同的R包和功能选项, 绘制图形时尽可能使用不同的函数及参数选择, 以使读者更多地了解R 的功能和特点. 当然, 本书例题给出的R 程序侧重于演示统计方法的实现过程, 从R 使用的角度看不一定是的, 有些甚至显得冗长、复杂, 好在本书的R 应用只是要起到抛砖引玉的作用, 读者可根据自身分析的需要选择不同的R 包或编程来解决所面临的统计问题.
本书可作为高等院校经济管理类专业本科生统计学课程的教材使用, 也可作为其他文科专业及部分理、工、农、林、医、药专业的教材或参考书, 对广大实际工作者也参考价值. 由于作者水平有限, 难免存在错误, 希望读者在使用中对本书的不足之处多提宝贵意见, 以便进一步修改和完善.