内容简介
《缺失数据的模型检验及其应用》主要研究缺失数据模型的检验问题. 《缺失数据的模型检验及其应用》共分为8 章. 第1 章主要介绍数据的不同缺失机制, 包括协变量缺失和因变量缺失, 以及在不同缺失机制下常见的统计分析方法. 第2 章介绍一些常见的检验方法, 主要包括蒙特卡罗检验和得分类型的检验. 在蒙特卡罗检验这部分, 着重介绍参数和非参数蒙特卡罗检验方法. 第3 章介绍在数据不存在缺失的情况下, 几种常见模型的检验方法及其性质. 第4 章是关于在因变量缺失时, 部分线性模型中非线性部分是否符合某类参数结构的拟合优度检验问题. 第5 章讨论协变量随机缺失时, 广义线性模型本身的拟合优度检验问题. 第6 章对于变系数模型, 在响应变量缺失的情况下, 研究变系数部分是否具有一定参数结构的检验. 第7 章研究的是协变量缺失时候的统计推断问题. 第8 章的主要内容是因变量随机缺失的情况下, 变系数模型本身的拟合优度检验问题. 第4 章到第8 章的检验统计量主要采用蒙特卡罗检验和得分类型的检验.
目录
前言符号表第1章缺失数据.............................................................. 1
1.1 协变量缺失机制........................................................ 1
1.2 协变量缺失的处理方法.................................................4
1.2.1 完整个体分析...................................................... 4
1.2.2 基于插补数据的方法................................................ 4
1.2.3 基于似然的方法.................................................... 6
1.3 响应变量缺失机制..................................................... 8
1.4 响应变量缺失的处理方法.............................................. 9
第2 章常用的一些检验方法................................................. 11
2.1 蒙特卡罗检验......................................................... 11
2.1.1 参数蒙特卡罗检验................................................. 11
2.1.2 非参数蒙特卡罗检验............................................... 12
2.2 得分类型的检验.......................................................15
第3 章数据模型的假设检验.............................................19
3.1 广义线性模型的研究.................................................. 19
3.1.1 统计量的渐近性质................................................. 20
3.1.2 蒙特卡罗近似..................................................... 21
3.2 部分线性模型的研究.................................................. 22
3.3 变系数模型的关于模型的检验........................................ 22
3.3.1 检验统计量及其极限性质...........................................25
3.3.2 蒙特卡罗近似..................................................... 27
3.4 变系数模型的关于回归系数的检验....................................28
3.4.1 检验步骤......................................................... 30
3.4.2 检验统计量的近似表现.............................................31
第4 章因变量缺失时部分线性模型拟合优度检验............................ 34
4.1 引言...................................................................34
4.2 数据的构造以及模型的估计...................................... 35
4.3 检验统计量及其渐近性质............................................. 36
4.4 蒙特卡罗逼近......................................................... 38
4.5 数值分析.............................................................. 40
4.5.1 模拟研究......................................................... 40
4.5.2 实际数据分析..................................................... 43
4.6 定理的证明........................................................... 44
第5 章协变量随机缺失时广义线性模型的拟合优度检验..................... 53
5.1 检验步骤.............................................................. 54
5.1.1 检验统计量的构造................................................. 54
5.1.2 检验统计量的极限性质.............................................56
5.2 数值分析........................
摘要与插图
第1 章缺失数据1.1 协变量缺失机制
在医学和流行病学等应用领域,协变量缺失处处存在.数据缺失机制对于数据的统计推断是重要的,不同的缺失机制会导致不同的似然函数,进而得出不同的统计推断结果.缺失机制的概念是由Rubin(1976)提出的,主要分为三大类:随机缺失MAR(missingatrandom)、随机缺失MCAR(missingcompletelyatrandom)和非随机缺失NMAR(notmissingatrandom),其中非随机缺失也称为不可忽略缺失(nonignorablemissingness).
用Y表示响应变量,(X,Z)表示协变量,δ表示协变量X是否缺失,等于1表示观测到,等于0表示缺失.以下给出协变量X三种不同缺失的定义.
(1)随机缺失,也就是协变量X是否缺失与协变量Z和响应变量Y没有任何关系.用公式表示为P(δ=1Y,X,Z)=P(δ=1).
(2) 随机缺失,也就是协变量|X缺失只和协变量Z和响应变量Y有关,与X本身没有关系.用公式表示为P(δ=1|Y,X,Z)=P(δ=1|Y,Z).
(3)非随机缺失,在这种缺失机制下,协变量X缺失可能与Z和Y有关,也可能与X本身有关.
下面给出一个模拟说明上述所提到的三种不同的协变量缺失机制.假定数据来自如下模型
Y=β0+β1X+ε,(1.1.1)
设定(β0,β1)=(1,1),X和ε独立且都来自标准正态分布.如下三种不同缺失函数分别表示三种不同的缺失机制.
(1)P(δ=1)=0.6;
(2)P(δY)=0.30,如果Y.1.5,否则=0.95;
(3)P(δ||Y,X)=0.40,如果|| X+Y.1.5,否则=0.90.
这三种缺失机制分别是随机缺失、只依赖响应变量Y的缺失,以及既依赖于X也依赖Y的缺失.在这三种不同的缺失机制下,数据缺失的概率都等于或者约等于0.6.
我们随机产生200组数据,图1.1.1(a),(b),(c)和(d)分别表示数据观测到的情况,第一、第二以及第三种缺失机制下得到的数据.从图1.1.1中可以看出,图1.1.1(b)是图1.1.1(a)中的数据随机缺失40%的数据;图1.1.1(c)可以明显看出在|Y | >1.5时,缺失的概率明显小于|Y | .1.5的情况;图1.1.1(c)也可以看到在X+Y.1.5的缺失概率明显