内容简介
《自适应数据分析方法——理论与应用》以高频数据为主要研究对象,将不同的自适应分析方法(经验模态分解、整体经验模态分解、自适应噪声的完备经验模态分解、局部均值分解体局部均值分解)应用到金融高频数据的波动率估计中,并比较分析了基于自适应分析方法的波动率估计的优缺点、精度以及未来的应用和发展。对波动行估计可以有效地把握市场的运行规律,这为今后的资产定价和风险管理的研究都提供了丰富的参考依据,同时也为我国股票市场的波动率估计提供了新的思路。
目录
目录
前言
第1章 绪论 1
1.1 研究背景 1
1.2 自适应分解方法的发展现状 2
1.2.1 经验模态分解的研究现状 3
1.2.2 整体经验模态分解的研究现状 5
1.2.3 基于自适应噪声的完备经验模态分解的研究现状 5
1.2.4 局部均值分解的研究现状 6
1.2.5体局部均值分解的研究现状 7
1.3 波动率研究的发展与现状 8
1.4 本书的框架结构 14
第2章 已实现波动率与已实现极差波动率 16
2.1 引言 16
2.2 已实现波动率与已实现极差波动率的基础背景 17
2.2.1 积分波动率 17
2.2.2 已实现波动率 17
2.2.3 已实现极差波动率 18
2.2.4 已实现波动率与已实现极差波动率的理论比较 19
2.3 已实现波动率与已实现极差波动率的应用 20
2.4 本章小结 22
第3章 自适应分解方法的应用 23
3.1 引言 23
3.2 信号去噪 23
3.3 非线振动分析 25
3.4 故障诊断 26
3.5 语音增强 27
3.6 其他应用 28
3.7 本章小结 28
第4章 基于经验模态分解的高频数据波动率估计 30
4.1 引言 30
4.2 经验模态分解基本理论 30
4.2.1 瞬时频率 31
4.2.2 固有模态函数 32
4.2.3 经验模态分解 32
4.2.4 希尔伯特谱分析 35
4.2.5 经验模态分解特 36
4.3 已实现波动率及其估计 37
4.4 模拟研究 37
4.5 多尺度分析 41
4.5.1 各分量描述统计分析 45
4.5.2 正态分析 46
4.5.3 周期分析 47
4.6 波动率估计 48
4.7 本章小结 51
第5章 基于整体经验模态分解的高频数据波动率估计 52
5.1 引言 52
5.2 整体经验模态分解基本理论 52
5.2.1 经验模态分解的模态混叠 52
5.2.2 经验模态分解的端点问题 54
5.2.3 整体经验模态分解的原理 54
5.3 模拟研究 57
5.4 多尺度分析 59
5.4.1 各分量描述统计分析 61
5.4.2 正态分析 62
5.4.3 周期分析 63
5.5 波动率估计 64
5.6 本章小结 67
第6章 基于自适应噪声的完备经验模态分解的高频数据波动率估计 68
6.1 引言 68
6.2 基于自适应噪声的完备经验模态分解基本理论 68
6.3 已实现波动率估计 70
6.4 模拟研究 70
6.5 多尺度分析 72
6.5.1 各分量描述统计分析 74
6.5.2 正态分析 74
6.5.3 周期分析 75
6.6 波动率估计 76
6.7 本章小结 79
第7章 基于局部均值分解的高频数据波动率估计 80
7.1 引言 80
7.2 局部均值分解基本理论 80
7.3 已实现波动率估计 83
7.4 模拟分析 84
7.5 多尺度分析 86
7.5.1 各分量描述统计分析 88
7.5.2 正态分析 89
7.5.3 周期分析 89
7.6 波动率估计 91
7.7 本章小结 93
第8章 基体局部均值分解的高频数据波动率估计 94
8.1 引言 94
8.2体局部均值分解基本理论 94
8.3 已实现波动率估计 96
8.4 模拟分析 97
8.5 多尺度分析 98
8.5.1 各分量描述统计分析 100
8.5.2 正态分析 101
8.5.3 周期分析 102
8.6 波动率估计 103
8.7 本章小结 105
第9章 基于自适应分解方法高频数据波动率估计的比较分析 107
9.1 引言 107
9.2 实证分析 107
9.3 本章小结 111
第10章结与展望 112
10.1结 112
10.2 展望 113
10.2.1 多变量波动率模型的应用 113
10.2.2 考虑市场微观结构噪声的已实现波动率计算方法 114
10.2.3 自适应分解方法对混频数行多尺度分析 114
10.2.4 自适应分解方法与机器学建立混频数据预测模型 115
参考文献 116
摘要与插图
第1章 绪论
1.1 研究背景
金融市场是一国实体经济的反映, 是一国经济发展的晴雨表, 因此金融市场的波动既可以作为采取经济政策调控经济的参考, 也可以作为投资行投资的重要观察尺度. 另外, 波动这一现象在其他金融衍生产品譬如期权等产品定价中也有不可或缺的作用. 因此更有效的度量股市的波动效应, 有利于采取及时监控市场运行情况, 尤其是在防范系统金融风险的主题下, 便于决策层采取更合理的财政政策或者货币政行宏观调控, 另一方面, 也有利于投资者把控市场风险, 调整预期并及时调整有利于自身的投资组合提高收益.
波动率研究一直是金融研究领域的热门课题, 学界*早对波动率的研究源于期权定价公式出现后, 波动率作为期权定价公式的一个重要常数, 其预测的率影响了期权定价的率, 而期权定价的率则会对收益造成影响, 因此对波动率的研究显得尤为重要, 比较的有以自回归条件异方差 (Auto Regressive Conditional Heteroskedasticity, ARCH) 模型为代表的条件异方差模型的波动率估计.
高频数据 (High-Frequency Data) 是指数据采样的时间间隔较短, 采样频率大于一般研究时所采用的频率. 但高频这个概念是相对而言的, 例如, 对于股票,可能要在内有多个数据才能称为高频数据, 而对于宏观经济数据, 可能一周采样一次可以称为高频数据了. 如何有效利含着丰富信息的日内高频数据来量化金融资产风险, 不仅成年来金融市场上投资者和监管者关注的热点, 也是相关金融研究领域中的问题之一.
相对于低频数据而言, 高频数据并不等同于低频数据的时间细分, 由于受市场信息不确定和连续的影响, 高频数据主要呈现下列特点.
(1) 不规则交易间隔.
与传统的低频观测数据 (如年数据、月数据、周数据) 相比, 金融高频数据呈现出一些的特征. *为明显的特征便是数据记录间隔的不相等, 市场交易的发生并不以相等时间间隔发生, 因此所观测到的金融高频数据也是不等间隔的. 从而交易间的时间持续期变得重要, 并且可含了关于市场微观结构 (如交易强度) 的有用信息.
(2) 离散取值.
金融数据的一个重要的格变化是离散的, 而金融高频的价格取值变化受交易规则的影响, 离散取值更加集中于离散构件. 价格的变化在不同的证券交易所设置不同的离散构件, 称之为变化档位, 我国证券交易所规定股价变化的*小档位为 0.01 元; 在纽约证券交易所 (NYSE) 中, *小档位在 1997年 6 月 24 日以前是 1/8 美元, 2001 年 1 月 29 日以前是 1/16 美元.
(3) 日内模式.
金融高频数据还存在明显的日内模式, 如波动率的日内 “U” 型走势. 每天早上开盘和下午收盘时交易*为活跃, 而中午休息时间交易淡, 随之而来的交易间的时间间隔也呈现出日内循环模式的特征. Mclnish 和 Wood 对价格波动率的日内模行了探索, 发现波动率在早上开盘和下午收盘时往往较大, 交易量以及买卖价差也呈现出同样的变化模式. Engle 和 Russell 对交易持续时间 (Duration)的日内模行了研究, 也得出了类似的结论, 从图形上来看变化模式类似于倒“U” 型.
(4) 自相关.
高频数据与低频数据一个大的区别在于高频数据具有强的自相关. 高频数据的离散取值以及买卖价差等因素是导致强自相关的原因, 还有一些因素, 如一些大额交易者往往将头分散交易以实现*优的交易价格, 这可能导致价格同方向变动从而引起序列的强自相关. 此外, 还有许多其他因素导致高频数据的强自相关.
金融高频数据的特征远不止这些, 数据含众多的信息维度, 如交易的时间间隔、交易量、买卖价差等. 这些不同的信息维度对于理解市场微观结构具有相当重要的作用, 正是由于金融高频数据的征, 传统的计量分析模型在实际应用中遇到了许多问题. 高频数据波动率作为衡量金融风险大小的一种重要指标已经被广泛用于金融资产风险管理、金融资产及其衍生产品定价等各个领域.
1.2 自适应分解方法的发展现状
回溯信号分析方法的整个发展历程可以发现, 不同的信号分析方是为了满足人们对不同类型信号的不同特征而发展[1]. 对稳的线信号或者周期信号, 可以采用傅里叶变换等频域变换的方法得到关于信号全局上的频谱信息; 对于稳或非线信号, 人们对于信号局部的频谱特征更加感兴趣, 相应地必须采用时频分析方法得到信号的时频联合信息, 比如短时傅里叶变换、Wigner-Ville分布和小波变换.
大多数时频分析方法都是直接针对变化的频率提出的, 并以傅里叶变换为*终理论依据, 都采用积分分析法. 归纳这些由傅里叶变换理论 (演变) 得来的时频分析方法, 按导出方式可以分为三类: 一是直接对傅里叶变换的基函行改造,如 Radon 变换、分数阶傅里叶变换和小波变换等; 二是先由信号得到一个双线函数, 行傅里叶变换, 如 Wigner-Ville 分布等; 三是先对信号加窗, 行傅里叶变换, 如短时傅里叶变换和 Gabor 变换等. 类时频分析方法一般只适用于某类信号, 如 Radon 变换适用于分析调频信号, 而小波变换适用于分析具有自相似结构的信号; 类时频分析方法一般会造成交叉项的困扰; 第三类时频分析方法通常需假设信号是局稳的, 这些方法均受傅里叶变换不足的制约. 傅里叶变换理论是将信号分解成无始无终的正弦信号的加权和, 当信号仅由几个信号组成时, 用傅里叶变换比较理想. 但如果信号极不规则, 用傅里叶变换需要许多的正弦信号来拼凑, 因而容易产生虚假的正弦信号和假频现象. 将基于傅里叶变换理论的时频分析方法用于一般的非线稳信号时, 也会出现虚假信号和假频现象, 如 Winger-Ville 分布会有交叉项, 小波分解会明显出现多余信号等.
之, 由于基于傅里叶变换理论的时频分析方法的基函数是比较固定的, 缺乏自适应或自适应差, 在表示时容易出现多余信号, 即使是波形匹配追踪法和 Chirplet 变换之类的自适应参数时频分析方法, 由于它们极函数的母函数是固定的, 因而它们的自适应也有限, 且计算复杂以致目前还很少有实例应用. 受Heierg 不确定原理的限制, 这些时频分析方法也不能描述频率间的变化.
理想地, 为了描述频率间的变化, 需要一种自适应比较好, 直观的瞬时频率分析方法. 1998 年美籍华人 N. E. Huang 等提出了一种新的信号法——经验模态分解 (Empirical Mode Decomposition, EMD). 该方法从本质上讲是对一个信稳化处理, 其结果是将信号中存在的不同尺度下的波动或变化趋势逐渐分解开来, 产生一系列具有不同特征尺度的数据序列, 每个序列成为一个固有模态函数 (Intrinsic Mode Function, IMF). 这里主要对经验模态分解、整体经验模态分解和局部均值分解的发展现结.
1.2.1 经验模态分解的研究现状
在 Huang 提出经验模态分解方法之后, 国内外的学者在此基础行了大量的研究. 其中法国工程师 Flandirn[2,3] 探索了 EMD 的滤波特, 在给出数值仿真结果的同时, 他的研究小组得到在白噪声条件下, EMD 如同小波一样, 等同于一个制滤波器的结论. 另外, Flandirn 在文章中呼吁: Hilbert-Huang 变换 (Hilbert-Huang Transform, HHT) 理论研究严重落后于其他理论研究的发展,希望有人能给出 HHT 的理论证明. 于是 Huang[4] 研究了基于白噪声条件下的EMD 统计特, 得到了与 Flandirn 同样的结果, 并在 2004 年公布了他的团队开发的 HHT 数据处理系统[5]. 2006 年, Kizhner 等[6] 发表了 “On certain theoretical developments underlying the Hilbert-Huang Transform” 一文, 公布了有关 HHT理论研究的*初成果, 得到如下四个结论: 1 验证了插值得络均似为信号的慢变成分, 从而证明了信号的*快变成分; 2 基于三次样条插值的收敛, 得到 EMD 的收敛速似为 O(1/2k.1); 3 发现了 IMF 结构为零极点对称模态与零振幅模态交叉出现的结构; 4 经验地验证了 IMF 是相互正交的.
受此文章的启发, Chen[7] 采用 B 样条插值代替三次样条求取上络, 给出了一种可选择的 EMD 方法, 由于 B 样条比三次样条有着更丰富的数学内涵, 是 B 样条函数在希尔伯特变换下, 许多优良的数学特能够保留, 从而能够分解出更多的 IMF, 并有效提高 IMF 的正交. 然而, 虽然 B 样条有着数学基础的优势, 但 B 样条的引入同样会产生问题, 比如, 样条次数对 EMD 结果正交的影响等问题. 此外, 为探索 IMF 严格的数学定义, Qian[8], Felerg[9] 从单分组信号入手, 寻求 HHT 的数学根源, 探索 IMF 的本质.
由于一维 EMD 算法能够提取信号的固有变化特, 研究人员试图把 EMD算法推广到二维甚是更高维情况, 从而提取数字图像的某种本质属. 然而, 如同数百年来人们在理论研究中所遇到的困难一样, 同一个问题或者算法推到更高维的时候, 问题的复杂度会大幅度的增加. 一种简单的被称为 “伪二维 EMD”[10]方法应运而生, 这种方法将图像按行或列当作一维信号处理, 但是, 明显的缺点是会产生内部不连续. 虽然伪二维 EMD 方法取得了一些成果, 但仍然有许多学者试图探索真正的二维 EMD 方法.
我国学者在 EMD 方法的理论和应用方面都做了大量的研究. 钟佑明[11] 借助振动理论模型初步探索了 EMD 算法中 IMF 应满足的一般数学条件, 并概要地建立了其数学模型. 罗奇峰[12] 分析对比了 EMD 变换与傅里叶变换以及小波变换. 钱涛[13] 提出了可以采用复分析以及测度手段等方法对 IMF 数学理行严格的推理证明, 但其只给出了大致的研究思路, 而并未给出严格的证明过程. 陈仲英[14] 结合 Bedrosian 定理的数学理论, 将 Hilbert-Huang 变换方法推广到广义的函数空间.
在应用方面, 尹逊福[15] 将 EMD 方法应用于具有典型非线稳特的海流信号分析中, 结果显示: EMD 方法在非线时频分析方面具有很强的优势. 陈淼峰[16] 将 EMD 应用于故障诊断领域, 并将其与传统时频分析方法相结合来共同提取信号中存在的局部瞬时特征物理量. 杨志华[17] 将 EMD 应用于光学信号的研究中. 戴吾蛟[18] 将 EMD 算法应用于滤波领域和噪声消除中. 此外, 有关EMD 的应用研究还遍及很多领域. EMD 分析方法作为一种新的信号分析和法, 它的深入研究将为信号处理领域提供新的思路, 极大地推动工程应用的发展.
1.2.2 整体经验模态分解的研究现状
为了减少 EMD 模态混叠的现象, 提高 EMD 的分解效率, Wu 和 Huang 等将噪声辅助信号处理 (NADA) 应用到 EMD 方法中, 提出了整体经验模态分解