跳转至

第79章 波动率建模与波动率交易

补充章节:Volatility Modeling & Volatility Trading(原书出版后的市场发展)

在第20章中,Harris 将波动率分为基本面波动(由信息驱动的价格变化)和暂时性波动(由流动性冲击和噪声交易导致的短期价格扰动),为理解价格变动的来源提供了直觉框架。在第40章中,我们考察了期权市场的微观结构——做市商如何管理 Delta 和 Gamma 暴露。在第76章中,我们讨论了 VaR 和尾部风险度量,但主要将波动率作为风险管理的输入,而非一个可以独立建模和交易的对象。

然而,波动率本身就是一种资产类别。全球波动率市场(VIX 期货与期权、方差互换、波动率 ETN)的日均名义交易量超过数百亿美元。对于量化交易者而言,波动率建模是多个核心能力的交汇点:准确的波动率预测直接影响期权定价(第40章)、做市报价宽度(第75章)、风险度量的精度(第76章)和组合权重的优化(第67章)。

本章将从波动率的程式化事实出发,系统介绍 GARCH 族条件波动率模型、高频已实现波动率估计、隐含波动率曲面建模,并最终讨论波动率交易策略及加密市场的独特波动率特征。


79.1 波动率的程式化事实

在构建任何波动率模型之前,我们需要理解波动率的经验特征——这些程式化事实(Stylized Facts)是任何成功模型必须捕获的"最低要求"。

79.1.1 波动率聚集(Volatility Clustering)

金融收益率序列最显著的特征之一是:大幅波动之后往往跟随大幅波动,小幅波动之后往往跟随小幅波动。Mandelbrot (1963) 首次记录了这一现象:"Large changes tend to be followed by large changes, of either sign, and small changes tend to be followed by small changes."

数学上,这意味着收益率本身几乎不存在自相关,但收益率的绝对值或平方具有显著的正自相关:

\[\text{Corr}(r_t, r_{t+k}) \approx 0, \quad \text{但} \quad \text{Corr}(|r_t|, |r_{t+k}|) > 0 \text{ 且衰减缓慢}\]

绝对收益率的自相关函数(ACF)呈幂律衰减而非指数衰减,半衰期可长达数十个交易日。这一"长记忆"特征对短期波动率预测意义重大:今天的高波动率包含了关于明天甚至下周波动率水平的大量信息。

79.1.2 均值回归(Mean Reversion)

尽管短期内波动率具有持续性,长期来看波动率围绕一个长期均值上下波动——它不会无限上升(即使在危机中),也不会永远保持极低水平(即使在最平静的时期)。

VIX 指数的历史分布提供了直觉:VIX 的长期中位数约为 17-18,绝大多数时间在 12-30 之间波动。VIX 突破 40 的事件极为罕见(2008年、2020年3月),但每次都会在数周到数月内回落。这意味着波动率的条件分布是非对称的:从低位向上的跳升比从高位向下的衰减更为剧烈和突然。

79.1.3 杠杆效应(Leverage Effect)

股票收益率与波动率之间存在负相关——即股价下跌时波动率倾向于上升,股价上涨时波动率倾向于下降。Black (1976) 首先记录了这一现象并将其命名为"杠杆效应",因为股价下跌会增加公司的财务杠杆(债务/权益比),从而增加权益的风险。

实证上,杠杆效应在股票市场极为显著:标普500指数日收益率与 VIX 变动的相关系数约为 \(-0.75\)。这一不对称性意味着对称的波动率模型(如标准 GARCH)会系统性地低估下行风险中的波动率跳升。

值得注意的是,在加密货币市场中,杠杆效应的方向并不一致。BTC 的收益率-波动率相关性在不同时期可以为正也可以为负——大幅上涨(如2021年牛市冲顶)同样可以伴随波动率飙升,因为上涨往往由杠杆多头的FOMO驱动。

79.1.4 厚尾与跳跃(Fat Tails & Jumps)

金融收益率的分布具有比正态分布更厚的尾部。标普500日收益率的峰度(kurtosis)约为 8-12(正态分布为 3)。这意味着"3σ 事件"(理论上每年约 1 次)在现实中可能每年出现 5-10 次,而"5σ 事件"(理论上数千年一遇)可能每隔数年就发生一次。

厚尾可以被视为两种机制的叠加:随机波动率(波动率本身随时间变化,使条件正态的混合分布呈现无条件厚尾)和跳跃(价格偶尔发生非连续性的大幅变动,如闪崩或重大消息公告)。


79.2 GARCH 族模型

79.2.1 GARCH(1,1):波动率建模的基准

Bollerslev (1986) 提出的 GARCH(1,1)(广义自回归条件异方差)模型是条件波动率建模的行业标准。模型结构为:

\[r_t = \mu + \epsilon_t, \quad \epsilon_t = \sigma_t z_t, \quad z_t \sim N(0, 1)\]
\[\sigma_t^2 = \omega + \alpha \epsilon_{t-1}^2 + \beta \sigma_{t-1}^2\]

其中 \(\sigma_t^2\) 是条件方差,\(\omega > 0\)\(\alpha \geq 0\)\(\beta \geq 0\) 是模型参数,且要求 \(\alpha + \beta < 1\) 以保证平稳性。

参数的直觉解释: - \(\omega / (1 - \alpha - \beta)\) 是长期(无条件)方差 - \(\alpha\) 控制新息冲击的反应速度——\(\alpha\) 越大,波动率对最近的极端收益反应越剧烈 - \(\beta\) 控制波动率的持续性——\(\beta\) 越大,高波动状态持续越久 - \(\alpha + \beta\) 度量波动率冲击的半衰期\(t_{1/2} = -\ln 2 / \ln(\alpha + \beta)\)

典型参数值(日频数据):标普500 的 GARCH(1,1) 参数通常约为 \(\alpha \approx 0.05\)-\(0.10\)\(\beta \approx 0.85\)-\(0.90\)\(\alpha + \beta \approx 0.95\)-\(0.98\),对应波动率冲击的半衰期约为 14-34 个交易日。BTC 的参数通常显示更高的 \(\alpha\)(约 0.10-0.15)和更低的 \(\beta\)(约 0.80-0.85),反映了加密市场波动率对新冲击的反应更快但持续性稍弱。

79.2.2 EGARCH:捕获杠杆效应

Nelson (1991) 提出的 EGARCH(指数 GARCH)模型通过对数形式建模条件方差,自然地捕获了杠杆效应:

\[\ln \sigma_t^2 = \omega + \alpha \left( |z_{t-1}| - \mathbb{E}[|z_{t-1}|] \right) + \gamma z_{t-1} + \beta \ln \sigma_{t-1}^2\]

其中 \(\gamma\) 是杠杆效应参数。当 \(\gamma < 0\) 时(股票市场的典型情况),负收益率冲击(\(z_{t-1} < 0\))对波动率的影响大于同等幅度的正收益率冲击。

EGARCH 的另一个优势是:由于对 \(\ln \sigma_t^2\) 建模,条件方差自动为正,无需对参数施加非负约束。

79.2.3 GJR-GARCH:另一种不对称模型

Glosten, Jagannathan & Runkle (1993) 提出的 GJR-GARCH 模型以更直接的方式引入不对称性:

\[\sigma_t^2 = \omega + (\alpha + \gamma \cdot \mathbb{I}_{[\epsilon_{t-1} < 0]}) \epsilon_{t-1}^2 + \beta \sigma_{t-1}^2\]

其中 \(\mathbb{I}_{[\epsilon_{t-1} < 0]}\) 是指示函数,当 \(\epsilon_{t-1} < 0\) 时取值1,否则为0。参数 \(\gamma > 0\) 表示负冲击比正冲击产生更大的波动率效应。

EGARCH vs GJR-GARCH 的选择:在实践中,两者的预测性能通常非常接近。GJR-GARCH 的参数更易解释(\(\gamma\) 直接度量不对称性的大小),而 EGARCH 在极端情况下的数值稳定性更好。


79.3 已实现波动率与高频估计

79.3.1 已实现波动率(Realized Volatility, RV)

当高频数据可用时,我们不再需要依赖模型来"估计"波动率——可以直接从日内收益率的平方和度量它。已实现波动率定义为:

\[\text{RV}_t = \sum_{i=1}^{n} r_{t,i}^2\]

其中 \(r_{t,i}\) 是第 \(t\) 日内第 \(i\) 个时间间隔的收益率,\(n\) 是日内采样数。当采样频率趋近于无穷时(\(n \to \infty\)),RV 收敛于真实的积分方差(integrated variance)\(\int_0^T \sigma_s^2 ds\)

采样频率的选择是 RV 估计中最重要的实践问题。理论上,采样频率越高越好。但在现实中,微观结构噪声(Microstructure Noise)——来自买卖价差反弹、离散价格格、异步交易等——会在极高频率下严重污染 RV 估计。

经验法则是使用 5 分钟采样频率作为权衡噪声与精度的折中。对于高流动性资产(如 ES 期货、BTC/USDT),1-2 分钟采样仍然可行;对于低流动性资产,15 分钟或更低的频率更为稳健。

79.3.2 已实现核(Realized Kernel)

Barndorff-Nielsen, Hansen, Lunde & Shephard (2008) 提出的已实现核(Realized Kernel)估计量通过加权自协方差的方式修正微观结构噪声的偏差:

\[\text{RK}_t = \sum_{h=-H}^{H} k\left(\frac{h}{H+1}\right) \hat{\gamma}_h\]

其中 \(k(\cdot)\) 是核函数(如 Parzen 核),\(\hat{\gamma}_h\) 是日内收益率的第 \(h\) 阶样本自协方差,\(H\) 是带宽参数。RK 的收敛速率为 \(n^{-2/3}\),优于简单 RV 在噪声环境下的表现。

79.3.3 双尺度估计量(Two-Scale Estimator)

Zhang, Mykland & Aït-Sahalia (2005) 提出的双尺度估计量(TSRV)是另一种去噪方法。核心思想是:用高频 RV(包含噪声偏差)减去噪声的估计值(从更高频率的自协方差中提取),得到修正后的估计:

\[\text{TSRV} = \text{RV}^{(\text{slow})} - \frac{n_{\text{slow}}}{n_{\text{fast}}} \text{RV}^{(\text{fast})}\]

其中"slow"和"fast"分别对应低频和高频的网格。

79.3.4 已实现波动率的预测:HAR-RV 模型

Corsi (2009) 提出的 HAR-RV(Heterogeneous Autoregressive Realized Volatility)模型是当前已实现波动率预测的标准工具:

\[\text{RV}_{t+1} = \beta_0 + \beta_d \text{RV}_t + \beta_w \text{RV}_{t}^{(w)} + \beta_m \text{RV}_{t}^{(m)} + \epsilon_{t+1}\]

其中 \(\text{RV}_t\) 是日 RV,\(\text{RV}_t^{(w)} = \frac{1}{5}\sum_{i=0}^{4} \text{RV}_{t-i}\) 是周均 RV,\(\text{RV}_t^{(m)} = \frac{1}{22}\sum_{i=0}^{21} \text{RV}_{t-i}\) 是月均 RV。

HAR-RV 的成功在于它以简单的线性模型捕获了波动率的多尺度持续性(短期反应 + 中期持续 + 长期均值回归),解释力通常优于 GARCH 族模型。


79.4 隐含波动率曲面建模

79.4.1 波动率微笑与偏斜

Black-Scholes 模型假设波动率是常数,但现实中不同行权价和到期日的期权对应不同的隐含波动率(IV)。将 IV 视为行权价 \(K\) 和到期日 \(T\) 的函数,就得到了隐含波动率曲面(Implied Volatility Surface)

典型的波动率曲面特征包括: - 微笑(Smile):深度虚值看涨和深度虚值看跌期权的 IV 高于平值期权。在外汇市场和加密市场中尤为明显。 - 偏斜(Skew):虚值看跌期权的 IV 系统性高于虚值看涨期权。在股票市场中普遍存在,反映了投资者对下行尾部风险的保护需求。 - 期限结构(Term Structure):短期 IV 波动剧烈,长期 IV 更为稳定,反映了波动率的均值回归特征。

79.4.2 SVI 参数化

Gatheral (2004) 提出的 SVI(Stochastic Volatility Inspired)参数化是拟合波动率微笑的行业标准。对于给定到期日 \(T\),SVI 将总隐含方差 \(w(k) = \sigma^2(k) T\)(其中 \(k = \ln(K/F)\) 是 log-moneyness)参数化为:

\[w(k) = a + b \left( \rho(k - m) + \sqrt{(k - m)^2 + \sigma_{\text{svi}}^2} \right)\]

5个参数 \((a, b, \rho, m, \sigma_{\text{svi}})\) 分别控制整体水平、斜率倾斜度、偏斜方向、位移和曲率。SVI 的优势在于:参数数量少且可解释、保证无静态套利(在合适的约束下)、且能通过线性回归高效拟合。

79.4.3 SABR 模型

Hagan, Kumar, Lesniewski & Woodward (2002) 提出的 SABR(Stochastic Alpha Beta Rho)模型是利率和外汇期权市场的标准波动率模型:

\[dF_t = \sigma_t F_t^\beta \, dW_1, \quad d\sigma_t = \alpha \sigma_t \, dW_2, \quad dW_1 \cdot dW_2 = \rho \, dt\]

其中 \(F_t\) 是远期价格,\(\sigma_t\) 是随机波动率,\(\beta \in [0, 1]\) 控制 CEV 指数,\(\alpha\) 是波动率的波动率(vol-of-vol),\(\rho\) 是价格与波动率的相关性。Hagan 等人给出了隐含波动率的闭式近似解,使得模型可以快速校准。


79.5 波动率交易策略

79.5.1 方差互换(Variance Swap)

方差互换是最纯粹的波动率交易工具。买方支付固定的"行权方差"\(K_{\text{var}}\)(即预期已实现方差),卖方支付已实现方差 \(\text{RV}^2\)。到期支付为:

\[\text{Payoff} = N_{\text{var}} \times (\text{RV}^2 - K_{\text{var}})\]

方差风险溢价(Variance Risk Premium, VRP)是波动率交易的核心驱动力。实证研究一致发现,隐含方差(\(K_{\text{var}} \approx \text{VIX}^2\))系统性地高于后续的已实现方差——即投资者为波动率保险支付了正溢价。标普500 的 VRP 平均约为 3-5 个波动率点(年化),这使得系统性地卖出方差互换(或卖出跨式组合)成为一个长期正期望的策略。

但 VRP 的分布极度右偏:大部分时间小幅盈利,偶尔遭受巨大亏损(当已实现波动率飙升超过隐含波动率时)。2018年2月的"Volmageddon"事件中,XIV(反向 VIX ETN)单日暴跌超过90%并随后清盘,正是卖出波动率策略尾部风险的极端体现。

79.5.2 波动率的波动率(Vol-of-Vol)

波动率本身也有波动率。VVIX(VIX 的隐含波动率)衡量的是市场对 VIX 变动幅度的预期。当 VVIX 极高时,意味着市场对波动率的未来路径高度不确定——这通常发生在危机的初期阶段。

交易应用:当 VVIX 处于历史高位(>130)时,期权的 Gamma 和 Vega 定价通常过高,系统性卖出远月 VIX 看涨期权的风险收益比较好;当 VVIX 处于历史低位(<80)时,波动率的波动率被低估,买入跨月 VIX 日历价差可以获利。

79.5.3 波动率均值回归策略

基于波动率的均值回归特征,当 IV 偏离其历史均值足够远时进行反向交易:

  • IV 极高时(如 VIX > 30):卖出波动率(卖出跨式/宽跨式、卖出方差互换)
  • IV 极低时(如 VIX < 13):买入波动率(买入跨式/宽跨式、买入 VIX 看涨期权)

实践中的关键是进场时机和仓位管理。波动率可以在极端水平停留的时间远超预期("市场保持非理性的时间可以超过你保持偿付能力的时间")。因此,均值回归策略通常使用分批建仓、期权组合(限制最大亏损)和严格的止损规则。


79.6 加密市场波动率特征

加密货币市场的波动率特征在多个方面与传统金融市场显著不同:

79.6.1 整体波动率水平

BTC 的年化波动率在不同市场环境下差异巨大:牛市冲顶阶段约 80%-120%,横盘整理阶段约 30%-50%,熊市底部约 40%-70%。作为对比,标普500 的年化波动率通常在 12%-25% 之间。这意味着在加密市场做市或交易期权时,波动率参数的校准频率需要远高于传统市场。

79.6.2 周末效应与 7x24 连续交易

传统市场在周末和节假日关闭,波动率在周一开盘时通常出现跳升("周一效应")。加密市场 7x24 连续交易,消除了这一不连续性,但引入了新的模式:

  • 周末流动性下降:做市商在周末减少报价,订单簿深度变薄,同等规模的订单产生更大的价格冲击。
  • 周末波动率溢价:由于流动性下降和机构参与度降低,BTC 的周末小时波动率约为工作日的 1.2-1.5 倍。
  • 对期权定价的影响:加密期权的日历日 vs 交易日问题——与传统市场不同,加密期权应使用日历日(365天)而非交易日(252天)来年化波动率。

79.6.3 清算驱动的波动率(Liquidation-Driven Volatility)

加密市场的高杠杆生态(参见第56章第59章)创造了一种传统市场中不存在的波动率机制:清算瀑布(Liquidation Cascade)

当价格下跌触及大量杠杆多头的清算价格时,清算引擎的强制卖出进一步压低价格,触发更多清算——形成正反馈循环。2021年5月19日,BTC 从约 43,000 美元在数小时内暴跌至约 30,000 美元,全网清算金额超过 80 亿美元。这种机制意味着加密市场的波动率分布具有比传统市场更极端的左尾厚度(在下跌方向)。

对波动率建模而言,清算集群的存在意味着标准 GARCH 模型可能不够——需要引入跳跃-扩散(Jump-Diffusion)成分或regime-switching机制来捕获这些非连续性事件。

79.6.4 DVOL 与加密波动率指数

Deribit 交易所发布的 DVOL(Deribit Volatility Index)是加密市场的 VIX 等价物,基于 BTC 和 ETH 期权的隐含波动率计算。DVOL 的典型范围为 40-100(远高于 VIX 的 12-30),且均值回归特征不如 VIX 明显——部分原因是加密资产处于更早期的生命周期阶段,长期波动率水平本身在结构性下降中。

DVOL 与 BTC 已实现波动率之间的方差风险溢价约为 5-15 个波动率点,显著高于传统市场。这反映了加密波动率市场的两个特征:(1) 波动率保险需求大(清算风险驱动),(2) 波动率卖方供给有限(缺乏大型机构的系统性卖出)。

主要参考资料

  1. Volatility and Correlation: The Perfect Hedger and the Fox (Riccardo Rebonato, 2004) — 波动率建模与对冲的实务参考,连接模型理论与交易实践
  2. The Volatility Surface: A Practitioner's Guide (Jim Gatheral, 2006) — SVI 参数化和随机波动率模型的权威来源
  3. Measuring and Modelling Volatility (Torben Andersen et al., 2006) — 已实现波动率研究的系统综述
  4. Volatility Trading (Euan Sinclair, 2nd ed., 2013) — 波动率交易策略的实战手册,涵盖 VRP、均值回归和仓位管理
  5. Generalized Autoregressive Conditional Heteroskedasticity (Tim Bollerslev, 1986) — GARCH 模型的原始论文
  6. A Simple, Positive Semi-definite, Heteroskedasticity and Autocorrelation Consistent Covariance Matrix (Barndorff-Nielsen et al., 2008) — Realized Kernel 估计量的理论基础
  7. Managing the Volatility Risk Premium (Deribit Research, 2023) — 加密市场方差风险溢价的实证分析与 DVOL 应用