没有合适的资源?快使用搜索试试~ 我知道了~
20201123-华泰证券-华泰人工智能系列之三十八:WGAN生成,从单资产到多资产1
需积分: 0 0 下载量 99 浏览量
2022-08-03
22:26:38
上传
评论
收藏 2.29MB PDF 举报
温馨提示
试读
33页
研究背景:从单资产到多资产5典型化事实与生成序列评价指标 6经济学中的典型化事实 6单资产收益率序列的典型化事实与评价指标 6多资产收益率序列的典型化事实与评价
资源详情
资源评论
资源推荐
免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。
1
证券研究报告
金工研究/深度研究
2020 年11 月23 日
林晓明
SAC No. S0570516010001
研究员
李子钰
SAC No. S0570519110003
研究员
0755-23987436
何康
SAC No. S0570520080004
研究员
021-28972039
王晨宇
SAC No. S0570119110038
联系人
02138476179
1《金工: MOM 投资组合的构建全流程框架》
2020.11
2《金工: 风险平价模型的常见理解误区剖析》
2020.11
3《金工: 行业配置策略:景气度视角》2020.11
WGAN 生成:从单资产到多资产
华泰人工智能系列之三十八
将生成对抗网络的应用领域从单资产序列生成拓展至多资产序列生成
本研究将生成对抗网络的应用领域从单资产序列生成拓展至多资产序列生
成。多资产序列生成中,不仅需要模拟每种资产收益率的分布特征和时序
特性,还需要复现多资产之间的协变关系。为此必须在前期研究基础上进
行两项改造:1)增加评价多资产之间协变关系的指标;2)改变网络结构
使之能适应多资产输入。我们将改造后的 WGAN 模型应用于 1)相同类型
的三种股票指数以及 2)不同类型的股票、债券、商品指数收益率序列的
生成,结果表明 WGAN 能够复现真实序列具有的典型化事实,在评价指标
上相比对照组模型更接近真实序列。
从真实序列的典型化事实出发,设计多资产收益率序列评价指标
设计评价指标的出发点是典型化事实。经济学中的典型化事实是人们从经
济运行中观察到的客观现象的简化描述,也是对数据统计分析结果的高度
概括。本文研究的对象是多资产收益率时间序列,典型化事实既涉及单资
产序列本身,又涉及多资产序列间的协变关系。本文从真实的多资产序列
典型化事实出发,设计相应指标评价生成序列质量。在前期研究使用的厚
尾分布、波动率聚集等 6 项单资产序列评价指标的基础上,本文进一步设
计交叉相关性、波动率相关性、交叉杠杆效应、滚动相关系数分布相似度、
极端值相关性共 5项多资产收益率序列评价指标,衡量 WGAN的生成效果。
将 WGAN 判别器输入设置为多通道,以适用于多资产序列生成任务
本文在前期研究使用的 WGAN 基础上进行网络结构改造。在多资产生成的
应用场景下,为了使判别器 D 具有鉴别多资产序列的能力,我们将第一层
卷积层设置为多通道输入,每一通道对应一项资产。此时,判别器 D 不仅
能在时间序列维度上提取单资产时序相关性的局部特征,也能在通道维度
上提取多资产相关性的局部特征。我们将 WGAN 分别应用于 1)相同类型
资产(标普 500、上证综指、欧洲斯托克 50); 2)不同类型资产收益率序
列生成(沪深 300、中债-国债总财富指数、SGE 黄金 9999),并与对照组
Bootstrap 重采样和 MGARCH 模型等传统时间序列模拟方法进行比较。
WGAN 相比于对照组模型能够更好复现真实序列的典型化事实
结果表明,无论是单资产序列评价指标还是多资产序列评价指标,相较于
对照组 Bootstrap 和 MGARCH 方法,WGAN 生成的多资产序列均能更好
复现真实序列呈现的典型化事实,各项评价指标均与真实序列的结果较为
接近。尤其是单资产收益率的杠杆效应、粗细波动率相关和盈亏不对称性,
以及两资产收益率的 1 阶正相关性和交叉杠杆效应,对照组 Bootstrap 和
MGARCH 方法均无法复现真实序列具有的上述典型化事实。
风险提示:WGAN 生成虚假序列是对市场规律的探索,不构成任何投资建
议。深度学习模型存在过拟合的可能。深度学习模型是对历史规律的总结,
如果市场规律发生变化,模型存在失效的可能。
相关研究
金工研究/深度研究 | 2020 年 11 月 23 日
免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。
2
正文目录
研究背景:从单资产到多资产 ........................................................................................... 5
典型化事实与生成序列评价指标 ....................................................................................... 6
经济学中的典型化事实 .............................................................................................. 6
单资产收益率序列的典型化事实与评价指标 ............................................................. 6
多资产收益率序列的典型化事实与评价指标 ............................................................. 7
交叉相关性 ........................................................................................................ 7
波动率相关性 ..................................................................................................... 7
交叉杠杆效应 ..................................................................................................... 8
滚动相关系数分布相似度 ................................................................................... 8
极端值相关性 ..................................................................................................... 9
多资产序列的生成方法 .................................................................................................... 10
Wasserstein 生成对抗网络 WGAN .......................................................................... 10
基本原理 .......................................................................................................... 10
网络构建 .......................................................................................................... 10
训练样本 .......................................................................................................... 11
训练过程 .......................................................................................................... 12
对照组 1:Bootstrap 重采样 ................................................................................... 13
对照组 2:MGARCH 模型....................................................................................... 13
一元 GARCH 模型 ........................................................................................... 13
多元 MGARCH 模型 ........................................................................................ 14
BEKK-GARCH 生成多资产序列 ...................................................................... 14
实证测试 1:相同类型资产生成结果与讨论 .................................................................... 15
真实序列与生成序列展示 ........................................................................................ 15
真实序列展示 ................................................................................................... 15
WGAN 损失函数与生成序列展示 .................................................................... 15
对照组 Bootstrap 和 MGARCH 生成序列展示 ................................................. 16
评价指标对比 .......................................................................................................... 17
单资产序列评价指标 ........................................................................................ 17
多资产序列评价指标 ........................................................................................ 19
实证测试 2:不同类型资产生成结果与讨论 .................................................................... 23
真实序列与生成序列展示 ........................................................................................ 23
真实序列展示 ................................................................................................... 23
WGAN 损失函数与生成序列展示 .................................................................... 23
对照组 Bootstrap 和 MGARCH 生成序列展示 ................................................. 24
评价指标对比 .......................................................................................................... 25
单资产序列评价指标 ........................................................................................ 25
多资产序列评价指标 ........................................................................................ 26
bU8ViXaYeXjZaZqVvX9YsWdUnV6M8Q7NpNpPmOrRfQrQnMkPpNqM6MnPnPwMrQsQwMtQzR
金工研究/深度研究 | 2020 年 11 月 23 日
免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。
3
总结与展望 ...................................................................................................................... 29
参考文献 .................................................................................................................. 30
风险提示 .................................................................................................................. 30
图表目录
图表 1: 单资产收益率序列评价指标 ............................................................................... 7
图表 2: 多资产收益率序列协变关系评价指标 ................................................................ 7
图表 3: 多资产收益率序列协变关系评价指标参数取值 .................................................. 9
图表 4: 生成器 G 网络结构与参数 ............................................................................... 10
图表 5: 适用于多资产场景的一维卷积核示意图 ........................................................... 11
图表 6: 判别器 D 网络构建 .......................................................................................... 11
图表 7: WGAN 训练数据 .............................................................................................. 12
图表 8: 多元时间序列滚动生成训练样本示意图 ........................................................... 12
图表 9: WGAN 训练算法的伪代码 ............................................................................... 12
图表 10: WGAN 训练通用参数 .................................................................................... 13
图表 11: Bootstrap 重采样生成虚假序列示意图 ........................................................... 13
图表 12: 相同类型多资产收益率序列:真实样本 1 ...................................................... 15
图表 13: 相同类型多资产收益率序列:真实样本 2 ...................................................... 15
图表 14: 相同类型资产 WGAN 损失函数 ..................................................................... 16
图表 15: 相同类型多资产收益率序列:WGAN 生成样本 1.......................................... 16
图表 16: 相同类型多资产收益率序列:WGAN 生成样本 2.......................................... 16
图表 17: 相同类型多资产收益率序列:Bootstrap 生成样本 1 ..................................... 17
图表 18: 相同类型多资产收益率序列:Bootstrap 生成样本 2 ..................................... 17
图表 19: 相同类型多资产收益率序列:MGARCH 生成样本 1 ..................................... 17
图表 20: 相同类型多资产收益率序列:MGARCH 生成样本 2 ..................................... 17
图表 21: 标普 500:真实序列评价指标 ....................................................................... 18
图表 22: 标普 500:WGAN 生成序列评价指标 ........................................................... 18
图表 23: 标普 500:Bootstrap 生成序列评价指标 ....................................................... 19
图表 24: 标普 500:MGARCH 生成序列评价指标 ...................................................... 19
图表 25: 标普 500:真实序列与 3 种生成方法在单资产序列评价指标上的表现对比 .. 19
图表 26: 标普 500 vs 上证综指:真实序列相关性指标 ............................................... 20
图表 27: 标普 500 vs 欧洲斯托克 50:真实序列相关性指标 ...................................... 20
图表 28: 标普 500 vs 上证综指:WGAN 生成序列相关性指标 ................................... 20
图表 29: 标普 500 vs 欧洲斯托克 50:WGAN 生成序列相关性指标 .......................... 20
图表 30: 标普 500 vs 上证综指:Bootstrap 生成序列相关性指标 .............................. 21
图表 31: 标普 500 vs 欧洲斯托克 50:Bootstrap 生成序列相关性指标 ....................... 21
图表 32: 标普 500 vs 上证综指:MGARCH 生成序列相关性指标 .............................. 21
图表 33: 标普 500 vs 欧洲斯托克 50:MGARCH 生成序列相关性指标 ...................... 21
图表 34: 标普 500 vs 上证综指:不同生成方法相关性指标对比 ................................ 22
图表 35: 标普 500 vs 欧洲斯托克 50:不同生成方法相关性指标对比 ........................ 22
金工研究/深度研究 | 2020 年 11 月 23 日
免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。
4
图表 36: 不同类型多资产收益率序列:真实样本 1 ...................................................... 23
图表 37: 不同类型多资产收益率序列:真实样本 2 ...................................................... 23
图表 38: 不同类型资产 WGAN 损失函数 ..................................................................... 23
图表 39: 不同类型多资产收益率序列:WGAN 生成样本 1.......................................... 24
图表 40: 不同类型多资产收益率序列:WGAN 生成样本 2.......................................... 24
图表 41: 不同类型多资产收益率序列:Bootstrap 生成样本 1 ..................................... 24
图表 42: 不同类型多资产收益率序列:Bootstrap 生成样本 2 ..................................... 24
图表 43: 不同类型多资产收益率序列:MGARCH 生成样本 1 ..................................... 24
图表 44: 不同类型多资产收益率序列:MGARCH 生成样本 2 ..................................... 24
图表 45: 沪深 300 指数:真实序列评价指标 ............................................................... 25
图表 46: 沪深 300 指数:WGAN 生成序列评价指标 ................................................... 25
图表 47: 沪深 300 指数:Bootstrap 生成序列评价指标 ............................................... 26
图表 48: 沪深 300 指数:MGARCH 生成序列评价指标 .............................................. 26
图表 49: 沪深 300 指数:真实序列与 3 种生成方法在单资产序列评价指标上的表现对比
........................................................................................................................................ 26
图表 50: 沪深 300 指数 vs 中债-国债总财富指数:真实序列相关性指标 .................... 26
图表 51: 沪深 300 指数 vs SGE 黄金 9999:真实序列相关性指标 ............................. 26
图表 52: 沪深 300 vs 中债-国债:WGAN 生成序列相关性指标 .................................. 27
图表 53: 沪深 300 vs SGE 黄金 9999:WGAN 生成序列相关性指标 ......................... 27
图表 54: 沪深 300 vs 中债-国债:Bootstrap 生成序列相关性指标 .............................. 27
图表 55: 沪深 300 vs SGE 黄金 9999:Bootstrap 生成序列相关性指标 ..................... 27
图表 56: 沪深 300 vs 中债-国债:MGARCH 生成序列相关性指标 .............................. 28
图表 57: 沪深 300 vs SGE 黄金 9999:MGARCH 生成序列相关性指标 .................... 28
图表 58: 沪深 300 指数 vs 中债-国债总财富指数:不同生成方法相关性指标对比 ...... 28
图表 59: 沪深 300 指数 vs SGE 黄金 9999:不同生成方法相关性指标对比 ............... 28
金工研究/深度研究 | 2020 年 11 月 23 日
免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。
5
研究背景:从单资产到多资产
华泰金工“生成对抗网络”系列研究尝试将生成对抗网络 GAN 技术运用于量化投资研究,
目前已发布三篇研究报告,分别测试原始 GAN、WGAN、RGAN 三种模型生成单个资产
收益率序列的仿真效果。测试结果表明,生成对抗网络能够刻画单个资产真实收益率序列
所具备的统计特性,如厚尾分布、波动率聚集等,其中 WGAN 模型生成效果相对更佳。
然而在部分投资场景中,我们希望得到多个资产的仿真序列。生成对抗网络若仅能生成单
资产序列,即使生成效果再“逼真”,也会面临应用场景上的局限。那么,生成对抗网络
能否同时生成多个资产的时间序列?从技术上讲,生成本身并不难,通过改变网络结构就
可以较方便地实现,真正的难点在于,如何评价多资产序列的生成质量?
设想一下,随意写下几串随机数序列,也可以算某种意义上的“生成”,但生成效果显然
不会好。我们需要寻找一些评价指标,证明生成对抗网络的生成效果优于人脑随机生成或
其它方法。在前期研究中,我们从单资产收益率的厚尾分布、波动率聚集等特性出发,对
单资产生成序列进行评价,这些评价指标在经济学中也称为典型化事实。
典型化事实是对经济统计数据所反映客观现象的高度概括,具有一定客观性、稳定性和可
解释性,并可用以检验数据的可靠性。针对单资产收益率的典型化事实,学术界已有充分
论述,我们也已应用于前期研究。针对多资产收益率的典型化事实,可资借鉴的学术研究
相对较少。本文构建交叉相关性、波动率相关性、交叉杠杆效应、滚动相关系数分布相似
度、极端值相关性等指标,评价多资产序列两两之间的典型化事实。这些指标有自洽的数
学定义,对应的典型化事实同样具有直观的经济学含义。
本文首先简要回顾 WGAN 的基本思想、优化目标函数以及训练算法。前期研究中,WGAN
生成器和判别器的主体结构是卷积层和全连接层。在此基础上,本文对 WGAN 网络进行
必要改造,以适用于多资产序列生成。相比于单资产序列,我们在设计生成多资产序列的
WGAN 模型时,既要从形式上使其能够处理多资产序列的输入,又要从实质上使其能够
学习到多资产序列之间的相关关系。为达到这两点要求,本文提出的 WGAN 模型在判别
器的卷积层中,使用多个通道来处理多资产序列的输入。
实证环节,我们将分别测试 WGAN 对相同类型资产组合(标普 500 指数、上证综指、欧
洲斯托克 50 指数)和不同类型资产组合(沪深 300 指数、中债-国债总财富指数、SGE
黄金 9999)的生成效果,将生成序列与由 Bootstrap 和 MGARCH 方法生成的对照组进行
比较。结果表明,WGAN 生成的多资产收益率序列更符合真实序列蕴含的典型化事实。
剩余32页未读,继续阅读
设计师马丁
- 粉丝: 18
- 资源: 299
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0