没有合适的资源?快使用搜索试试~ 我知道了~
收益预测模型1.PDF
需积分: 0 3 下载量 76 浏览量
2022-08-03
15:04:36
上传
评论
收藏 1.11MB PDF 举报
温馨提示
试读
21页
2. 收益预测模型 6 3. 关于回测结果的讨论 16 4. 总结 18
资源推荐
资源详情
资源评论
量化策略专题报告
请务必阅读正文之后的免责条款部分 1 of 21
量
化
研
究
证
券
研
究
报
告
专
题
报
告
证券分析师
宋旸
18222076300
songyang@bhzq.com
助理分析师
李莘泰
022-23873122
lizt@bhzq.com
核心观点:
内容
1、 在上一篇报告《多因子模型研究之一:单因子测试》中,我们介绍了多
因子模型建立的第一步:单因子测试的具体方法与回测结果,最终选出
十余个各方面表现较为优异的因子。本篇报告中,我们首先介绍了因子
多重共线性的判定标准与处理方法,并综合多重共线性分析,最终确定
了 7 个大类 12 个因子作为建立多因子模型的因子池。
2、 接下来,我们尝试了四种收益预测模型,分别为移动均值模型、指数加
权移动均值模型、因子 IC 优化模型(原始模型和矩阵压缩模型),以及
机器学习中的逻辑回归模型。最终,表现较为优秀的三种收益预测模型
为:移动均值模型、逻辑回归模型以及因子 IC 优化压缩矩阵模型。我们
选择了 12 个月的移动均值模型、24 个月的逻辑回归模型以及 24 个月的
因子 IC 优化压缩矩阵模型进行横向比较。通过比较这三种方法的回测结
果,我们发现,逻辑回归模型收益率最高,波动率也最大。因子 IC 优化
压缩矩阵模型波动率最低,收益也最低。移动平均模型则介于二者之间。
对冲中证 500 指数之后,因子 IC 优化压缩矩阵模型最大回撤仅 7.08%,
夏普比率高达 3.2,在几种模型种表现最好。
3、 最后,我们简单分析了模型表现的原因。均值法给出的因子权重比较分
散,预测序列较为平滑,且能比较好的反应因子变化的大趋势,但缺点
是有一定的滞后性。EWMA 模型对近期因子的变化更为敏感,但这种预
测有时在因子收益率震荡剧烈时反而会适得其反。ICshrink 模型和因子
收益序列的关系则比较复杂。而逻辑回归给出的因子权重集中在了市值、
动量、波动率等少数几个因子上,从历史经验来看,这几个因子也是选
股区分度最高的。这也就不难理解为什么在牛市中逻辑回归模型表现如
此惊人,但当面对 2017 年风格转换行情时,过去区分度高的因子开始
失效,逻辑回归模型从而产生了较大回撤。
4、 在实际操作中,可根据自身需求,选择适当收益预测模型。我们在未来
的研究中,也会继续尝试更多模型,以求取得更优异的选股结果。
多因子模型研究之二:收益预测模型
分析师:宋旸 SAC NO:S1150517100002 2017 年 12 月 29 日
量化策略专题报告
请务必阅读正文之后的免责条款部分 2 of 21
目 录
1.因子共线性判断与处理 .......................................................... 4
1.1 因子共线性的判断依据 ...................................................... 4
1.2 因子共线性的处理 .......................................................... 5
1.3 最终入选因子 .............................................................. 5
2. 收益预测模型 .................................................................. 6
2.1 移动均值模型 .............................................................. 6
2.2 指数加权移动平均法(EWMA) ................................................ 7
2.3 基于因子 IC 的优化模型 ..................................................... 9
2.3.1 因子 IC 优化原始模型 ................................................. 9
2.3.2 因子 IC 优化压缩矩阵模型 ............................................ 11
2.4 逻辑回归 ................................................................. 12
2.5 几种收益预测模型的综合对比 ............................................... 14
3. 关于回测结果的讨论 ........................................................... 16
3.1 三种线性回归方法的直观对比 ............................................... 16
3.2 线性回归与逻辑回归对比 ................................................... 17
4. 总结 ......................................................................... 18
量化策略专题报告
请务必阅读正文之后的免责条款部分 3 of 21
表目录
表 1:多因子模型入选因子汇总 ............................................................................................................................ 6
表 2:移动均值模型历史回测统计结果 ................................................................................................................ 7
表 3:移动均值模型年度收益率统计 .................................................................................................................... 7
表 4:指数加权移动平均模型统计结果 ................................................................................................................ 9
表 5:指数加权移动平均模型年度收益率统计 .................................................................................................... 9
表 6:因子 IC 优化原始模型统计结果 ................................................................................................................ 10
表 7:因子 IC 优化原始模型年度收益率统计 .................................................................................................... 11
表 8:因子 IC 优化压缩矩阵模型统计结果 ........................................................................................................ 12
表 9:因子 IC 优化压缩矩阵模型年度收益率统计 ............................................................................................ 12
表 10:逻辑回归模型统计结果 ............................................................................................................................ 13
表 11:逻辑回归模型年度收益率统计 ................................................................................................................ 13
表 12:模型对比统计结果 .................................................................................................................................... 14
表 13:模型对比年度收益率统计 ........................................................................................................................ 14
表 14:模型对冲指数对比统计结果 .................................................................................................................... 15
图目录
图 1:移动均值模型历史回测图 ............................................................................................................................ 7
图 2:指数加权移动平均历史回测图 .................................................................................................................... 8
图 3:因子 IC 优化原始模型历史回测图 ............................................................................................................ 10
图 4:因子 IC 优化压缩矩阵模型历史回测图 .................................................................................................... 12
图 5:逻辑回归模型历史回测图 .......................................................................................................................... 13
图 6:模型对比历史回测图.................................................................................................................................. 14
图 7:模型对冲中证 500 指数历史回测图 .......................................................................................................... 15
图 8:模型对冲沪深 300 指数历史回测图 .......................................................................................................... 15
图 9:三种线性回归方法关于 size 因子的取值对比 ........................................................................................ 16
图 10:移动平均法(MA12)因子取值分布图 .................................................................................................... 17
图 11:逻辑回归法(Log12)因子取值分布图 .................................................................................................. 17
量化策略专题报告
请务必阅读正文之后的免责条款部分 4 of 21
1.因子共线性判断与处理
1.1 因子共线性的判断依据
在上一篇报告《多因子模型研究之一:单因子测试》中,我们介绍了多因子模型
建立的第一步:单因子测试的具体方法与回测结果,最终选出十余个各方面表现
较为优异的因子。但是,通过了单因子显著性测试的因子,在和其他因子共同构
建模型时,也可能出现问题。传统的多因子模型是线性回归模型,线性回归模型
中的解释变量之间如果存在高度相关关系,模型会失真或难以估计准确。所以在
建立收益预测模型之前,还需要对因子的多重共线性进行相应处理。
为解决这一问题,首先需要判断因子间是否存在多重共线性。判断多重共线性的
方法主要有以下几种:
1) 相关性矩阵:计算各因子历史序列的两两相关性,取平均值,得到相关性矩
阵,辨别出相关性较高因子。这是最直观判断多重共线性的方法。上一篇报
告中,已经给出了计算因子间相关性矩阵的例子。
2) VIF 检验:相关性矩阵给出了两两因子的相关性,但如果某因子与其他多个
因子间存在相互表示的线性关系,相关性矩阵则有可能无法检测出来,这就
需要引入 VIF 检验。VIF 是方差膨胀因子(Variance Inflation Factors)的英
文缩写,是统计学中常用的一种多重共线性检测手段。该方法通过检查指定
因子能够被回归方程中其他全部因子所解释的程度来检测多重共线性。通过
计算,得到方程中的每个因子的 VIF 值,过高的 VIF 值表明该因子的引入增
大了整个系统的多重共线性。值得强调的是,在一般统计教科书中,会建议
把 VIF>10 作为存在多重共线性的标志。但在多因子模型中,因子间的解释能
力本就较弱,VIF 普遍偏低,一般 VIF>4 的时候,因子的多重共线性已经比
较显著了。所以最终判断时仍应结合实际问题具体分析。
3) 逐步回归与 AIC 准则:在构建多因子模型时,采用逐步回归法,以下一期收
益率为被解释变量,逐个引入新因子,构成回归模型,计算拟合优度。根据
拟合优度的统计量决定新引入的因子对整个模型的贡献程度,如果贡献程度
大,则将该因子加入模型,如果不够大,则跳过该因子,测试下一因子。在
计算拟合优度统计量时,有很多标准可供选择。这里我们主要参考了 AIC,
即赤池信息准则(Akaike Information Criterion),其他值得参考的统计量还
包括贝叶斯信息准则(Bayesian Information Criterion,BIC)以及调整可决
系数(Adjusted
)。当我们在模型中不断加入因子时,模型的拟合程度会
量化策略专题报告
请务必阅读正文之后的免责条款部分 5 of 21
不断上升,但同时也会导致过拟合的问题。赤池信息准则通过在拟合优度后
加入模型复杂度的惩罚项来追求模型精度与复杂度的平衡。AIC 定义为:
其中 k 是模型参数个数,L 是似然函数。一般而言,当模型复杂度提高(k 增
大)时,似然函数 L 也会增大,从而使 AIC 减小,但是 k 过大时,模型过拟
合,似然函数增速减缓,AIC 反而增大。在逐步回归中,通过检查 AIC 值是
否增大,确定是否对因子进行处理,最终得到 AIC 最小的模型。
1.2 因子共线性的处理
对于确定存在共线性的因子,一般有如下三种处理方法:
1) 直接剔除:对于和其他因子表现出较高相关性,但又不能提供更多信息的因
子,一般采用直接剔除处理。
2) 因子合成:对于大类内因子,表现出一定相关性,又不能直接剔除的,可以
采用将小因子合成大因子的方式。如月度换手率、季度换手率、半年换手率
这三个因子相关性较强,可合并为流动性因子 LIQ。因子合并时可以采用等
权方式,也可以采用下文介绍的各种因子加权方式,本文中小类因子的合并
均采用等权方式。
3) 因子正交:大类间因子如表现出一定相关性,无论从直观理解,还是经济学
解释的角度都不适宜采用因子合并的方式,这时可以使用因子正交的手法,
将相关性较高的因子之一相对另一因子做回归,取回归残差项代替因子值。
1.3 最终入选因子
多因子模型的因子选取没有一定之规,更多的是综合单因子检测结果,多重共线
性分析,以及因子的经济学解释等多种因素做出的决定。在上一篇报告中,我们
通过单因子测试,对单个因子的有效性做了判断。再结合上文的因子共线性分析,
最终确定了如下 7 个大类 12 个因子作为我们下一步建立多因子模型的因子池。
其中大类内因子超过一个的,进行因子合成,之后再把动量因子、波动率因子、
流动性因子相对市值因子做因子正交,成长因子相对盈利因子做因子正交,得到
最终因子池。
剩余20页未读,继续阅读
资源评论
芊暖
- 粉丝: 22
- 资源: 340
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功