EN

猎聘
猎聘专家
专注领域
CPSM模式
职位
策略研究类
技术开发类
综合职能类
数字货币类
洞察
量化白皮书
量化季刊
行业资讯
访谈报道
下载中心
我们
关于金融阶
我们的优势
加入金融阶

蒙玺投资李骧:低波动Alpha的构建

时间:2022-08-22 预览:

640.gif

1.jpg

我们可能在行业认知更多的是偏低延迟相关的CTA类策略,但是这几年比较发力的一块是和股票相关的策略,就是低波动Alpha业务,包括最近规模的增长也是和这块业务相关,包括行业一些资金方向相关的也是和这个策略相关,所以今天主要是分享一下低波动率Alpha的构建。

本文意在分享行业实践,不构成任何投资建议,如有谬误,欢迎斧正。

01

量化alpha来源

挖掘市场交易的无效性

回到量化本源的问题,量化为什么能够获取超额收益,当然这个超额收益是一个广义上的概念,你如何获取超出市场平均回报利率的收益,我个人觉得其实量化的核心竞争力就是你的研究实力相对于整个行业平均水平的超额值,当然这个超额值可能体现是比较多样化,如果让定义,觉得主要是能够体现在下面几块。

2.jpg

首先是数据,数据端这块超额我个人认为行业整体认知度偏低,因为我们比较知名的是偏高频类策略,这类数据来源其实是非常统一以及一致的,换句话说它的研究方向主要来源于策略。

因子和模型是构成策略的核心部件,因子用特征工程的观点来说就叫特征,尤其是现在大家应用比较多的一些模型和深度模型,特征相对来说对因子的要求偏低一些,有一些属于描述性特征,什么叫描述性特征?相当于单个因子或者单个特征并不具备很强的预测性,哪怕是一个市场短期波动率或者是市场简单的量价数据计算,单个因子如果用它来进行拟合,其实是获取不了太多的收益甚至是负向收益,但是你把它放到非线性模型,尤其是神经网络为主或者一些非线性模型里面,实际上能整体上增厚你的回撤收益。

大家叫得越来越多的是用特征来去代替因子,因为因子某种意义上来说,在的定义里面它本身是具有一定预测性的,特征可以只是描述性的,但是因为有非线性模型的强预测性效果在里面,所以一些描述性特征现在也被广泛运用到策略里面。还有另外一个重要的组成模块就是模型,当然用工程化的语言去说也可以叫特征组合,传统上的多因子模型或者经典多因子模型,用的因子普遍是具有预测性,而且模型一般来说是用线性模型,包括不限于一些简单的线性模型。

整个行业的发展最早大家运用的数据普遍都是偏一致性比较强的交易所推送来的数据,通过这一类数据来进行构建的因子以及进行预测,所以在数据这端大家的挖掘,到现在这个市场阶段整个数据层面大家的运用,我个人觉得是偏低的,但是中国的量化市场发展实际上也是非常具备特色的在策略的核心构建层面模型的发展实际上是大于或者速度是大于因子层面的研究,包括整个量化思路行业的快速发展,我觉得和机器学习的广泛应用实际上是分不开的,当然这是一个感性感知问题,因为公司有一些从海外回来比较资深的同事,他们反馈说国内在模型这块的研究,投入的不管是精力也好还是人力也好,某种程度上来说不亚于海外机构甚至优于海外机构,这也算是中国量化发展特有的一个特点。

在Alpha这个层面实际上还有风控优化模块,但总体来说风控优化这个模块并不能帮助我们来挖掘超额或者挖掘Alpha。所以Alpha的来源,我们认为主要来源于数据和策略以及执行。执行是一个什么概念?所有东西都具备了之后再去谈执行,执行只是一个锦上添花的作用,确保你发现的Alpha或者你发现的市场无效性能够得到最终的数据落实,什么概念?最简单的一个执行,比如希望卖的股票的价格是跑赢一个单圈或者卖得比较高,想买股票能够相对来说用比较低的价格去买入,所以是落实层面的一个问题。

说大一点就是,量化的研究应不局限于Alpha策略的研究,停留在模型。我个人觉得在数据这端大家的重视程度还不够,不过在整个行业层面来看,不管是在策略的因子端还是模型端,整个行业发展都是非常快速。


02

机器学习与传统线性

两大方法论比较

我所理解的整个行业的两大方法论,一类不能算是中国特色,但确实在短短几年,在量化私募这个行业内发展的如此迅速,和机器学习这个标签是密切相关的。自己作为一个参与者也深刻地感知到,其实中国是具备某种意义上是工程师Alpha,有大量做机器学习的人才,推动了这套方法论的发展。

3.jpg

先说一下机器学习类这部分的Alpha,这类数据产出来说我个人认为一致性比较强,大家用的数据来源都是由交易所推送,以及一些标准化的基本面数据,可能有些另类的数据,目前为止主要是集中在预期内的数据上。总体来说让我总结,我个人认为一致性比较强,因子的差异数据来源比较一致。

因子层面差异有,尤其是描述性因子,有些机构用的比例比较大,有些机构用的比例比较小。但总体来说因子的差异性有限,而且在应用的过程中发现它对因子的质量要求相对来说是比较低的,我刚才有提到描述性因子,它是单因子是不具备预测效果的,但放到因子库里,利用机器学习这套方法论进行拟合,做出来的效果都很不错,换句话说,因子数量多,但对质量要求相对比较低。不过发现你有高质量因子,对整个数据表现是有正向的,但它更多是注重数量而不是质量,所以其实大家普遍的做法是会运用大量的描述性因子,即使是不用描述性因子也会用延伸因子,由技术因子来产生,都放到因子库里做一定的处理,这样运用机器学习的拟合方式,都可以把这些因子运用到实际的交易当中。

它的组合优化层面风控是比较松的,因为我们在这个过程中做过研究,假如在风控层面,在风格曝露层面是严格的标准,它的超额下滑相对回撤来说幅度比较大,目前在自己这个维度是不会做过多的风控,收益特点也很特别,碰到行情好的时候,周度就有1%、2%的超额数据体现。换句话说,因子维度的差异性以及数据层面的差异性可以忽略不计,即使有差异,其实对结果的影响是比较小的,在这块方法论上,大家普遍的研究重心都在积极学习这个层面,加入说按照超额的来源会把这类方法论的超额来源归功于在模型端的预测情况。

这一大类的方法论它不是传统的、经典的Alpha。经典Alpha是非常注重风控的,一旦你是通过风格层面的暴露,就没有办法定义成Alpha,但无论是从什么数据来看,通过机器学习这套方式是能够获取超出指数收益的,而且收益目前数据比较高。

我们观察从2020年之后整体超额实际上有一定的衰竭,但整体来说跑赢的幅度是非常可观和亮眼的。目前所做的方式是把研究重心放在数据和因子,因为数据这套Alpha理论来说,它的数据源实际上可以非常多样化,尤其是站在现在的技术发展角度来说,不管是物联网也好,还是若干年前的移动互联网,都产生了大量的数据,这些数据有些已经应用到了研究层面、交易层面。

传统的数据还是基于交易所推送的量价以及财报上的基本面数据,但是另类数据的基本量我们认为远远大于传统数据。因为另类数据差异性比较大,所以因子做出来的结果相关性也比较小,差异性也比较大。这边在这个方法论上是对因子的质量是提高的,因为我们希望运用线性组合,因为刚才提到讲方法论的时候,是更加希望注重数量而不是质量,也在做尝试,把高质量放进去,它对整个机器学习的方法论的超额提升或者说回撤的降低,整体影响幅度不是很大,所以在线性这套方法论上,对单因子质量要求是高的,包括也选择用线性因子做。

它的优化和风控也是和机器学习那套方法论不是一样的,风控非常严格,只有极少数的因子会暴露,其他的会控制的非常好。它的整个方法论的特点是单因子质量高,而且因子的逻辑意义相对于机器学习来说很强。因为你对整个因子组合层面做了非常严格的程度限制,所以整体从输出的数据来看,超额的稳健性是大幅提升,波动性非常少。

刚才提到风格是非常严格的控制,所以我们研究的重点实际上是在因子层面。但你为了获取比较好的因子结构,其实你对数据这个层面的获取以及处理也有比较大的工作量。换句话说这套方法论,认为它获取的数据端以及因子端,这个方法论上我不是很愿意把因子改成特征,因为单因子预测性是非常强的,你可以把它简单的进行理解。

因为刚才我提到的组合,或者说这套方法论的组合,普遍大家所使用的是线性组合模型,或者加强线性模型,如果单因子质量不够高,其实会对结果有负面的影响,这套方法论认为它捕捉的主要是数据端和因子端。

自己构建产品线的时候,我们这样思考的,其实在机器学习方法论上,行业里面特别优秀的机构比例是比较多的,包括大家也有所感知,尤其是有些客户感觉最近一年整体超额不是特别的亮眼,但整个行业来看,最近一年是比较不错的,尤其是最近两三个月的情况。

从去年下半年尤其是9月份开始到今年年初3月份左右,整个行业的超额获取是有一定困难的,考虑到去年的超额大爆发这是可以理解的,因为必须把这两端数据放在一起才算完整的周期,整个行业因为在机器学习这套方法论上的应用广泛性是比较大的,所以整个数据特征也是和这套方法论差不多。

但严格来说,我们更乐意把这套方法论获取的相对大盘收益叫做Smart Beta,为什么把它定义成β,这是我个人的定义,因为做了风控之后,我们发现它的差额收益有下滑,而且幅度比较大,某种程度上来说,是有一部分的超额收益,或者说跑赢大盘的收益是来源于风格因子的曝露。

理论上来说,你控制了风格因子是不应该影响在经典定义的Alpha收益,但是它还是有影响,所以就定义为了Smart Beta。在这块我刚才提到整个行业运用比较广泛,以及比较好,所以放的权重比较低,而且它的特征在整个市场变化比较小,换句话说,整个市场风格稳定性比较强的情况下,超额爆发性是非常强的,过去40以上的超额都有可能,但如果风格变化比较剧烈,获取超额的难度就会比较差,甚至会发生短期的回撤。

站在这个节点,看整个行业业绩的表现,最近两三个月,整个行业的超额就非常的优秀,获取了比较高的超额,包括前期有回撤的机构也修复了,这是因为这套方法论和市场风格的变化相关性是比较高的,大市场风格比较稳定,大家获取超额价值就比较高。

03

蒙玺投资实践

我们的思路包括标题也是一样,如何构建稳定性的Alpha策略,更多的权重会给到严格定义风格曝露的这类方法论上,包括它相对于机器学习来说还有个可以在逻辑上让更踏实的感受,就是它的单因子逻辑以及意义都很明确。换句话说,整个量化的数据可信度其实是有前提的,就是历史复现,当然一般说这句话时都会加上不会简单的复现,它复现程度有什么变化,这其实是潜在的风险。

我们更加相信朴素的逻辑,在的研究体系里,研究的可信度比统计数据的可信度要高,再加上整体公司的发展特征都是比较稳健的,所以给到了经典方法论上程度会高一点,会达到80%,它的特征首先是单因子质量比较高,单因子解释性比较强,然后用线性模型。为什么用线性模型?因为非线性模型对这类高质量因子进行组合,增益并不丰厚,而且对非线性来说,又有非常显著的好处,就是它的归因相对来说比较方便,能够清晰的看到各个单因子的表现。

在风控层面用了非常严格的风控,从去年下半年到现在,近一年的时间里,这一套线性的超额回收是非常低的,当然也是放了一些非线性的,所以用非线性也能清楚行业的表现,其实非线性方法论和行业业绩表现是提高的,用了二八的比例进行了组合。首先它们两个的相关性不高,用接近1年的水平来看,相关性只有0.6,组合在一起总体的业绩表现在今年一年可以说是我们自己是非常满意的,在近期也吸引了一些潜在的合作伙伴。

4.jpg

5.jpg

我就分享这些,感谢大家。