EN

猎聘
猎聘专家
专注领域
CPSM模式
职位
策略研究类
技术开发类
综合职能类
数字货币类
洞察
量化白皮书
量化季刊
行业资讯
访谈报道
下载中心
我们
关于金融阶
我们的优势
加入金融阶

念空科技王丽:量化收益 取之有道

时间:2022-08-22 预览:

640.gif

1.jpg

从去年四季度到现在市场行业一直对量化,特别是投资人对量化有很多不理解,我们今天就量化到底是怎么赚钱这个话题,跟大家做一下交流。
我会从四个部分讲:
首先是量化投资赚钱的底层逻辑和市场背景;
第二部分分析一下近期我们对市场的看法;
后面两个部分介绍一下公司的情况。

注:本文意在分享行业实践,不构成任何投资建议,如有谬误,欢迎斧正。

01

量化赚钱的底层逻辑

和市场背景

量化投资因为在国内起步比较晚,广大投资人对量化投资不是特别了解,不知道它是怎么赚钱的。其实量化投资从底层逻辑上,它和我们熟知的价值投资赚钱逻辑是一样的,我们A股市场其实是量化投资和价值投资的沃土,这两个投资收益来源特别像,因为我们市场波动很大,机构占比比较低,导致市场出现错误定价机会远高于成熟市场。

价值投资赚的是长期错误定价的钱,量化投资赚取的是短期错误定价的钱。从这个逻辑上来讲,量化投资和价值投资赚的钱是一样的,只不过价值投资会选择行业或者个股去赚某一个行业或者某几个行业,或者某些个股的长期错误定价权。但是我们量化不局限在某一个行业,也不局限在某个股上,我们是在全市场去赚,甚至每个股票上短期定价的钱。
之前很多人认为量化投资的策略是追涨杀跌,但其实量化策略因为底层由很多子策略组成,我们量化的底策略有60%、70%的交易逻辑建立在反转之上,其实赚的是价值回归的钱。

为了方便大家理解,也举了两个例子,左边是统计了贵州茅台相对于白酒指数它十日连续的收益差额,其实统计的就是贵州茅台相对于白酒指数的强弱关系,如果连续一段时间贵州茅台相对于白酒指数都是持续走强,那我们的模型已经开始大幅卖出贵州茅台,而不是追贵州茅台。

相反,如果贵州茅台相对于白酒指数在一段时间内是连续走弱的,这时候我们的模型已经开始大幅买入贵州茅台。白酒行业相对于指数我们也会统计强弱关系,如果一段时间白酒行业相对于指数是走强的,这时候我们应该降低白酒行业的占比,卖出一些白酒行业。相反,如果白酒行业相对于中证500指数持续走弱,这时候反而应该超配一些白酒行业。

从这两个例子可以看出来量化策略大多数是在做反转,也就是赚价值回归的钱,和大家之前理解的追涨杀跌的认知是截然相反的。

2.jpg

为什么美股市场超额收益这么高?大家应该都听说过一句话,A股有最差的β最好的Alpha,美股是有最好的β最差的Alpha,为什么这两个市场截然相反?我们认为有三方面原因,第一是A股波动比较大,我们这个图里面统计的是中证500指数和沪深300,以及道琼斯指数在过去10年的年化波动率,可以看出来,中证500和沪深300的波动率都远高于到道琼斯指数,在波动大的环境下,无论是长期还是短期错误定价出现的概率就会比较高,这也是为什么A股超额收益比美股要高的原因之一。

3.jpg

第二个原因和A股成交额分布有很大关系,我们也引用了wind的数据统计了A股市场和美股市场成交额的分布。左边这张图展示的是美股市值排名日均成交额占比,这里可以看出来它91.3%的成交量集中在排名前10%的股票上。美股市场市值越大的股票成交量越大,我们A股市场不是这样的状态,A股市场58.3%的日均成交额分布在市值排名前10%的90%股票上,可以看出来大部分股票成交量是比较大的。我们A股市场的成交额是比较分散的,这样一种环境就比较适合做量化投资,这也是为什么A股量化收益比较高,这与成交额分散有很大关系。

4.jpg

第三个有利的原因是A股成交额巨大,就A股目前从成交额的绝对值来看是美股的1/3,超过了整个欧盟的组合,但是考虑到美股是T+0的交易规则,我们是T+1的交易规则,美股是有很多高频交易的,剔除这些之外,其实真实的交易额和A股差不多。

综上三个原因,可以解释为什么A股的超额收益远高于美股市场。

5.jpg

前面讲了Alpha收益为什么比较高,而且我相信是可以持续一段时间的。另外我们也看一下A股市场为什么量化策略长期具有双重获利能力,另一个维度要考虑β收益,因为我们量化指数增强产品其实收益来源主要是这两块。β收益取决于经济未来长期向上的趋势,这个图统计了过去十年里每年沪深300和中证500的绝对收益,可以看到过去十年里沪深300近十年平均年化收益是9.98,中证500近十年年化平均收益是10.7。过去十年里,我们指数已经走出了长的慢牛,中间只有2年是沪深300和中证500下跌的年份,就是2016年和2018年,这两年也有宏观特殊的原因。

尽管有两年这两大指数出现了跌幅,但从十年里看,每年指数的年化收益都在10左右,这个回报是蛮高的。我们国内普通人可以投资的资产除了房子也就只有指数是中国普通老百姓比较熟悉的投资品种,住不炒的背景下房价未来的趋势是非常不明朗的,但指数未来会跟随中国经济的发展,长期走出向上的牛市。过去十年我们的核心指数是300、500和1000,它平均每年贡献了10%左右的收益,其实指数本身就具有很好的成长性。

再加上我们现在超额收益还属于很好的红利期,像现在每年行业平均20%的超额收益是有的。但Alpha它长期来看,从美国经验来看,它长期应该是逐步下降的趋势,就像美股10年前超额收益是10%,到目前全市场平均超额收益只有1%-2%。量化的策略越早投会越早享受丰厚的超额收益。

02

近期市场分析

第二部分和大家分享一下量化在什么市场下会表现的比较好,大家都知道量化模型本身是统计,其实是用统计的方法在各个行业的股票里筛选模型比较强的股票,卖出模型弱的股票。它会在个股分化的市场下,模型有效性就会比较强。在市场风格频繁切换,热点轮动有序的环境下,量化模型和超额收益是比较好做的。

但是如果是在这种极端的行情,只有10%的大票最强,其他90%的股票,都是无差异下跌这种行情,其实量化模型就比较难做了,因为它不可能只买成分股,也会买到成分股以外的股票,而且要战胜的就是最强的成分股,通常这种行情下量化模型想获得正常额就会比较难。

但是我们从去年到今年的市场都能看到,这个市场已经是不是大票抱团的行情了,这是个市场是热点轮动非常快,风格切换也比较频繁的市场。未来一年大概率都是这种行情,在这种市场环境下,量化模型超额收益是非常显著的,我们觉得在未来市场量化模型也会持续获得不错的收益。

因为指数增强类产品另一部分收益是来自β,我们下一步再看一下β收益是否具有投资价值。首先从市值分布和行业分布来看一下中证500指数,它是我们A股最具代表性的中盘成长风格指数,汇聚了一批新兴的行业龙头。沪深300包含了一线、传统的绝对行业龙头,相比之下中证500指数成分股除了传统的行业龙头之外,更多覆盖了中国经济转型的新方向、科技创新类的行业龙头。这个指数本身在中国经济转型发展过程中就会相对收益、潜力更大。

另外是行业分布,从中证500,除了覆盖传统行业之外,科技创新类的新经济行业占比是比较高的,所以未来的成长空间也是比较巨大的。我们目前中国经济处于经济新旧动能转化过程中,战略性新兴产业也会发挥越来越重要的作用,成为我们中国经济的新引擎。

这些龙头企业应该是在新的高质量发展和产业集中的趋势下会不断收益,所以我们觉得指数本身它其实估值会持续的有提升的过程,中证500指数目前的估值还是处于历史相对比较低位的水平,特别是去年9月10日左右,中证500指数到今年4月29日是一波连续的下跌行情,基本上跌幅超过30%,达到历史最大跌幅,也使中证500指数的估值达到历史低位。市盈率和市净率也都属于历史低位的水平,风险已经充分释放。

6.jpg

我们再看一个上涨的驱动力,我们分析了中证500指数里面各个板块的估值相对历史估值分位数,统计了中证500指数周期股、高端制造、消费、科技、金融地产这几个板块,截至5月底的估值水平基本上都是处于历史低点,比如2008年的11月4日,2012年的11月底,2016年的5月18日,2019年1月3日,基本上在历史指数低位时的一个平均估值,我们看到它相对于历史上几个低位的平均值、估值还是要低的。

7.jpg

我们发现这个时候中证500成分股除了成分这些行业,除了高端制造以外,其他几个板块目前估值水平有的比历史估值平均值还要低,有的是接近历史估值的平均值。而且我们从PE历史分位数也能看出来,我们目前这几个板块估值分位数也是处于近十年、近五年、近三年,基本上比历史估值分位数还是要低的。

我们看到估值分位数低,另外我们看到2022年指数的估值下行主要是由于周期消费和科技板块总市值跌幅大于净利润跌幅,金融地产和高端制造板块贡献了正估值,但是净利润下降幅度是最大的。

比较这五个板块我们发现中证500从高端制造板块估值对业绩增长的反应较为充分,对业绩下降的容忍度是比较高,而周期消费和科技板块估值对盈利增长的反应不够充分,但是它对业绩下降的容忍度也比较低。我们可以看到中证500上涨的驱动力主要是来自于周期消费和科技板块估值收复,还有高端制造板块未来的业绩改善。

另外我们看一下中证500历史的净利润增长,我们从中证500的风险溢价来看,目前指数的投资性价比是比2018年大跌之后,和那个时候差不多,风险溢价是差不多2.2%,处于均值加两倍标准差之外,相对于国债的吸引力是较高的。基于风险溢价的均值回归特征,中证500指数中长期的预期收益率是大幅提升的。

中证500的高风险溢价和成分股的调整是密切相关的,因为每年中证500的成分股都是要大换血的,基本上是调20%的股票。长期价值指数更均衡,所以这个指数更均衡的一个行业分布推动了估值水平的下降。

中证500在吸纳中证1000指数中高成长企业的同时,它也为沪深300指数输送市值提升比较快的公司,同时也吸纳了沪深300中市值下降比较快的低估值公司,中证500它的承上启下作用也使行业配置更加均衡。我们认为中证500未来其实成长性和价值性其实都是兼具的。

另外我们再看指数的价值属性,它其实是凸显出来的,因为指数风格是比较均衡的,我们从各个行业的权重分配就能看到,各个行业都是相对均衡。另外我们从这个风格来看,过去十年里其实中证500指数股息率是大幅改善的,PB价值因子处于历史高位,所以指数长期的成长性提升空间是比较大的。

中证500成分股市值中位数仅沪深300指数的1/4,因此中证500β弹性是远高于沪深300。中证500指数滞胀时期,估值下跌幅度大于沪深300。长期看伴随着经济周期的切换,中证500指数相比沪深300也有更高的估值修复空间,中证500非金融股中超10%的企业是在上海或者主要盈利收入前五都是在上海,所以随着上海疫情的减少,其实指数成长性是有望进一步提高的。上海昨天宣布全面清零,所以这个指数它的成分股盈利状况修复其实会进一步提高的。

我们分析过中证500筹码结构,其实也是优于其他宽基指数的,大家比较关心的就是北上资金,背后代表的外资机构同样是中证500成分股的主要力量之一,短期来看北上资金更多倾向于压住核心资产的估值修复。这也反映出从北上的角度看短期中证500的筹码结构相对沪深300是更优的,未来潜在修复空间也更大。叠加外资对以中证500为代表的二线龙头关注度提升为长期趋势,以短周期视角和长周期视角,中证500的筹码其实都是更具有优势的。我们也是引用了万德等等一些研究的数据,给大家在这里做了一个佐证。

8.jpg

通过上面的分析,我们会觉得现在去投容量化的指数增强类策略,其实还是处于一个比较好的时期,首先指数其实是已经调整了一段时间,而且调整幅度也接近于指数的历史最大回撤水平。另外我们这个市场的超额收益环境并没有发生大变化,这个市场依然波动很大,成交额依然非常分散,成交额绝对值依然很大。这三点的客观存在,可以让我们把量化的超额收益红利还可以维持几年,我们这个时候依然还可以买到性价比比较高的超额收益。虽然今年因为指数的原因,去年从高点发了很多指数增强产品,好像今年都没什么效益,但是大家还是要清晰地去归因一下,到底是指数在跌还是没有超额收益,我相信其实很多都还是有超额收益的,只是这波指数调整确实调整幅度相对比较大。在这样前提下,其实量化的指数增强类策略其实还是具有很好的投资价值。

03

念空指增产品实践

下面介绍一下念空在量化指数增强类产品我们是怎么做的。

首先介绍一下我们念空,2015年成立的,到目前念空和念觉总的管理规模是120亿,团队五十多个人,投研将近四十个人。120亿的构成包括10亿的CTA、20多亿的中性、将近90亿的指增产品。90亿里面有10亿的市场全股,剩下的就是指增。四十个投研里面有15个是IT,剩下二十多个是做策略。投研背景其实基本上也都是国内外知名高校数学物理计算机专业毕业的,都是理工科背景,而且普遍比较年轻。我们创始合伙人团队还是比较资深,都是在行业有十多年的量化从业经验,核心团队留存率都是100%。核心成员也就是公司实控人是王啸博士,他是复旦物理学博士,博士毕业之后在国泰君安研究所、中海基金、东海基金都是做量化基金经理,在歌斐做量化投资总监,包括主导量化团队量化投资,2015年创办了念空。

我们公司的整个投研框架和很多量化公司不一样,公司投研框架是一个闭环的流水线,也就是说三十多个投研他们其实不是各自为政,而是会根据他们背景和专业经验不同,把他们统筹安排到这样一个闭环流水线上。因为大家都知道,量化其实是依靠团队协作的,不是靠个人英雄主义。这个流水线上有五个环节:数据处理、特征工程、拟合工程、优化器、回测验证,这五个环节里面有两个环节是分装的,数据处理和回测验证都是完全分装的,真正是有投研参与比较多的是特征工程、拟合工程、优化器。

9.jpg

数据库和其他量化管理员不一样的是我们百分之百都是用高频的level 2交易数据,目前都没有基本面的数据。

特征工程,我们的特征其实不是因子概念,其实单个因子本身是有预测性,直接可以预测一个股票的方向。举个例子,比如用交易数据我们可以开发比如线上实时线,它其实是一个短期可以预判一些股票短期大概率会向上突破,它对个股是有方向性的预测。

我们挖掘的这些特征是比因子的颗粒度要小,而且本身是没有任何预测能力的。我们会跟踪成交量变化,波动率变化,价格变化,涨跌幅等等这些有逻辑维度的,但是描述市场不同特征的,我们是通过代码把它写下来。特别像天气预报,其实天气预报也是一个预测过程,只不过我们在做天气预报之前其实气象员也需要去采集一些影响天气预测的特征。比如这个地方云层、温度、湿度、地理维度、时间的变化等等,其实这些不同的逻辑维度特征,它单一是没有办法去预测未来天气怎么样的。我们把这些不同维度特征组合到一块,我就可以生成未来不同周期天气的预测,比如可以预测未来一小时的天气怎么样,一天的天气怎么样,或者一周后天气怎么样。

同样我把这些有逻辑性而且能反映市场某个特征变化的特征组合到一块,我们就可以生成对个股不同周期的预测,这个过程我们是通过拟合来完成的,这个环节我们和其他管理人不一样的是百分之百都是用人工智能算法的非线性拟合。我们90%是用深度学习,10%是用机器学习,用这种人工智能的非线性组合我们就可以生成对个股不同周期的预测,最短我可以预测一个股票30分钟之后的涨跌幅,涨跌方向,最长我可以预测一个股票二十天之后涨跌方向,涨跌幅。通过非线性的拟合我就可以生成几十个不同周期对个股的预测。

这些不同周期的子策略,我怎么去优化组合,怎么去赋权,那是需要通过优化器去完成的。优化器我们用的是Barra优化器,大家知道这个是海外非常成熟的组合优化器,我们需要通过优化器对前面环节生成的这些不同周期子策略去做一个权重的调整,它会根据股票组合交易规模的变化去动态调整子策略权重的分配。随着管理规模的增加,我的总体预测周期会被迫拉长。

另外,优化器还有一个最重要的工作就是对风险因子的暴露去做严格的约束,因为我们知道做量化模型里面,风险因子暴露它其实是为了提高模型的超额收益,但是风险因子其实又是一个双刃剑,你过度暴露风险因子又会增加超额收益的波动,增加你的回撤,所以风险因子该如何约束才能给客户带来比较稳健的超额收益购买体验,这其实也是一个很重要的工作。

最后一个环节也是封装环节,就是回测验证,我们所有要上实盘的策略都要经过这个环节做一个拟合检验,检验通过的策略我们就可以上实盘了。

所以整个内部投研管理是这样一种流水线的模式。这样的好处就是生产效率非常高,目前策略平均保持一个月迭代一次的生产效率,所以超额收益是非常稳健的,我们的模型能够快速适应市场变化。另外也可以让我们公司所有策略的一致性非常强,只要是同策略的产品,不管在什么渠道发行的什么规模,在哪个券商交易的,做出来的业绩都是差不多的。这个其实也是非常重要的。

以上就是我今天想和大家分享的,谢谢大家的聆听!