百亿私募启林投资:量化作为主动投资的一种手段,不应受到歧视

“现在程序化交易占市场成交量的比例可能在15%-20%,没有传言的50%那么高。量化作为主动投资的一种投资手段不应该受到歧视,好的量化私募应该积极的拥抱监管,完善风控和合规体系,为资产管理行业贡献长期价值。”

沉寂多年后,量化投资在今年突然爆发。在A股成交连续破万亿之时,量化投资甚至因为超高的换手率,招徕了“薅A股羊毛”的质疑。

在外界看来,这群由数理学霸、IT工程师和计算机构成的组合是投资中的异类,始终带有某种神秘色彩。

不同于主观选股对人的经验的依赖,量化投资通过机器在海量大数据中寻找股票历史涨跌的规律,然后交给程序来完成自动化下单,通过短期内做无数次大概率获胜的交易来积累胜率。

这种方法在今年中小盘崛起、市场风格快速切换的环境下大放异彩。截至今年二季度末,国内量化类私募基金整体管理规模已经超过1万亿元,短短三年时间,量化在整个私募中的占比就从不到10%提高到20%。

作为年初晋级为百亿量化私募的启林投资,今年取得了不错的业绩,代表产品年内收益超过25%。

这家由物理学家创办的基金公司,有一些让人印象深刻的特质,比如,他们会用多频段策略揉合的方法应对量化策略同质化问题,最多半年就会完成一次模型迭代。

近日,华尔街见闻与启林投资进行了一场访谈,探讨量化产品的超额收益到底从何而来,策略容量的限制如何突破,以及A股万亿成交量中,私募量化扮演了怎样的角色。

以下是访谈的全部内容:

华尔街见闻:启林的量化交易模型是怎样的?

启林投资:我们主要是采用机器学习 选股/算法交易策略/T0策略等,进行高风险收益比的多个核心策略的叠加,选出能创造超额收益的Alpha股票,获取稳健的超额指数收益。

通过算法交易策略,每一笔换仓交易可以做到以更优的价格成交,交易层面能稳健的战胜时间加权平均价格5-8个bps,每年可在原有的交易层面多给产品贡献5%的收益,T0策略能够使持仓股票的成本降低,年化增强4%左右。

我们目前做到了投研流水化、工厂化,确保策略的更新迭代能力,因子及机器学习的特征每月可以新增300多条,3-6个月可以完成多因子模型与机器学习训练模型的一次完全迭代,超额收益具有长期可持续性。

华尔街见闻:算法交易如何能做到交易价格更优?

启林投资:启林的算法交易主要用来做拆单,也就是100股、100股这样的去下单,不断的贴近盘口的买一数据去往下压这个价格,使得当天的成交价甚至低于当天的均价,减少交易成本和滑点。

华尔街见闻:在策略迭代方面,启林经历了哪几次关键的升级?  

启林投资:从2016年至今,我们每一年都在进行大的策略迭代与升级,16年我们用到的是日线级别的数据,也就是delay1(延时1)的版本,我们以前的做法是按照昨日的行情和股票的清单,把这些数据输入到程序里面,然后输出一个股票结果,第二天按照这个结果来实现一个交易。

但是这个只是用到了昨天的数据,相对有些延时,没有盘中实时送过来的行情。17年这个叫做delay1的版本我们升级到了delay0,对于出清单的频率,我们从原来隔夜出清单升级到了当日每5分钟出一次清单,每5分钟根据实时的行情和数据,来去做一次打分和选股,不会延迟,预测频段也更实时。

18年我们自建了一套算法交易系统——盈宽奋进号算法交易系统。19年我们实现了机器学习的上架,摒弃传统的多因子模型,解决了因子同质化带来的超额不断衰减的问题。

完全不同的方法论使得机器学习可以挖掘到多因子模型遗漏的数据。赛道也没有那么拥挤,由于机器学习有自我迭代的能力,能够随着新的市场数据进来的时候,学习到市场最新的规律,更好的适应这个市场。

2020年我们实现了全频段的糅合,将高频、中高频、低频不同的频段全部糅合在一起,有效解决行业内集中在单一频段的策略拥挤问题。

华尔街见闻:为什么全频段选股可以解决策略拥挤的问题?

启林投资:我们把策略按照预测周期分为 tick级 、分钟级、小时级、日级、周级、月级等不同频段,然后在各种频段都开发出相应的预测模型,最终我们将所有模型融合在一起,共同应用在我们产品管理中,然后由我们的算法交易程序去进行交易执行。希望能够挖掘更多底层信号源,或各个频段的一些超额,使不同频段的超额形成合力,收益足够高。这样也保证了我们所有的产品业绩表现都是一致的。

我们上了信号糅合的模型之后,对不同频段的资金、权重,加入了自动化、实时化的调整,这个工具或者这套模型叫做决策器。

决策器是我们非常核心的技术,就是在不同频段的模型选出来之后,糅合在一起实现1+1>2的效果,能够解决不同频段模型之间的一些冲突,这个是我们去年四季度已经开发出来了,这一套体系能够控制住回撤,并且在不太牺牲超额收益的情况下得到比较好的结果。

华尔街见闻:如何看待AI在量化领域的运用?未来量化的发展趋势是什么?

启林投资:我们很早开始用机器学习的方法进行策略的研究和开发,我们可以看到,人工智能技术的兴起已经在许多领域颠覆了传统的方法,比如语音,图像识别,反欺诈,决策系统等。

在金融领域也不例外,我们看到2019年前微软首席人工智能专家邓力从微软离职加入了美国顶尖的量化对冲基金Citadel,他表示,人工智能应用于金融领域虽然有很多挑战,但是时机已经成熟。

我们多年研究发现,机器学习的人工智能技术进行量化策略开发非常不容易,有很多的难点和坑,但是我们经过多年的积累,成功找到了正确的道路。现在机器学习模型在我们管理模型中的占比达接近60%,已经在我们模型库中占据主导性的地位。我们有非常多不同的机器学习模型,他们为我们创造了非常好的超额Alpha收益。

量化公司的最核心竞争力永远是策略。因此能持续迭代开发有效策略的量化公司会有长期的生命力和形成品牌壁垒。量化未来也会更加头部化,平台化。从投研角度,要注重团队化作战,注重研究的深度,注重数据硬件等基础设施的投入,注重人才梯队的培养和建设。 只有把握好每一个投研细节,才能维持策略的竞争力。

华尔街见闻:机器学习模型是如何选股的?与多因子模型的主要区别是什么?

启林投资:多因子模型是Alpha策略开发的经典方法,通过线性的方式进行处理和组合。传统多因子模型样本外失效概率高,实盘表现往往与回测表现差异大,并且表现具有瓶颈,当因子数量多时加入新因子对模型提升有限。多因子模型的数据运用仅限于因子构造,同业因子重合度较高,策略门槛较低,拥挤严重,容易形成定势思维,迭代慢。

机器学习可以深入挖掘市场各类信息间的非线性关系,具有市场适应能力强,实盘表现相对于回测的衰减小等优势,相对多因子模型更能深挖大数据,更非线性更灵活,能定期并且更快地进行策略迭代,有较强的自适应能力。

华尔街见闻:很多头部私募都在使用机器学习,机器学习模型是否也会面临同质化的问题? 

启林投资:准确来讲,机器学习传统的做法是直接挖因子,因子是有预测性的,特征是没有预测性的,特征是对数据打标签,20000多个特征在深度的神经网络里面进行N维的排列组合,去寻找不同的特征之间相互产生的化学反应,找到一个最优的股票权重的组合解,使这个权重配下来的超额能够达到市场最高。同时控制好这个组合的跟踪指数的偏离在2以内,所以这个做法相比传统的多因子模型,能找到更多的底层数据信息。

从输入X输出Y 的过程的模型里面,有很多种方法可以做各种卷积网络、CNN、DNN,哪怕两家管理人用了同样的数据,用不同的方法来输出,股票组合都有很大概率的不同。

不同的方法论带来的组合的差异化,越有差异化的模型它的超额的可持续性越强,跟市场回测的相关性越低,多因子为什么2019年失效,因为做的人太多了,它用同样的因子输入,哪怕用不同的方法,它输出的股票大概率都是重叠的,所以会导致做多因子的人多了,超额的失效和下降很快。

机器学习的方法论不一样,模型不一样,然后我们现在还加了不同的频段,5分钟、1小时、1-5天、10-20天各个频段的不同的组合也不一样,最后得出的股票清单和换手周期跟各家的相关性比较低,然后机器学习做出来的超额衰减很慢,因为它有差异化在里面,既能做高收益,又能降低相关性,还能够有效性比较持续。

华尔街见闻:对主动选股来说,短期市场波动是难以预测的,但量化投资试图在寻找其中的规律,怎么理解这其中的差异? 

启林投资:主观投资和量化投资的区别,主要表现在核心逻辑或者说信仰上。主观投资更多依赖人的经验和判断。即使现在市场波动比较大,虽然比较难去归纳出市场波动的原因,但是主观投资管理人通过长期的信仰价值投资,信仰股票背后上市公司的盈利逻辑,而去克服长时间内较大的波动,去赚取收益。而量化投资是比较短的时间周期去交易来叠加胜率,通过概率统计模型,依靠科学赚取收益。

经过多年的量化投资实践,我们认识到市场并非完全有效,而且市场的无效性在短期波动中体现得更为充分(短期市场因为情绪主导的追涨杀跌会出现许多错误定价)。

量化的背后基础是统计概率学,短周期预测给予了丰富的样本量来提供充足的统计检验可行性。因此在短周期预测上,量化方法论相比于主观占据主导地位。

另外,市场存在着许多的风险,这些风险在量化投资中一般通过风险因子来刻画,并且风险因子的表现一般随机难以预测,量化投资机构一般会尽可能追求不能被各种风险因子解释的超额收益(也叫做pure alpha),并且会对投资组合进行严格的风险约束处理,从而避免受到风险随机扰动的影响。

华尔街见闻:最近很多量化私募都封盘了,启林在8月份也关闭了中性策略产品的募集,这背后的原因是什么?量化策略容量受限是否是个无解题? 

启林投资:随着投资者观念的转变,由于中性策略每年都要付出至少10%甚至以上的对冲成本,因此如果投资者本身看好指数的未来以及管理人获取超额收益的能力,会认为中性策略的性价比并不太高,因此关闭了中性策略产品的募集。

任何策略都有容量的限制(哪怕是主观投资的策略),容量背后的本质是交易对于市场造成冲击而导致的策略失效。因此决定策略容量的本质是交易是否足够分散、交易标的本身属性以及交易占据市场成交额的比例。

量化策略中的高频策略由于换手率高,当规模变大时,交易额占市场成交比例会提升迅速,因此容量瓶颈明显,也因此规模大的量化公司都会积极开发低频段的策略来进行扩容。

华尔街见闻:A股万亿成交量背后,市场也在关注量化私募在其中的作用,你怎么看?

启林投资:一方面量化受到关注有成交量放大的因素,更主要因素还是今年量化私募业绩相对亮眼。我们判断现在程序化交易占市场成交量的比例可能在15%-20%,没有传言的50%那么高。

我觉得量化作为主动投资的一种投资手段不应该受到歧视,好的量化私募应该积极的拥抱监管,完善风控和合规体系,为资产管理行业贡献长期价值。

华尔街见闻:量化产品今年来整体表现突出的原因是什么?量化投资更适应什么样的市场风格和行情?

启林投资:量化Alpha存在于不同的市场,不同品种,不同周期中,今年的行情普遍表现为风格切换很快,波动相对较大,成交量也比较大,而量化的本质是通过处理大数据,从而找到股票涨跌背后的规律,最终由程序化的交易来完成,在这个过程中,摒弃了人为的非理性因素的干扰,因此今年以来量化整体表现较为突出。

市场流动性好,两市成交量大,交易对手方充足时,该市场环境最有利于公司的投资策略。我们利用多个核心策略,选出可创造超额收益的Alpha的股票,最大程度减少市场周期性干扰,获取稳健的超额指数的收益。

华尔街见闻:如果遇到市场大跌,量化策略如何控制风险?

启林投资:1)市场流动性萎缩时,我们会减少个股集中度与换仓频率,由1500只标的增加到1800只,同时将阿尔法+T0每日换手100%降低到25-30%,以减少在低波动低成交量下频繁换仓的交易成本;

2)市场暴涨暴跌或大小盘二八分化是,我们会严格控制选股的风格等敞口暴露,在行业、市值上尽量做到严格的中性处理。当发生暴涨暴跌或分化行情时,最大回撤需控制在2-3%以内。

华尔街见闻:随着市场上量化规模的扩大,未来量化投资的整体超额收益是否会不断缩减?

启林投资:对于量化投资来说,超额的来源主要有三方面:第一、人性追涨杀跌的弱点;第二、在获得和处理大数据上的信息不对称;第三、在交易上具备的优势。

伴随着市场上量化规模的扩大,市场会变得更加成熟更加有效,更有效的市场超额不可避免的要减少,所以未来量化投资的整体超额收益是会不断缩减的,届时更考验每个管理人的能力。

华尔街见闻:我们注意到,启林也有产品参加了中国银河专业交易策略公开赛,请您简单介绍一下启林跟银河证券的合作情况,这些合作对启林的发展起到了什么作用?

启林投资:启林之前跟银河证券合作发行了启林中证500指数增强6号私募证券投资基金、启林中证500指数增强6号1期私募证券投资基金、启林中证500指数增强27号私募证券投资基金;银河证券作为老牌的头部券商,与启林的合作,加深了启林在市场的影响力,同时也进一步帮助启林更好的了解投资者。目前启林中证1000指数增强策略在银河证券正在发售中。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。