样本20,k=4,阿尔法0.05,t分布值多少?

三、Alpha策略在股票投资中的实证研究

根据第一部分所述,阿尔法投资策略需依据模型测算来确定阿尔法部位的资产配置标的,并进行适当动态调整。针对基金资产投资,一般利用信息比率等方法进行验证和测算。对于股票投资,则采用多因子模型进行部分资产构建。多因子模型是量化选股中最重要的一类模型,其基本思想就是找到某些和收益率最相关的指标。并根据该指标,构建一个股票组合,期望该组合在未来的一段时间跑赢或者跑输指数。如果跑赢,则可以做多该组合,同时做空期指,赚取正向阿尔法收益;如果是跑输,则可以做多期指,融券做空该组合,赚取反向阿尔法收益。多因子模型的关键是找到因子与收益率之间的关联性。

Alpha 策略股票投资模型构建体系一般分为:建立基本因子库、对历史因子回报进行分析、赋予因子权重、构建投资组合。

目前影响股票投资收益的因素很多,为了更全面的获取最优影响股票价格的因子,本文从上市公司基本面、技术面及财务面等多项角度出发,构建多维度的候选因子库。根据经济常识和市场观点,把因子分为:盈利因子、成长因子、运营能力因子、流动性因子、交易量因子、红利因子、现金流因子、波动性因子、估值因子及红利因子十大类。

由于金融行业公司的盈利模式与其他行业有很大区别,某些因子不适用于对金融行业公司进行判定,所以运营能力因子、现金流因子及流动性因子都不适用于金融行业股票。相关性代表因子值与股票预期相关性,正相关代表因子值越大,股票的预期收益越好,负相关则相反。

本文以沪深 300 成分股为标的,时间样本区段为 2007 年 7 月 1 日至 2013 年 6 月31 日,从多方面计算因子回报。

其中为样本区间里因子的年化平均收益,为因子收益的年化标准差。因子的年化平均收益越大,则证明该因子获取超额收益的能力越强,而标准差越小,证明该因子活力能力越稳定。所以信息比值越大,判定因子越有效,一般而言,信息比在 0 与 1 之间的因子可判定“可选”,超过 1 的因子可判定“推荐”。

因子胜率,是指在样本空间内,因子正收益的次数占全样本次数的比值。自然,比值越大,证明由该因子挑选的投资组合获得收益的成功率就越高,该因子的有效性就越显著。

T 检验,主要用于样本含量较小,总体标准差未知的正态分布资料。是对两个平均值差异程度的检验方法,通过 T 分布理论来推断差异发生的概率,以此判定两个平均数的差异是否显著。如果选定因子历史收益的差异显著程度为“显著”,则认为可选,若为“十分显著”,则可将该因子列为推荐

从因子胜率的角度来看,该类别中仅“ROA”能获得 60%的因子胜率。表明在我们的历史回溯区间里,沪深 300 里资 产收益率较高的股票往往会获得较高的股票收益。而从年化信息比的角度去研判,我们 发现 ROA 还是拥有最高的年化信息比,表明该因子的风险超额收益较同类因子要高。t 检验结果显示所有盈利因子里面,并没有哪个因子的 P 值能低于 10%,所以并不能有效 证明该类因子的收益统计上显著不为 0。但 ROA 因子的 P 值为 15.27%,与 10%的“可选”边界相去不远。最后,我们也统计了因子的平均换手率,发现同类之间换手率的差距并不大。

盈利因子 逐年累计收益分析

从逐年累积收益的情况来看,ROA 因子的表现也印证了它高信息比的结果,收益表现叫其他因子较为稳定。而且从 10 年开始,该因子的表现持续走强,将它选为我们最终多因子模型的其中一个有效因子。

整体来看,成长类因子的普遍表现较优。在因子胜率方面,经营活动产生的现金流量净额该因子胜率最高,有 61.43%的成功率。年化信息比方面,所有因子都能捕获正值的信息比,经营活动产生的现金流量净额因子也是拥有最高的信息比率,接近于1。而从 t 检验 P 值的结果来看,主营业务收入增长率因子和净利润增长率因子都小于或等于 10%,所以我们认为该两个因子的收益从历史表现来看显著不为 0。而经营活动产生的现金流量净额因子的 P 值为1.04%,结果显示该因子收益十分显著,值得强烈推荐!

成长因子 逐年累计收益分析

从逐年累计收益的结果来分析,主营业务收入增长率该因子表现较优, 除了 10年获得负收益外,其他年份基本保持了正的年收益。而净利润增长率因子也有不俗表现。可以看到该因子在 07 年的大行情里面比同类因子拥有明显的优势。在 10 年的震荡行情中也有十分好的表现。经营活动产生的现金流量净额因子则为最稳定的因子,在 08 年的熊市里因子也只是出现小幅回落。仔细观察该因子的累积收益变化,发现是一个稳步上扬的趋势,波动要较同类其他因子较小,也印证了信息比最优的观点。以上提及的三个因子都将会纳入我们的最终备选因子库,用以构建多因子模型。

杠杆类的因子表现好坏参半。从因子胜率来看,负债权益比与资产负债率两个因子的表现最优,尤其是资产负债率,因子胜率略高于 65%,在胜率方面为“推荐”因子。年化信息比来看,本类有三个因子能获得正收益,而最值得推荐的是负债权益比,年化信息比可达 1.而从 t 检验结果分析,负债权益比的历史收益十分显著,证明该因子长期持续有效。

杠杆因子 逐年累计收益分析

虽然两因子胜率不高,但都有正的年化信息比。特别是速动比率该因子,信息率可达 0.7 以上,风险超额收益较高。从 t 检验的结果来看,速动比率的收益也显著不为0。

流动性因子逐年累计收益分析

从逐年累积收益的结果来分析,速动比率因子在实证区间内,仅在 2011 年的熊市里出现负收益。整体来看,因子从 07 年开始就保持稳定向上的趋势,结合指标的研判结果,该因子对于量化模型有一定的贡献,所以会将它纳入到最终因子库。

现金流类因子两极分化较为严重,仅经营活动产生的现金流量净额比总市值因子能获得正值的年化信息率。该因子的胜率虽然低于 60%,但已经是同类最高。而较高的年化信息比,以及十分显著的 P 值,都证明了该因子的有效性。

现金流因子逐年累计收益分析

而从逐年累积收益的结果来看,也基本印证了上面观点。经营活动产生的现金流量净额比总市值因子在牛市的时候捕获收益能力较强,驱使累积收益向上。看好该因子未来表现,并将它纳入最终因子库。

估值类因子一直都是重要的选股指标,研究员一般都运用不同的估值指标来研判个股的价值水平。若估值过低,那么该股票有可能被低估,估值修复就能为股票带来良好的收益。若估值过高,该股票就用可能被高估,在回复合理价位时就会导致亏损。所以,利用估值因子来选股效果无容置疑。实证的结果也印证了上述观点。从因子胜率来分析,相对 PE,相对 PS 和相对 PCF 胜率都在 60%以上。而相对预测市盈率的因子胜率更高达于 1 的信息比捕获风险调整收益的成效十分显著。而从 t 检验的结果来看,除相对 PB 以外,其他 4 个因子均能获得小于 5%的 P 值,收益十分显著。从上述结果可推导出沪深 300 成分股里,相对估值水平较低的股票长期都有优于相对估值较高股票的表现。

估值因子 逐年累计收益分析

从逐年累积收益的结果分析,除了相对 PB 收益表现不太理想以外,所有其他估值因子表现十分优异。无论在牛市或熊市,这些估值因子都能获得正收益。特别是相对预测市盈率,平均年收益可达 17%。鉴于估值类因子的卓越表现,把除相对 PB 以外的所有因子纳入到最终因子备选库。

总体来看,营运类因子表现不错。从因子胜率来看,固定资产周转率因子和总资产周转率因子都刚好 60%。而从因子信息比来看,这两个因子也有较高的信息比值,具有稳定的因子收益。并且两个因子都拥有低于 5%的 P 值。

运营能力因子 逐年累计收益分析

从累计收益的角度来看,固定资产周转率与总资产周转率两个因子历史收益一直呈现上升趋势。结合前面指标的分析,把该两个因子纳入到最终因子库。

整体来看,波动性因子的表现十分弱势,三种指标都显示出该类因子的劣势表现。在因子胜率方面,各个因子的胜率都只在 44%到 55%之间,正向与反向操作并不能为因子带来更好的胜率。而分析双边 t 检验的结果,各因子的 P 值也明显高于 10%的水平许多,证明了该类因子的收益不显著,反向的可操作性不大。

波动性因子 逐年累计收益分析

从逐年的累积收益表现来看,过多的负值与过高的收益波动性都印证了上述指标的对比结果。所以该类因子里不做任何挑选。

综合来看,交易量类的因子表现较为弱势。在因子胜率方面,只有最近 3 个月平、均 成交量占流通该因子能获得接近 60%的胜率。从年化信息比来分析,该类因子虽然有三个能获得正值,但信息比都较小。最后,t 检验结果也显示所有因子的 P 值都明显大于 10% 的“显著”边界。

交易量因子逐年累计收益分析

从各年的累积收益来分析,该类因子的表现都不约而同的在 11 以及 12 年表现迅猛,但受到前期表现的拖累,因子整体表现较弱。而且从各个因子逐月表现来看,波动较大。所以综合指标结果以及逐年累计收益的情况,并不从此类因子中进行挑选。

从因子胜率来看,红利两个因子的胜率都不足 60%。而从信息比来看,两个因子都能捕获正值的年化信息比。股息率的信息比较高,可达 0.85,说明股息率高的股票有较 稳定的超额收益。从 t 检验结果分析,股息率因子 P 值小于 5%的阀值,有十分显著的收益。而从换手率的角度去考虑,股息率因子换手率也低于另一个因子。

红利因子逐年累计收益分析

从逐年累积收益来看,股息率因子从 09 年开始一直都有较好的表现。虽然 12 年出现较大回撤,但 13 年前 4 个月能获得 7%的收益,表现回稳。基于此观点,决定把它纳入最终因子库。

要充分发挥因子的效用,就涉及到为选取的因子合理分配权重,因子的权重的多少代表着该因子对模型的重要性。因子的权重配置就是要保证优于其他要素的因子能够在模型中最大化的发挥其作用。所以合理的配置权重是构建多因子模型重要的一个环节。

由于,因子的收益是动态变化的过程,所以构建的因子组合应该是一个多元化覆盖全面的组合。因为在不同的风格子集中、在不同的宏观经济环境中以及在不同的市场环境中都会有不同的有效因子。根据对各类因子的分析,最终选取 15 个有效因子,通过马克维茨均值方差法为其赋予相应权重。由于因子之间是存在相关性的,这点与股票和基金也十分相似。那么寻找最佳因子权重就 与上一章节寻找最优基金组合权重的理念是完全一致的也就是因子组合 IR 的最大化,在该目标下寻求最优的权重配置。该理论依据了以下几个假设:其一,投资者 在进行投资时,他是根据单个“股票”预期收益来估测投资组合的风险。其二,投资者 的决定仅仅是依据“股票”的风险与收益。其三,一个理性投资者应该在给定期望风险 水平下对期望收益进行最大化,或者在给定期望收益水平下对期望风险进行最小化。解决因子权重的具体方法如下:首先,计算 15 个最终入选因子的历史平均收益 R 以及因子收益之间的协方差矩阵。。假设因子权重为那么就可以得到目标函数为:

然后对目标函数进行一阶偏微分并使其等于 0,可以得到 15 个多元一次方程,由于上述方程只存在一阶的项,所以可以求得唯一解,经过调整,我们可以得出最优的组合权重公式:

从该公式可以看出平均因子收益越高,该因子所得的权重越大。因子收益标准差越小,权重越小。若因子和其他因子相关性越高,所得的权重也会越小。

依据完成的赋予权重的因子模型,以每月沪深300成分股为备选池进行打分排序,通过每个因子打分之后,再根据每个因子的权重的不同为个股的各因子得分进行动态加权,得到股票的最终综合得分。通过评分将所有的股票分成 5 组,最后将靠前的一组股票作为超配组合,将靠后的一组作为低配组合。本次研究的最终目的是为了在沪深 300 指数收益的基础上,利用我们刚挑选的最
优 权重分配法构建超配与低配组合,并设计基于沪深 300 的 Alpha 策略。而我们 Alpha策略的基本思路是买多/卖空的策略。该种策略以卖出我们的低配组合中股票来实现低配的效果,然后以卖出的资产买入超配的股票,以实现超配的效果。最终的实际收益将 会是实际指数的收益+超配部分收益-低配部分收益。而“超配部分收益-低配部分收益” 便是我们获得 Alpha 的来源。以 2008 年 1 月 1 日到 2012 年 6 月 30 日作为实证期,验证策略可行性。在本次研究中,等权重加权和流通市值加权会分别运用并进行比较,并尝试允许做空和不允许做空两种情景分别进行对比分析。

等权重分配法:该方法按照等权重卖出低配组合股票,然后等权重的买入超配组合股票。在每月的低配股票中,向下找出在沪深 300 里权重最小的股票,并以该股票权重作为上限对每只低配股进行低配,然后以该权重对每只高配股进行超配。

流通市值加权:该方法是每期低配组合中的股票按他们的实际权重全部空仓,然后以等量的总权重配置到超配组合股票。为了超配组合与低配组合的可比性,组合以每个超配股票占超配组合整体比重的占比来配置。这样就保证了超配与低 配组合股票都是按市值加权,有效避免了上述等权重卖空的情况。
通过下表,从战胜指数的胜率角度观察,四种 Alpha 策略都能有 60%以上的胜
率,而流通市值加权-包含金融策略表现最优,战胜基准胜率能达 73%。而从年化超额收益的表现考虑,以及平均交易成本,流通市值加权-包含金融 Alpha 策略比其他三个策略拥有较好的优势。尽管流通市值加权-包含金融策略的信息比比其他三种策略要低,但是考虑超额收益的情况,通过该策略在现货市场配置,同时做空股指期货,可获得平均年化接近 22%的收益,比其他三种策略更具吸引力。但无论如何四种策略均有效证明基于 Alpha 策略的多因子量化投资模型在我国的 A 股市场中可行。

本文从定性定量基金筛选模型和多因子选股模型的出发,通过分析和检测历史数据,并融合了其他策略,将 Alpha 策略综合模型运用于六年的历史数据,然后以未来的数据检验了策略的预测性和有效性,最终完成整个 Alpha 策略设计及验证过程。

本文涉及的投资组合的基金、股票数量较多,并运用股指期货对冲系统风险,这些特点决定了A1pha策略综合模型只适用于机构投资者等拥有超过5000万资金规模的投资者,然而这并不意味 Alpha 策略对于普通投资者毫无意义。经过前面章节的模型建立、运行、选股、验证及结果分析等阶段的工作,本小节在此基础上总结出本文的研究成果,并给予投资的几点建议:

首先,多因子模型通过历史数据验证通过的因子表现出较强的股票筛选能力,对于非量化投资的传统观念投资者来说,这几类因子可以成为其基本面分析重点关注的对象。

其次,可转移 Alpha 策略的成功应用也代表行为金融学对传统金融学理论的挑战,人们在投资上的过度反应和反应不足现象并没有因为市场的逐渐成熟而消失,投资者可以针对非理性市场行为的投资策略来实现投资目标。

第三,对于量化投资者而言,如何在五花八门的量化投资策略中来选择,以及如何将不同的投资策略联合应用,本文构造 Alpha 综合策略模型时的做法可以有抛砖引玉的作用,发现策略之间的内在联系和数据挖掘是构建综合量化投资策略的关键。

最后,基于对冲 Beta 之后的 A1pha 策略,在收益的大小上会变低,然而在理想情况下,其获得的收益是无风险收益,波动很小,其合适的比较基准为无风险收益率,风险厌恶型投资者可应用 Alpha 策略产生的绝对收益进行资产配置。

从以上的实证检验结果来看,本文完成了预期的研究目的,本文中的基于多因子选股模型、定性定量基金筛选策略下的综合 Alpha 模型在 A 股市场上具有很好的区分基金和股票的能力,本文所建的投资组合通过后期市场的检验,具有获取超额收益Alpha 的能力。在整个研究过程中,可以得到几点结论:

(1)从大幅战胜沪深 300 指数的研究结果来看,A1pha 综合策略是可行的,这也再次印证结论:足够筛选能力的前提下,信息越多越好。量化投资策略之间并非没有关联,综合运用不同的策略是建立在对各子策略模型的理解和运用的基础上的。通过本文的研究可以发现,动量策略与反转策略两种截然相反的策略通过波动率策略可合理应用于 A1pha 投资策略当中。

 (2)本文的实证研究再次验证:对于中国 A 股市场这样的新兴市场,量化投资策略正好可以发挥其优点捕获到市场中的超额收益机会。量化投资为投资者带来了更多丰富而有特色的投资产品,A1pha 策略也只是其中一小方面,量化投资形成的新投资理念也是对传统投资理念的补充和增强。目前量化投资在我国还处于起步阶段,对于机构投资者来说,应该率先抓住量化投资在 A 股市场应用的机会。

 (3)在量化投资研究中,不少研究人员并不注重样本外的检验,认为由于打分时间点先于组合的历史表现,所以量化模型对历史数据是“不知情的”,因此模型的结果自然被认为是有效的。然而,模型本身是根据历年数据建立而来,即使是重新用模型选股进行检验,也会因为模型已具备对过去优秀股票的亲和性而使选股效果大打折扣。

 (4)对冲 Beta 风险方面,本文使用的市值对冲的效果取决投资组合的 Beta 以及市场的走势,其收益效果的波动较大,其理念并未完全对冲掉系统性风险,获取的 Alpha收益率仅仅是现货收益率减去标的指数的收益率。这种静态 Beta 法适合对冲 Beta 较为稳定的资产,其理念在于依据 CAPM 模型对冲掉系统性风险来获取 Alpha 收益。而动态 Beta 调整法适合对冲 Beta 不够稳定的资产,然而如果判断错误,对于 Beta 稳定的资产,过于频繁的调整所带来的交易费用会削弱 A1pha 绝对收益的获取能力。

虽然本文的研究结果来看,投资组合的结果显著优于沪深 300 指数运行结果,然而本文没有将综合模型选出的股票组合在历史中运行,而是分别使用多因子选股策略和动量或反转策略对历史数据进行测试。理论上,综合模型的两大重要部分均是通过过去 6 年数据建立而成,因此 Alpha 综合策略形成必然会大幅战胜基准收益。不过,在加入波动率策略下的动量或反转策略战胜基准的概率、幅度、稳定性、显著性等方面均是值得研究的,而 IR、组合胜率、t 检验 P 值等是这些指标的量化体现。综合模型的表现还可以用来评测波动率策略下的动量或反转策略对多因子模型的改善程度。

在后续阶段可利用每期新的数据对多因子模型进行优化,即使如此,模型还存在改进的空间。本文所使用的波动率是简单移动平均法的定义,而波动率其他计算方法如市值加权、Garch 模型回归等方法是否能够起到改善模型的作用则是值得尝试与探讨的问题。在动量的选取上,本文也是选择收益差的初级形式,因此这也是一个优化的方向。多因子选股模型方面,本文虽然尽可能多地选择时间窗口匹配的因子,但也不能排除漏掉某些有效因子的情况,这需要进一步的研究。另外,组合持有期长短的动态调整、交易成本的优化、模型运行过程中的风险控制等都可以考虑到选股模型中,从而使得模型具有更大的灵活度、更有操作性和更加贴近市场的现实变化。

数据挖掘技术旨在提取潜在有用的信息,因此在量化投资中应用数据挖掘技术必将成为一种趋势。数据挖掘的模型主要有分类模型、关联模型、顺序模型、聚类模型等,这为量化投资模型的优化提供了多种途径。例如,运用聚类分析法来得到因子的权重,它的优点在于能够合理利用因子收益的趋势性和相关性,动态为因子分配权重,也可以利用聚类模型进行多因子的筛选,又如,用关联分析找出因子之间的隐藏关联,等等。

 目前很多对冲策略在计算 Beta 时都采用简单的历史统计法,然而数理化的方法很难预测未来的突变。目前关于如何实现 Alpha 收益的研究很多,而如何准确预测 Beta值以成功对冲风险的案例较少,这也是笔者今后研究的方向。(来源:淡水value 作者:刘强)


三、Alpha策略在股票投资中的实证研究

根据第一部分所述,阿尔法投资策略需依据模型测算来确定阿尔法部位的资产配置标的,并进行适当动态调整。针对基金资产投资,一般利用信息比率等方法进行验证和测算。对于股票投资,则采用多因子模型进行部分资产构建。多因子模型是量化选股中最重要的一类模型,其基本思想就是找到某些和收益率最相关的指标。并根据该指标,构建一个股票组合,期望该组合在未来的一段时间跑赢或者跑输指数。如果跑赢,则可以做多该组合,同时做空期指,赚取正向阿尔法收益;如果是跑输,则可以做多期指,融券做空该组合,赚取反向阿尔法收益。多因子模型的关键是找到因子与收益率之间的关联性。

Alpha 策略股票投资模型构建体系一般分为:建立基本因子库、对历史因子回报进行分析、赋予因子权重、构建投资组合。

目前影响股票投资收益的因素很多,为了更全面的获取最优影响股票价格的因子,本文从上市公司基本面、技术面及财务面等多项角度出发,构建多维度的候选因子库。根据经济常识和市场观点,把因子分为:盈利因子、成长因子、运营能力因子、流动性因子、交易量因子、红利因子、现金流因子、波动性因子、估值因子及红利因子十大类。

由于金融行业公司的盈利模式与其他行业有很大区别,某些因子不适用于对金融行业公司进行判定,所以运营能力因子、现金流因子及流动性因子都不适用于金融行业股票。相关性代表因子值与股票预期相关性,正相关代表因子值越大,股票的预期收益越好,负相关则相反。

本文以沪深 300 成分股为标的,时间样本区段为 2007 年 7 月 1 日至 2013 年 6 月31 日,从多方面计算因子回报。

其中为样本区间里因子的年化平均收益,为因子收益的年化标准差。因子的年化平均收益越大,则证明该因子获取超额收益的能力越强,而标准差越小,证明该因子活力能力越稳定。所以信息比值越大,判定因子越有效,一般而言,信息比在 0 与 1 之间的因子可判定“可选”,超过 1 的因子可判定“推荐”。

因子胜率,是指在样本空间内,因子正收益的次数占全样本次数的比值。自然,比值越大,证明由该因子挑选的投资组合获得收益的成功率就越高,该因子的有效性就越显著。

T 检验,主要用于样本含量较小,总体标准差未知的正态分布资料。是对两个平均值差异程度的检验方法,通过 T 分布理论来推断差异发生的概率,以此判定两个平均数的差异是否显著。如果选定因子历史收益的差异显著程度为“显著”,则认为可选,若为“十分显著”,则可将该因子列为推荐

从因子胜率的角度来看,该类别中仅“ROA”能获得 60%的因子胜率。表明在我们的历史回溯区间里,沪深 300 里资 产收益率较高的股票往往会获得较高的股票收益。而从年化信息比的角度去研判,我们 发现 ROA 还是拥有最高的年化信息比,表明该因子的风险超额收益较同类因子要高。t 检验结果显示所有盈利因子里面,并没有哪个因子的 P 值能低于 10%,所以并不能有效 证明该类因子的收益统计上显著不为 0。但 ROA 因子的 P 值为 15.27%,与 10%的“可选”边界相去不远。最后,我们也统计了因子的平均换手率,发现同类之间换手率的差距并不大。

盈利因子 逐年累计收益分析

从逐年累积收益的情况来看,ROA 因子的表现也印证了它高信息比的结果,收益表现叫其他因子较为稳定。而且从 10 年开始,该因子的表现持续走强,将它选为我们最终多因子模型的其中一个有效因子。

整体来看,成长类因子的普遍表现较优。在因子胜率方面,经营活动产生的现金流量净额该因子胜率最高,有 61.43%的成功率。年化信息比方面,所有因子都能捕获正值的信息比,经营活动产生的现金流量净额因子也是拥有最高的信息比率,接近于1。而从 t 检验 P 值的结果来看,主营业务收入增长率因子和净利润增长率因子都小于或等于 10%,所以我们认为该两个因子的收益从历史表现来看显著不为 0。而经营活动产生的现金流量净额因子的 P 值为1.04%,结果显示该因子收益十分显著,值得强烈推荐!

成长因子 逐年累计收益分析

从逐年累计收益的结果来分析,主营业务收入增长率该因子表现较优, 除了 10年获得负收益外,其他年份基本保持了正的年收益。而净利润增长率因子也有不俗表现。可以看到该因子在 07 年的大行情里面比同类因子拥有明显的优势。在 10 年的震荡行情中也有十分好的表现。经营活动产生的现金流量净额因子则为最稳定的因子,在 08 年的熊市里因子也只是出现小幅回落。仔细观察该因子的累积收益变化,发现是一个稳步上扬的趋势,波动要较同类其他因子较小,也印证了信息比最优的观点。以上提及的三个因子都将会纳入我们的最终备选因子库,用以构建多因子模型。

杠杆类的因子表现好坏参半。从因子胜率来看,负债权益比与资产负债率两个因子的表现最优,尤其是资产负债率,因子胜率略高于 65%,在胜率方面为“推荐”因子。年化信息比来看,本类有三个因子能获得正收益,而最值得推荐的是负债权益比,年化信息比可达 1.而从 t 检验结果分析,负债权益比的历史收益十分显著,证明该因子长期持续有效。

杠杆因子 逐年累计收益分析

虽然两因子胜率不高,但都有正的年化信息比。特别是速动比率该因子,信息率可达 0.7 以上,风险超额收益较高。从 t 检验的结果来看,速动比率的收益也显著不为0。

流动性因子逐年累计收益分析

从逐年累积收益的结果来分析,速动比率因子在实证区间内,仅在 2011 年的熊市里出现负收益。整体来看,因子从 07 年开始就保持稳定向上的趋势,结合指标的研判结果,该因子对于量化模型有一定的贡献,所以会将它纳入到最终因子库。

现金流类因子两极分化较为严重,仅经营活动产生的现金流量净额比总市值因子能获得正值的年化信息率。该因子的胜率虽然低于 60%,但已经是同类最高。而较高的年化信息比,以及十分显著的 P 值,都证明了该因子的有效性。

现金流因子逐年累计收益分析

而从逐年累积收益的结果来看,也基本印证了上面观点。经营活动产生的现金流量净额比总市值因子在牛市的时候捕获收益能力较强,驱使累积收益向上。看好该因子未来表现,并将它纳入最终因子库。

估值类因子一直都是重要的选股指标,研究员一般都运用不同的估值指标来研判个股的价值水平。若估值过低,那么该股票有可能被低估,估值修复就能为股票带来良好的收益。若估值过高,该股票就用可能被高估,在回复合理价位时就会导致亏损。所以,利用估值因子来选股效果无容置疑。实证的结果也印证了上述观点。从因子胜率来分析,相对 PE,相对 PS 和相对 PCF 胜率都在 60%以上。而相对预测市盈率的因子胜率更高达于 1 的信息比捕获风险调整收益的成效十分显著。而从 t 检验的结果来看,除相对 PB 以外,其他 4 个因子均能获得小于 5%的 P 值,收益十分显著。从上述结果可推导出沪深 300 成分股里,相对估值水平较低的股票长期都有优于相对估值较高股票的表现。

估值因子 逐年累计收益分析

从逐年累积收益的结果分析,除了相对 PB 收益表现不太理想以外,所有其他估值因子表现十分优异。无论在牛市或熊市,这些估值因子都能获得正收益。特别是相对预测市盈率,平均年收益可达 17%。鉴于估值类因子的卓越表现,把除相对 PB 以外的所有因子纳入到最终因子备选库。

总体来看,营运类因子表现不错。从因子胜率来看,固定资产周转率因子和总资产周转率因子都刚好 60%。而从因子信息比来看,这两个因子也有较高的信息比值,具有稳定的因子收益。并且两个因子都拥有低于 5%的 P 值。

运营能力因子 逐年累计收益分析

从累计收益的角度来看,固定资产周转率与总资产周转率两个因子历史收益一直呈现上升趋势。结合前面指标的分析,把该两个因子纳入到最终因子库。

整体来看,波动性因子的表现十分弱势,三种指标都显示出该类因子的劣势表现。在因子胜率方面,各个因子的胜率都只在 44%到 55%之间,正向与反向操作并不能为因子带来更好的胜率。而分析双边 t 检验的结果,各因子的 P 值也明显高于 10%的水平许多,证明了该类因子的收益不显著,反向的可操作性不大。

波动性因子 逐年累计收益分析

从逐年的累积收益表现来看,过多的负值与过高的收益波动性都印证了上述指标的对比结果。所以该类因子里不做任何挑选。

综合来看,交易量类的因子表现较为弱势。在因子胜率方面,只有最近 3 个月平、均 成交量占流通该因子能获得接近 60%的胜率。从年化信息比来分析,该类因子虽然有三个能获得正值,但信息比都较小。最后,t 检验结果也显示所有因子的 P 值都明显大于 10% 的“显著”边界。

交易量因子逐年累计收益分析

从各年的累积收益来分析,该类因子的表现都不约而同的在 11 以及 12 年表现迅猛,但受到前期表现的拖累,因子整体表现较弱。而且从各个因子逐月表现来看,波动较大。所以综合指标结果以及逐年累计收益的情况,并不从此类因子中进行挑选。

从因子胜率来看,红利两个因子的胜率都不足 60%。而从信息比来看,两个因子都能捕获正值的年化信息比。股息率的信息比较高,可达 0.85,说明股息率高的股票有较 稳定的超额收益。从 t 检验结果分析,股息率因子 P 值小于 5%的阀值,有十分显著的收益。而从换手率的角度去考虑,股息率因子换手率也低于另一个因子。

红利因子逐年累计收益分析

从逐年累积收益来看,股息率因子从 09 年开始一直都有较好的表现。虽然 12 年出现较大回撤,但 13 年前 4 个月能获得 7%的收益,表现回稳。基于此观点,决定把它纳入最终因子库。

要充分发挥因子的效用,就涉及到为选取的因子合理分配权重,因子的权重的多少代表着该因子对模型的重要性。因子的权重配置就是要保证优于其他要素的因子能够在模型中最大化的发挥其作用。所以合理的配置权重是构建多因子模型重要的一个环节。

由于,因子的收益是动态变化的过程,所以构建的因子组合应该是一个多元化覆盖全面的组合。因为在不同的风格子集中、在不同的宏观经济环境中以及在不同的市场环境中都会有不同的有效因子。根据对各类因子的分析,最终选取 15 个有效因子,通过马克维茨均值方差法为其赋予相应权重。由于因子之间是存在相关性的,这点与股票和基金也十分相似。那么寻找最佳因子权重就 与上一章节寻找最优基金组合权重的理念是完全一致的也就是因子组合 IR 的最大化,在该目标下寻求最优的权重配置。该理论依据了以下几个假设:其一,投资者 在进行投资时,他是根据单个“股票”预期收益来估测投资组合的风险。其二,投资者 的决定仅仅是依据“股票”的风险与收益。其三,一个理性投资者应该在给定期望风险 水平下对期望收益进行最大化,或者在给定期望收益水平下对期望风险进行最小化。解决因子权重的具体方法如下:首先,计算 15 个最终入选因子的历史平均收益 R 以及因子收益之间的协方差矩阵。。假设因子权重为那么就可以得到目标函数为:

然后对目标函数进行一阶偏微分并使其等于 0,可以得到 15 个多元一次方程,由于上述方程只存在一阶的项,所以可以求得唯一解,经过调整,我们可以得出最优的组合权重公式:

从该公式可以看出平均因子收益越高,该因子所得的权重越大。因子收益标准差越小,权重越小。若因子和其他因子相关性越高,所得的权重也会越小。

依据完成的赋予权重的因子模型,以每月沪深300成分股为备选池进行打分排序,通过每个因子打分之后,再根据每个因子的权重的不同为个股的各因子得分进行动态加权,得到股票的最终综合得分。通过评分将所有的股票分成 5 组,最后将靠前的一组股票作为超配组合,将靠后的一组作为低配组合。本次研究的最终目的是为了在沪深 300 指数收益的基础上,利用我们刚挑选的最
优 权重分配法构建超配与低配组合,并设计基于沪深 300 的 Alpha 策略。而我们 Alpha策略的基本思路是买多/卖空的策略。该种策略以卖出我们的低配组合中股票来实现低配的效果,然后以卖出的资产买入超配的股票,以实现超配的效果。最终的实际收益将 会是实际指数的收益+超配部分收益-低配部分收益。而“超配部分收益-低配部分收益” 便是我们获得 Alpha 的来源。以 2008 年 1 月 1 日到 2012 年 6 月 30 日作为实证期,验证策略可行性。在本次研究中,等权重加权和流通市值加权会分别运用并进行比较,并尝试允许做空和不允许做空两种情景分别进行对比分析。

等权重分配法:该方法按照等权重卖出低配组合股票,然后等权重的买入超配组合股票。在每月的低配股票中,向下找出在沪深 300 里权重最小的股票,并以该股票权重作为上限对每只低配股进行低配,然后以该权重对每只高配股进行超配。

流通市值加权:该方法是每期低配组合中的股票按他们的实际权重全部空仓,然后以等量的总权重配置到超配组合股票。为了超配组合与低配组合的可比性,组合以每个超配股票占超配组合整体比重的占比来配置。这样就保证了超配与低 配组合股票都是按市值加权,有效避免了上述等权重卖空的情况。
通过下表,从战胜指数的胜率角度观察,四种 Alpha 策略都能有 60%以上的胜
率,而流通市值加权-包含金融策略表现最优,战胜基准胜率能达 73%。而从年化超额收益的表现考虑,以及平均交易成本,流通市值加权-包含金融 Alpha 策略比其他三个策略拥有较好的优势。尽管流通市值加权-包含金融策略的信息比比其他三种策略要低,但是考虑超额收益的情况,通过该策略在现货市场配置,同时做空股指期货,可获得平均年化接近 22%的收益,比其他三种策略更具吸引力。但无论如何四种策略均有效证明基于 Alpha 策略的多因子量化投资模型在我国的 A 股市场中可行。

本文从定性定量基金筛选模型和多因子选股模型的出发,通过分析和检测历史数据,并融合了其他策略,将 Alpha 策略综合模型运用于六年的历史数据,然后以未来的数据检验了策略的预测性和有效性,最终完成整个 Alpha 策略设计及验证过程。

本文涉及的投资组合的基金、股票数量较多,并运用股指期货对冲系统风险,这些特点决定了A1pha策略综合模型只适用于机构投资者等拥有超过5000万资金规模的投资者,然而这并不意味 Alpha 策略对于普通投资者毫无意义。经过前面章节的模型建立、运行、选股、验证及结果分析等阶段的工作,本小节在此基础上总结出本文的研究成果,并给予投资的几点建议:

首先,多因子模型通过历史数据验证通过的因子表现出较强的股票筛选能力,对于非量化投资的传统观念投资者来说,这几类因子可以成为其基本面分析重点关注的对象。

其次,可转移 Alpha 策略的成功应用也代表行为金融学对传统金融学理论的挑战,人们在投资上的过度反应和反应不足现象并没有因为市场的逐渐成熟而消失,投资者可以针对非理性市场行为的投资策略来实现投资目标。

第三,对于量化投资者而言,如何在五花八门的量化投资策略中来选择,以及如何将不同的投资策略联合应用,本文构造 Alpha 综合策略模型时的做法可以有抛砖引玉的作用,发现策略之间的内在联系和数据挖掘是构建综合量化投资策略的关键。

最后,基于对冲 Beta 之后的 A1pha 策略,在收益的大小上会变低,然而在理想情况下,其获得的收益是无风险收益,波动很小,其合适的比较基准为无风险收益率,风险厌恶型投资者可应用 Alpha 策略产生的绝对收益进行资产配置。

从以上的实证检验结果来看,本文完成了预期的研究目的,本文中的基于多因子选股模型、定性定量基金筛选策略下的综合 Alpha 模型在 A 股市场上具有很好的区分基金和股票的能力,本文所建的投资组合通过后期市场的检验,具有获取超额收益Alpha 的能力。在整个研究过程中,可以得到几点结论:

(1)从大幅战胜沪深 300 指数的研究结果来看,A1pha 综合策略是可行的,这也再次印证结论:足够筛选能力的前提下,信息越多越好。量化投资策略之间并非没有关联,综合运用不同的策略是建立在对各子策略模型的理解和运用的基础上的。通过本文的研究可以发现,动量策略与反转策略两种截然相反的策略通过波动率策略可合理应用于 A1pha 投资策略当中。

 (2)本文的实证研究再次验证:对于中国 A 股市场这样的新兴市场,量化投资策略正好可以发挥其优点捕获到市场中的超额收益机会。量化投资为投资者带来了更多丰富而有特色的投资产品,A1pha 策略也只是其中一小方面,量化投资形成的新投资理念也是对传统投资理念的补充和增强。目前量化投资在我国还处于起步阶段,对于机构投资者来说,应该率先抓住量化投资在 A 股市场应用的机会。

 (3)在量化投资研究中,不少研究人员并不注重样本外的检验,认为由于打分时间点先于组合的历史表现,所以量化模型对历史数据是“不知情的”,因此模型的结果自然被认为是有效的。然而,模型本身是根据历年数据建立而来,即使是重新用模型选股进行检验,也会因为模型已具备对过去优秀股票的亲和性而使选股效果大打折扣。

 (4)对冲 Beta 风险方面,本文使用的市值对冲的效果取决投资组合的 Beta 以及市场的走势,其收益效果的波动较大,其理念并未完全对冲掉系统性风险,获取的 Alpha收益率仅仅是现货收益率减去标的指数的收益率。这种静态 Beta 法适合对冲 Beta 较为稳定的资产,其理念在于依据 CAPM 模型对冲掉系统性风险来获取 Alpha 收益。而动态 Beta 调整法适合对冲 Beta 不够稳定的资产,然而如果判断错误,对于 Beta 稳定的资产,过于频繁的调整所带来的交易费用会削弱 A1pha 绝对收益的获取能力。

虽然本文的研究结果来看,投资组合的结果显著优于沪深 300 指数运行结果,然而本文没有将综合模型选出的股票组合在历史中运行,而是分别使用多因子选股策略和动量或反转策略对历史数据进行测试。理论上,综合模型的两大重要部分均是通过过去 6 年数据建立而成,因此 Alpha 综合策略形成必然会大幅战胜基准收益。不过,在加入波动率策略下的动量或反转策略战胜基准的概率、幅度、稳定性、显著性等方面均是值得研究的,而 IR、组合胜率、t 检验 P 值等是这些指标的量化体现。综合模型的表现还可以用来评测波动率策略下的动量或反转策略对多因子模型的改善程度。

在后续阶段可利用每期新的数据对多因子模型进行优化,即使如此,模型还存在改进的空间。本文所使用的波动率是简单移动平均法的定义,而波动率其他计算方法如市值加权、Garch 模型回归等方法是否能够起到改善模型的作用则是值得尝试与探讨的问题。在动量的选取上,本文也是选择收益差的初级形式,因此这也是一个优化的方向。多因子选股模型方面,本文虽然尽可能多地选择时间窗口匹配的因子,但也不能排除漏掉某些有效因子的情况,这需要进一步的研究。另外,组合持有期长短的动态调整、交易成本的优化、模型运行过程中的风险控制等都可以考虑到选股模型中,从而使得模型具有更大的灵活度、更有操作性和更加贴近市场的现实变化。

数据挖掘技术旨在提取潜在有用的信息,因此在量化投资中应用数据挖掘技术必将成为一种趋势。数据挖掘的模型主要有分类模型、关联模型、顺序模型、聚类模型等,这为量化投资模型的优化提供了多种途径。例如,运用聚类分析法来得到因子的权重,它的优点在于能够合理利用因子收益的趋势性和相关性,动态为因子分配权重,也可以利用聚类模型进行多因子的筛选,又如,用关联分析找出因子之间的隐藏关联,等等。

 目前很多对冲策略在计算 Beta 时都采用简单的历史统计法,然而数理化的方法很难预测未来的突变。目前关于如何实现 Alpha 收益的研究很多,而如何准确预测 Beta值以成功对冲风险的案例较少,这也是笔者今后研究的方向。(来源:淡水value 作者:刘强)


  • 二、基于自适应t分布的麻雀搜索算法

  •  五、参考文献及代码私信博主

优化问题是科学研究和工程实践领域中的热门问题。智能优化算法大多是受到人类智能、生物群体社会性或自然现象规律的启发,在解空间内进行全局优化。麻雀算法于2020年由薛建凯[1]首次提出,是基于麻雀种群的觅食和反捕食行为的一种新型智能优化算法。

麻雀搜索算法的具体步骤描述以及公式介绍:

其中,d表示待优化问题的维数,n表示麻雀种群的数量。所有麻雀种群的适应度函数可以表示成如下形式:

其中,Fx表示适应度函数值。

麻雀算法中的麻雀具有两大类分别是发现者和加入者,发现者负责为整个种群寻找食物并为加入者提供觅食的方向,因此,发现者的觅食搜索范围要比加入者的觅食搜索范围大。在每次迭代过程中,发现者按照公式(3)进行迭代。

其中,t表示当前迭代次数,Xij表示第i个麻雀种群在第j维中的位置信息,阿尔法表示的0到1的随机数,itermax表示最大迭代次数,Q表示一个服从正态分布的随机数,L是一个1*d并且元素全为1的矩阵,R2属于0-1表示麻雀种群位置的预警值,ST属于0.5-1表示麻雀种群位置的安全值。

当R2<ST时表示 预警值小于安全值,此时觅食环境中没有捕食者,发现者可以进行广泛搜索操作;当R2>ST时意味着种群中有部分麻雀已经发现捕食者,并向种群中的其他麻雀发出预警,所有麻雀都需要飞往安全区域进行觅食。

在觅食过程中,部分加入者会时刻监视发现者,当发现者发现更好的食物,加入者会与其进行争夺,若成功,会立即获得该发现者的食物,否则加入者按照公式(4)进行位置更新。

其中,XP表示目前发现者所发现的最优位置,Xworst表示当前全局最差的位置,A表示其元素随机赋值为1或-1的1*d的矩阵并且满足一下关系:

L仍然是一个1*d并且元素全为1的矩阵。当i>n/2时这表明第i个加入者没有获得食物,处于饥饿状态,此时需要飞往其他地方进行觅食,以获得更多的能量。

在麻雀种群中,意识到危险的麻雀数量占总数的10%到20%,这些麻雀的位置是随机产生的,按照公式(5)对意识到危险的麻雀的位置进行不断更新。

其中,Xbest表示当前全局最优位置,是服从标准正态分布的随机数用来作为步长控制参数,贝塔是一个属于-1到1的随机数,fi表示当前麻雀个体的适应度值,fg表示全局最佳适应度值,fw表示全局最差适应度值,像左耳朵一样的这个是读"一不洗诺"吗?"一不洗诺"表示一个避免分母为0的常数。当fi>fg时表示此时麻雀处于种群边缘,极易受到捕食者的攻击,当fi=fg时表示处于种群中间的麻雀也受到了危险,此时需要靠近其他麻雀以减少被捕食的风险。

二、基于自适应t分布的麻雀搜索算法

在麻雀算法中引入了自适应t分布变异算子,使用算法的迭代次数作为t分布的自由度参数来增强种群的多样性,避免算法陷入局部最优。算法经过测试相比原始麻雀算法,结果更优,结果能够提高几个数量级。


 五、参考文献及代码私信博主

内容侵权 涉嫌营销 内容抄袭 违法信息 其他

已经收到您得举报信息,我们会尽快审核

我要回帖

更多关于 对k组进行多个样本的方差 的文章