学术咨询服务,正当时...... 期刊天空网是可靠的职称论文发表专业学术咨询服务平台!!!

基于因子IC的多因子量化选股模型及绩效分析

发布时间:2020-04-16所属分类:经济论文浏览:1

摘 要: [摘要]为探究中国股票市场的波动幅度和风险性,选取2016年1月1日至2019年3月31日期间的上证指数和深证成指的收益率为研究对象,建立GARCH模型进行实证分析,得出以下主要结论:外部的冲击会加剧对上证指数、深证成指的波动,且上证指数受到外部冲击的波动更

  [摘要]为探究中国股票市场的波动幅度和风险性,选取2016年1月1日至2019年3月31日期间的上证指数和深证成指的收益率为研究对象,建立GARCH模型进行实证分析,得出以下主要结论:外部的冲击会加剧对上证指数、深证成指的波动,且上证指数受到外部冲击的波动更大,深证成指所受前期波动的影响更大。基于实证分析结果,制定了量化投资策略,即通过因子IC优化复合因子IR的方式来配置因子权重,构造多因子选股模型,并选取一些传统因子结合新构造的非流动性因子ILLIQ来进行分析,回测结果表明在2015年1月1日至2018年1月1日期间的回测中,策略收益达到67.67%,远高于基准收益10.69%。

基于因子IC的多因子量化选股模型及绩效分析

  [关键词]GARCH模型;因子IC;非流动性因子ILLIQ;量化投资

  股票市场是一个“高风险、高收益”的领域,加之我国股票市场复杂多变的特征,传统的基本面分析和技术分析很难获得预期和稳定的收益。如何有效地规避风险,从繁多的市场股票中筛选出未来具有超额收益的股票,是投资者一直以来关注的问题。因此,对股票收益率波动的分析、构建投资组合具有重要的意义。在此背景下,系统高效的量化投资策略可以帮助投资者进行更加理性和准确的投资。

  一、文献综述

  股票量化投资策略是股票合理投资的重要基础,国内外已有诸多学者对其进行了较为深入的分析和研究。

  外国的学者对量化投资领域的研究较早。马科维茨发表的“PortfolioSelection”中推导出的投资人的决策问题公式,说明了投资人资产分配的原则是在达成投资目标的前提下,将资产组合的风险最小化。[1]该文奠定了现代投资组合理论的基础。Fama和French针对包括美国、EAFE国家成熟市场以及16个新兴市场国家的股票市场进行了实证研究,根据B/M,C/P,E/P和D/P区分价值股和成长股,从而形成投资组合。[2]

  国内对量化投资的研究发展较慢,且大多应用于业界。江方敏通过选取上市公司财务报表中的6个财务因子,给出了高出市场基准的12个组合。[3]由于选取的因子过于单一,获取信息片面,无法科学地分析股市行情,给出科学的建议。王昭栋更偏重于多因子模型的应用与实践,对三种多因子模型的绩效表现作以充分的实证和分析,讨论了收益率的稳定性和多因子的冗余性检验。[4]但是为处理数据方便,没有考虑股票市场交易的流动性和流动性风险。

  综上分析,多因子模型相对来说比较稳定,是量化投资领域应用最广泛的一种选股模型。尽管研究成果颇丰,但仍存在以下两点不足:一是没有考虑到我国股市相较于外国股市波动幅度和风险程度更大,只选用传统的因子,忽略了流动性影响因素;二是没有对建立的投资策略进行历史回测,以及对行业的归因分析。

  基于此,本文通过因子IC优化复合因子IR的方式来配置因子权重构造多因子模型,考虑到市场的流动性问题,在选取了6个传统因子的基础上,采用成交量和价格变动联系起来的方式观测流动性,即通过构建非流动性因子ILLIQ来寻找市场对弱流动性的收益补偿;最后为考察构建的投资组合中合成因子的选股能力,进行了历史回测和行业归因分析,以给出更加精准科学的投资策略。

  二、基于GARCH模型的沪深股市收益率波动性分析

  一般来说,我们用收益率波动性指标来衡量股票市场的质量。在一定的波动范围内,股票收益率的波动有活跃股票市场的作用,超过一定幅度会使市场风险暴露,不利于股市的正常运行。投资者通过研究收益率波动性可以较为合理地预测股市风险,而上证指数和深证成指是我国金融市场的晴雨表,反映我国证券市场的走势,投资者能否获利与其波动性关系紧密。

  (一)样本范围

  选取2016年1月1日至2019年3月31日的交易日的上证指数和深证成指的收盘价,使用金融时间序列的计量经济方法估计参数的结果并给出实证结论。用SH表示上证指数收盘价,SZ表示深证成指收盘价,RSH表示沪市收益率,RSZ表示深市收益率。收益率定义为Rt=(Pt-Pt-1)/Pt-1×100%,其中Pt、Pt-1分别表示第t日、t-1日的收盘价。数据来源于iFinD。

  (二)模型选择

  在选择模型时,考虑到在ARCH(p)建模过程中,如果p很大,会导致方差随着之前时刻的变化量而变化,在这种情况下,方差方程中的参数可能会出现负值的情况,不符合理论依据。因此,我们避免使用这种方法。

  而GARCH模型是一个专门面向金融数据的回归模型,在条件方差的方程中加入滞后项,对误差的方差有更进一步的解释,所以被广泛应用于分析和预测波动性。其中,最常使用且通常也很适合金融时间序列的GARCH模型是GARCH(1,1)。本文以2016年1月1日至2019年3月31日的上证指数和深证成指为研究对象,建立GARCH模型。

  相关期刊推荐:《东北财经大学学报》Journal of Dongbei University of Finance and Economics(双月刊)1999年创刊,注重反映以经济科学为主的社会科学研究和教学研究新成果,为改革开放和经济建设服务,为财经教学服务,为本校师生广大经济工作者提供有价值的参考资料。

  (三)实证分析

  1.描述性统计分析

  对上证指数收益率和深证指数收益率进行描述性统计,得到基本统计特征值。其中,上证指数收益率在样本期内的平均值为0.00059,略高于深证成指收益率的平均值0.000419。同时,两个收益率的偏度都小于0,都为左偏;上证指数和深证成指的峰度分别为8.058682和6.273822,都大于正态分布的峰度值3,故两个指数收益率都呈现尖峰厚尾的特征。另一方面,从标准差来看,深证成指的标准差为0.020462,高于上证指数的标准差0.018068,说明深证成指的波动性要大于上证指数。

  2.平稳性检验

  根据前期描述性统计分析的结果,我们推测沪深两指的收益率序列可能存在ARCH/GARCH效应,而时间序列的平稳性是构建模型分析预测的前提。因此,对该序列进行ADF检验,以考察序列的平稳性。

  首先,为了直观分析两个指数收益率序列的平稳性,绘制了沪深两指的收益率时序图,如图1、图2所示。

  通过以上图形可以看出,上证指数收益率和深证指数收益率序列基本都是围绕在0附近上下波动,直观上判断应该都是平稳的。以下进一步采用ADF单位根检验法进行判断,利用EVIEWS软件得到结果汇总,如表1所示。

  从回归结果来看,上证指数收益率单位根的ADF统计量为-19.66081,分别小于显著性水平为10%、5%和1%的临界值。因此,RSH和RSZ都是平稳的,可以直接利用上证指数收益率和深证成指收益率序列进行建模分析。

  3.确定均值方程及残差序列自相关检验

  一般情况下,金融市场的收益率序列都存在自相关现象。故首先根据收益率序列的自相关图来判断其均值方程。通过绘制上证指数收益率的自相关图可知,在滞后4期时的自相关系数最大且显著,故初步判断存在滞后4期的自相关。再次绘制残差的自相关图,可知仍然存在自相关现象,故需要进一步调整。经过不断修正,最终得到的上证指数收益率均值方程为:RSHt=α+β1RSHt-1+β2RSHt-4+β3RSHt-10+εt

  同理,得到的深圳成指收益率均值方程为:RSZt=α+β1RSZt-1+β2RSZt-8+β3RSZt-10+εt

  分别对以上方程估计的残差和残差平方序列进行自相关检验,取滞后10阶,观察沪市和深市残差及残差平方的自相关系数及P值。可知无论沪市还是深市,其残差序列都不存在自相关,但残差平方的序列却都存在显著的自相关性,两个残差平方的波动具有明显的时间可变性和集簇性,初步判断适合采用GARCH模型来进行建模分析。进一步采用ARCH-LM法进行检验,得到的结果如表2所示。

  可以看出,检验的P值都为0,故应该拒绝模型不存在ARCH效应的假设。因此,两个均值方程的残差都存在显著的ARCH效应,适合采用GARCH进行建模。

  4.GARCH建模分析

  在以上得到均值方程的基础上,继续建立GARCH(1,1)模型对两个股票市场的波动性进行分析。首先,运用EViews软件得到的两个市场GARCH(1,1)模型初步估计结果。可以得到,此时两个市场GARCH模型的均值方程中存在变量估计系数不显著的情况;故进一步进行调整,修正后,除部分常数项,模型中的各变量估计系数在10%水平下都是显著的(P<0.1);再次对两个GARCH模型的残差及残差平方进行自相关检验,取滞后10阶得到的结果如表3所示(以沪市为例,深市同理)。

  (四)合成因子的回测

  1.回测结果

  为了考察因子选股能力的回测效果,历史回测的基本设置如下:回测时段为2014年1月1日至2018年1月1日,股票池为A股全部股票,策略参考标准为沪深300指数,组合每5个交易日调仓,交易费率设为双边万分之二。

  由回测结果可知,运用多因子策略得出的投资组合在2014年1月1日至2018年1月1日之间,策略的收益和年化收益率分别达到了67.67%和19.33%,分别远高于基准收益和基准年化收益的10.69%和3.53%。阿尔法值为0.16,贝塔值仅为1.03,夏普比率达到0.49,信息比率达0.83,这些指标表现出色。但是最大回撤相对偏高,为45.68%。结合基准收益、策略收益和超额收益在这三年内的走势和对比,综上可以认为策略运行较好。

  2.回测持仓平均市值

  回测之后,对该策略选股的持仓市值分析。在之前的合成因子选股市值的分布特征中,已经对该策略选股的持仓市值进行了简单的分析,真实回测的持仓市值结果如图6所示。图6展示了全市场股票市值25%分位数、全市场股票市值75%分位数以及策略持仓股票平均市值的时间序列。2014年至2015上半年,策略持仓的平均市值在全市场股票市值75%分位数附近波动,而2015年下半年至今,策略持仓股票平均市值相对偏高,远超全市场股票市值75%分位数。总体来看,该策略的持仓市值相对较高。

  四、结论与建议

  从研究成果出发,对股票市场投资提出以下建议:

  一是要不断提升量化投资技术水平。特别是要将计算技术与各类统计数学模型进行有效结合,在“大数据”时代对复杂的投资相关数据进行挖掘与分析;同时还要高度重视技术分析体系的建设,[5]特别是要对基本面分析指标、股票估值指标、交易趋势等进行有效分析。

  二是要时刻保持风险意识,注意风险防控。由GARCH模型分析结果可知,股票市场易受外部因素的干扰,收益率波动较大。这种波动性在一定程度上会加剧股票投资的不确定性,会给投资者带来丰厚的收益,也可能会带来巨大的损失。因此在进行量化投资策略分析时,也应将投资风险考虑在内。

  三是要加强对大数据的利用能力,做到科学投资。在投资策略分析过程中,存在大量的数据,要增强投资策略的科学性,就必须对“大数据”进行有效利用,常用的方式主要是建立适合的统计模型,并对模型进行深入分析和检验。

2023最新分区查询入口

SCI SSCI AHCI