滴血貔貅 小姨妈下海 资生堂紧急召回

频道:我们的头条 日期: 浏览:6

摘要

卷积神经网络引领深度学习的发展,能够运用于多因子选股

卷积神经网络(CNN)是目前最为成熟的深度学习模型,是近年来人工智能蓬勃发展的重要推手之一,其主要特点是通过卷积和池化操作进行自动的特征提取和特征降维。本文首先通过原理分析给出了CNN运用于多因子选股的经验方法;然后在全A股票池内对CNN的预测结果进行单因子测试,其单因子测试结果相比对比模型具有良好表现;本文还构建了行业、市值中性全A选股策略并进行回测,CNN在以中证500为基准的全A选股测试中相比对比模型表现优秀。

本文通过原理分析总结了卷积神经网络运用于多因子选股的经验方法

将卷积神经网络运用于多因子选股时,通过分析其工作原理,我们总结出以下经验:(1)股票因子数据可以组织成二维的“图片”形式,这使得CNN具有了时间序列学习的能力。(2)当卷积核作用于股票因子数据时,本质上是在进行因子合成,因此本文只使用了一层卷积层。(3)池化层是对因子数据的“模糊化”,这对体现因子的明确意义是不利的,因此本文未使用池化层。(4)因子数据在“图片”中的排列顺序会影裸休响到CNN的学习结果。

卷积神经网络合成因子的单因子测试具有良好表现

我们构建了卷积神经网络、全连接神经网络、线性回归三个模型,在2011-01-31至2019-1-31的回测区间中分年度进行训练和测试,样本空间为全A股。从单因子测试的角度来看,CNN合成因子的RankIC均值为13.62%,因子收益率均值为1.021%,略高于全连接神经网络,也要高于线性回归。在分五层测试中,CNN合成因子的TOP组合年化收益率为20.05%,夏普比率为0.72,信息比率为4.04,多空组合的夏普比率为4.84,表现都要优于全连接神经网络和线性回归。

卷积神经网络在以中证500为基准的全A选股测试中表现优秀

基于卷积神经网络、全连接神经网络和线性回归,我们构建了行业、市值中性全A选股策略并进行回测。在2011-01-31至2019-1-31的回测区间中,当以沪深300为基准时,两种神经网络在年化超额收益率、信息比率和Calmar比率上的表现都不如线性回归。当以中证500为基准时,CNN的年化超额收益在13.69%~16.38%之间,超额收益最大回撤在4.80%~7.55%之间,信息比率在2.29~2.56之间,Calmer比率在2.16~2.85之间,CNN在以上各项指标上的表现都优于另外两个模型,全连接神经网络略优于线性回归。

卷积神经网络仍有进一步研究的空间

随着ImageNet旗下的大规模视觉识别挑战赛(ILSVRC)连续数年的推动,卷积神经网络正在日新月异地进步中,还有诸多技术值得我们学习和尝试,例如增大训练样本数量的“数据增强”方法;ResNet中的残差学习方法;Inception网络中的多种尺寸卷积核混合的方法等等。此外,在高频、海量的金融数据中使用CNN也是一个值得尝试的方向。

风险提示:通过卷积神经网络构建的选股策略是历史经验的总结,存在失效的可能。卷积神经网络模型可解释程度较低,使用须谨慎。

本文研究导读

在本系列前期的报告中,我们分别介绍了全连接神经网络和循环神经网络在人工智能选股方面的应用,除此之外,本文还将介绍卷积神经网络的应用。卷积神经网络在最近几年得到了长足的发展,是人工智能研究的领头羊,目前主要应用于计算机视觉、自然语言处理等领域,是相关技术最为成熟的神经网络模型。那么卷积神经网络如何应用于多因子选股中呢?本文将主要关注以下问题:

  1. 卷积神经网络原理是什么?相比于全连接神经网络,有何特色?

  2. 卷积神经网络结构特殊,如何构建股票的因子数据来训练模型?这种构建方法的内在含义是什么?

  3. 卷积神经网络的参数如何设置?模型的如何训练,全部A股票池内选股效果如何?

卷积神经网络简介

卷积神经网络(Convolutional Neural Network, CNN),是计算机视觉研究和应用领域中最具影响力的模型。回顾CNN的发展历史,可以看到一座座令人赞叹的里程碑。Yann Lecun等人在1989年提出基于梯度下降的CNN算法,并成功地将其应用在手写数字字符识别,在当时的技术和硬件条件就能取得低于1%的错误率。2012年,在计算机视觉“世界杯”之称的ImageNet图像分类竞赛四周年,Geoffery E.Hinton等人凭借卷积神经网络AlexNet以超过第二名近12%的准确率一举夺得该竞赛冠军,引起广泛关注,自此揭开了CNN在计算机视觉领域逐渐称霸的序幕,此后每年的ImageNet竞赛的冠军非CNN莫属。2015年,CNN在ImageNet数据集上的错误率(3.57%)第一次超过了人类预测错误率(5.1%)。近年来,随着CNN相关领域研究人员的增多,技术的日新月异,CNN也变得越来越复杂。从最初的5层,16层,到诸如MSRA提出的152层ResNet甚至上千层网络已被广大研究者和工程实践人员司空见惯,成为深度学习发展的重要推手。CNN目前在很多很多研究领域取得了成功,例如: 图像识别,图像分割,语音识别,自然语言处理等。虽然这些领域中解决的问题并不相同,但是这些应用方法都可以被归纳为:CNN可以自动从(通常是大规模)数据中学习特征,并把结果向同类型未知吕易圣艾灸液数据泛化。(以上资料和数据整理自ImageNet)

卷积神经网络的原理

卷积神经网络的结构模仿了眼睛的视觉神经的工作原理。对于眼睛来说,视觉神经是它和大脑沟通的桥梁,大量的视觉神经分工协作,各自负责一小部分区域的视觉图像,再将图像的各种局部特征抽象组合到高层的视觉概念,使得了人类具有了视觉认知能力。卷积神经网络也是类似,它包含了至少一层卷积层,由多个卷积核对图像的局部区域进行特征提取。我们将以经典的LeNet-5模型为例,介绍卷积神经网络的工作原理。

LeNet-5的原始输入数据(图表1中的input)为二维图像,横轴和纵轴分别是图像的高度和宽度的像素点,为了识别该图像中的字母,LeNet-5依次完成以下步骤:

  1. 第一层卷积层(图表1中的conv1)进行卷积运算。该层由若干卷积核组成,每个卷积核的参数都是通过反向传播算法优化得到的。卷积核的目的是通过扫描整张图片提取不同特征,第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级,更多层的网络能从低级特征中迭代提取更复杂的特征。在卷积层之后都会使用非线性激活函数(如RELU,tanh等)对特征进行非线性变换。

  2. 第一层池化层(图表1中的pool1)进行池化运吕素鹏算。通常在卷积层之后会得到维度很大的特征,池化层可以非常有效地缩小参数矩阵的尺寸,从而减少最后全连层中的参数数量。使用池化层既可以加快计算速度也有防止过拟合的作用。一般池化层将特征切成几个区域,取其最大值或平均值,得到新的、维百变马丁全集365集度较小的特征。卷积层和池化层其实都是在对具有高维特征的图片进行特征提取和特征降维(subsample)。

  3. 第二层卷积层和第二层池化层(图表1中的conv2和pool2)进行进一步的特征提取和特征降维,得到更加高层和抽象的特征。

  4. 全连接层(图表1中的hidden4和full connection)把卷积核池化得到的特征展平为一维特征,用来进行最后的训练和预测。

从LeNet-5的步骤中我们可以看出,CNN之所以能够在计算机视觉领域中发挥越来越重要的作用,是因为其具有强大的特征提取能力,对于一块图片,人为的切割提取特征不仅对图像本身的完整性有害,而且提取的特征有限,不能捕捉到最好的切割效果,而CNN能够很好的完成这份工作,通过不同的卷积核进行特征提取,并结合池化层的降维能力,一方面不会遗漏重要的信息,另一方面数据的复杂度并没有太大的提升,可以得到相比人为提取特征更完美的结果,这也是其他神经网络所不具备的特点。

卷积神经网络和ImageNet

ImageNet项目是一个用于视觉对象识别软件研究的大型可视化数据库,包含超过1400万张有标注的图像。该项目的图像由李飞飞团队从2007年开始,耗费大量人力,通过各种方式(赵伊虹网络抓取,人工标注,亚马逊众包平台等)收集制作而成,是计算机视觉研究领域最权威的平台之一。近年来,CNN的各种改进版本在ImageNet旗下的大规模视觉识别挑战赛(ILSVRC)中持续斩获冠军。在图表2中,我们将简要介绍几种重要的卷积神经网络以及其在ILSVRC的表现。

回顾历史,正是不断加深、结构不断复杂的CNN引领了人工智能领域最近数年的发展。在最后两届ILSVRC比赛中(2016和2017),CNN的进一步改进版本Trimps-Soushen以及SENet分别获得了冠军。

卷积神经网络应用于股票多因子收益预测

总结一下CNN的原理,我们可以得出CNN最关键的特性:特征提取和特征降维,借助神经网络的端到端以及反向传播的特性,CNN可以根据数据和标签的情况进行自动的特征提取和特征降维。

随着金融市场的发展,大量与股票收益可能相关的数据在连续不断地生成,CNN的优秀特性或许能为我们提供股票收益建模的新方法。然而回顾CNN的发展历程,其大部分应用都是在计算机视觉领域,如果将CNN应用到股票多因子收益预测,需要对因子数据进行一定的整理组织。

如图表3所示,为了利用CNN方便处理二维数据的特性,我们将个股的因子数据组织成二维形式,假设某个股有10个因子(EP,BP,ROE,…),考虑5个历史截面期,则对于该个股来说啊宾,可以得到一张个股的“因子图片”,该个股对应一个t时间的相对收益率Rt作为标签,如果在一个截面上有3000只个股,我们就可以得到3000张个股的“因子图片”及其对应的标签。另外,这样的数据处理方式也很自然地利用了个股因子数据的时间序列属性。

对于某个股的“因子图片”,接下来将其输入到CNN中进行卷积运算,卷积运算的详细步骤如图表4~图表6所示。如图表4,假设有一个大小为2*2的卷积核,该卷积核对应4个权重(W1,W2,W3,W4)以及一个偏置项(bias)。卷积运算先从“因子图片”的左上角开始,选取一块与卷积核大小相同的区域进行运算,得到图表4右侧灰色区域的卷积结果。具体的运算公式在图表4正下方,可以看出,该运算本质上就是对历史因子数据进行因子合成,在同一时间截面上,不同的因子与权重相乘后累加,得到新的因子值F。接下来,如图表5和图表6所示,卷积核会在水平和垂直两个方向上对“因子图片”进行遍历的卷积运算,最终生成一个9*4大小的“卷积结果图片”。

由上可知,卷积运算本质上还是线性运算,如果想使得模型具有非线性拟合的能力,就要使用非线性激活函数,如图表7所示,我们使用目前最常用的激活函数RELU,得到图表7右侧的结果,接下来我们再将其进行一维展开,得到卷积层处理后的因子向量(X1t-4,X1t-3,…,Xnt-2,Xnt-1)。最后我们将一维的因子向量输入全连接神经网络中,就可以按照全连接神经网络的优化方法(反向传播,梯度下降)来优化网络参数。

到这里,读者可能会有三个疑问,我们将给出解释:

  1. 以上步骤只使用了一层卷积层,可否使用多层卷积层?

  2. 以上步骤为何没有池化层?

  3. “因子图片”中因子的排列顺序对结果是否有影响?

对于第一个问题,理论上可以再添加更多卷积层。但我们认为卷积层的多少和训练数据的性质有关,在多因子选股的应用中,使用的因子都是具有明确意义,经过单因子测试后有效的因子,卷积层所起的作用是对因子之间进行非线性组合,因此一层卷积层大致已经足够。而对于图像识别的应用来说,如图表8所示,使用的训练数据是抽象层级很低的像素点,一层卷积层只能提取出人脸的边缘、轮廓等低层次特征,需要用更多的卷积层才能逐渐提取出高层次特征(如人的眼睛、耳朵黑函之舞、鼻子等)。因此,如果我们使用的股票数据是更加原始的数据,那么多层卷积层或许能达到更好的效果。

对于第二个问题,解释与第一个问题类似。如图表9,池化层所起的作用本质上是对卷积的结果进行“模糊化”(图表9右侧的MAX Pooling),归纳局部区域内的统计特征,图像识别所输入的图片具有很高维度的像素,池化层的“模糊化”能在只损失极少量信息的情况下,归纳出图片区域的局部特征,这对于图像识别的降维和可泛化性来说非常有用。但是多因子选股中的因子都是具有明确意义的特征,如果使用池化层进行“模糊化”,相当于损失了一些精细的信息,这对于股票收益建模来说并不可靠。

对于第三个问题,我们认为“因子图片”中因子的排列顺序会对训练和预测结果造成影响。事实上这是卷积神经网络相比全连接神经网络或循环神经网络具有根本区别的地方。由于卷积核本质上是在对部分因子进行合成,因此不同的因子排列顺序会影响卷积核中权重的训练,图表10中的左右两张图展示了两种排布因子的方式,左图中BP因子和ROE因子相邻,右图中BP因子和ROE因子不相邻,那么对于右图中的情况来说,从卷积核的作用区域(黄色)可以看出,无法对BP因子和ROE因子进行卷积运算,这将使得卷积核中权重的训练形成差异。而对于全连接神经网络或循环神经网络,无论如何打乱因子的排列顺序,都不会对结果形成影响。因此,在生成“因子图片”时,如何排布因子也是一个有意义的话题,本文将不会继续展开讨论。我们认为一种合理的排布方式是将属于同一大类因子的细分因子放在相邻位置;而对于达人秀申林不同的大类因子来说,将可能有相互作用的大类因子放在相邻位置。

卷积神经网络选股模型测试流程

测试流程

测试流程包含如下步骤:

  1. 数据获取:

    a)股票池:全A股。剔除ST股票,剔除每个截面期下一交易日停牌的股票,剔除上市3个月内的股票,每只股票视作一个样本。

    b)回测区间:2011年1月31日至2019年1月31日。

  2. 特征和标签提取:每个自然月的最后一个交易日,计算82个因子暴露度,作为样本的原始特征,因子池如图表13和图表14所示。计算下一整个自然月的个股超额收益(以沪深300指数为基准),对于分类模型,选取下月收益排名前30%的股票作为正例(y = 1),后30%的股票作为负例(y = 0),作为样本的标签。对于回归模型,使用下个月的超额收益作为标签。

  3. 特征预处理和二维数据生成

    a)中位数去极值:设第T期某因子在所有个股上的暴露度序列为 Di,DM为该序列中位数,DM1为序列|Di-DM|的中位数,则将序列Di中所有大于DM+5DM1的数重设为DM+5DM1,将序列Di中所有小于DM-5DM1的数重设为DM+5DM1;

    b)缺失值处理:得到新的因子暴露度序列后,将因子暴露度缺失的地方设为中信一级行业相同个股的平均值;

    c)行业市值中性化:将填充缺失值后的因子暴露度对行业哑变量和取对数后的市值做线性回归,取残差作为新的因子暴露度;

    d)标准化:将中性化处理后的因子暴露度序列减去其现在的均值、除以其标准差,得到一个新的近似服从N(0, 1)分布的序列。

    e)要使用卷积神经网络,需要提供二维的特征数据,我们按照图表3的形式,将某只股票多个截面期的因子数据组织成类似于图片的二维数据,总共82行(对应82个因子),5列(对应5个截面期),这样在每个月截面上,就可以得到上千张“股票图片”。

  4. 滚动训练集和验证集的合成:由于月度滚动训练模型的时间开销较大,本文采用年度滚动训练方式,全体样本内外数据共分为九个阶段,如下图所示。例如预测2011年时,将2005-2010年共72个月数据合并作为样本内数据集;预测T年时,将T-6至T-1年的72个月合并作为样本内数据。

  5. 样本内训练:使用卷积神经网络农家长嫂对训练集进行训练。

  6. 交叉验证调参:随机取10%样本内的数据作为验证集,在训练的同时观察卷积神经网络在验证集上的表现,当验证集上的loss达到最小时,停止训练。

  7. 样本外测试:确定最优参数后,以T月末截面期所有样本预处理后的特征作为模型的输入,得到每个样本的预测值f(x)。将预测值视作合成后的因子,进行单因子分层回测。

  8. 模型评价:我们以分层回测和构建选股策略的结果作为模型评价标准。

测试模型设置

为了进行系统的对比,本文将会对比三个模型的测试结果:卷积神经网络、全连接神经网络和线性回归。其中卷积神经网络和全连接神经网络的主要参数如下:

卷积神经网络:

(1)输入数据:每个股票样本包含82个因子,5个历史截面期,构成82*5的“股票图片”,其标签为1或0(涨或跌)。

(2)卷积层:一层卷积层,包含10个5*5大小的卷积核。卷积核权重使用xavier初始化方法(一种保证激活值和梯度值方差不变的初始化方法,经实证适合于初始化卷积层)。

(3)池化层:没有池化层。

(4)全连接层:3层全连接层,分别包含100、70、40个神经元,连接权重使用truncated_normal初始化方法(截断的正态分布初始化方法,最为常用)。

(5)Dropout率(神经元连接随机断开的比例):80%。

(6)优化器和学习速率:RMSProp,0.001。

(7)损失函数:交叉熵损失函数(二分类)。

卷积神经网络结构如下图所示:

全连接神经网络,为了能和卷积神经网络进行差异最小的对比,我们将全连接神经网络的参数设置如下:

(1)输入数据:每个股票样本包含82个因子,5个历史截面期,构成82*5的“股票图片”,再将“股票图片”进行一维展开,作为输入数据,其标签为1或0(涨或跌)。

(2)全连接层:4层全连接层,分别包含780、100、70、40个神经元,连接权重使用truncated_normal初始化方法。这里第一层全连接层的780个神经元等于卷积神经网络中卷积结果一维展开后得到的特征数目,780=(82-5+1)*10

(3)Dropout率:80%。

(4)优化器和学习速率:RMSProp,0.001。

(5)损失函数:交叉熵损失函数(二分类)。

全连接神经网络结构如下图所示:

卷积神经网络选股模型测试结果

单因子测试

如果将机器学习模型的输出视为单因子,则可进行单因子测试。

单因子回归测试和IC测试

测试模型构建方法如下:

  1. 股票池:全A股,剔除ST股票,剔除每个截面期下一交易日停牌的股票,剔除上市3个月以内的股票。

  2. 回测区间:2011-01-31至2019-01-31。

  3. 截面期:每个月月末,用当前截面期因子值与当前截面期至下个截面期内的个股收益进行回归和计算RankIC值。

  4. 数据处理方法:对于分类模型,将模型对股票下期上涨概率的预测值视作单因子。对于回归模型,将回归预测值视作单因子。因子值为空的股票不参与测试。

  5. 回归测试中采用加权最小二乘回归(WLS),使用个股流通市值的平方根作为权重。IC测试时对单因子进行行业市值中性。

如图表17所示,卷积神经网络的RankIC均值和因子收益率均值略高于全连接神经网络,也要高于线性回归。

图表18和图表19分别展示了三种模型的累积RankIC和累积因子收益率曲线。

单因子分层测试

依照因子值对股票进行打分,构建投资组合回测,是最直观的衡量因子优劣的手段。测试模型构建方法如下:

  1. 股票池、回测区间、截面期均与回归法相同。

  2. 换仓:在每个自然月最后一个交易日核算因子值,在下个自然月首个交易日按当日收盘价换仓,交易费用以双边千分之四计。

  3. 分层方法:因子先用中位数法去极值,然后进行市值、行业中性化处理(方法论详见上一小节),将股票池内所有个股按因子从大到小进行排序,等分N层,每层内部的个股等权配置。当个股总数目无法被N整除时采用任一种近似方法处理均可,实际上对分层组合的回测结果影响很小。

  4. 多空组合收益计算方法:用Top组每天的收益减去Bottom组每天的收益,得到每日多空收益序列r1,r2,...,rn,则多空组合在第n天的净值等于(1+r1)(1+r2)...(1+rn)。

  5. 评价方法:全部N层组合年化收益率(观察是否单调变化),多空组合的年化收益率、夏普比率、最大回撤、月胜率等。

我们展示了模型分层测试的结果(图表20和图表22)。另外,我们对比了三种模型分层测试的TOP组合的表现(图表21和图表23),在年化收益率、夏普比率、信息比率上,卷积神经网络相比全连接神经网络表现略好,并且优于线性回归。

构建策略组合及回测分析

基于卷积神经网络、全连接神经网络和线性回归,我们构建了行业、市值中性全A选股策略并进行回测。图表24中分别展示了以沪深300和中证500为基准的策略表现明细,包含年化超额收益率、超额收益最大回撤、信息比率、Calmar比率。图表24从左至右对应不同的个股权重偏离上限。从图表24中可以看出,当以沪深300为基准时,两种神经网络在年化超额收益率、信息比率和Calmar比率上的表现都不如线性回归。当以中证500为基准时,卷积神经网络则在各项指标上的表现都优于另外两个模型,全连接神经网络则略优于线性回归。

我们有选择性地展示两个策略的超额收益表现,如图表25和图表26所示。

结论和展望

卷积神经网络(CNN)是目前发展最为成熟、投入研究力度最大的深度学习模型,是近年来人工智能蓬勃发展的重要推手之一。本文对CNN的原理和特色进行了介绍,并探讨了如何使用CNN构建人工智能选股模型。初步得出以下结论:

  1. 卷积神经网络(CNN)是目前最为成熟的深度学习模型,是近年来人工智能蓬勃发展的重要推手之一,其主要特点是通过卷积和池化操作进行自动的特征提取和特征降维。把CNN运用于多因子选股时,我们总结出以下经验:(1)股票因子数据可以组织成二维的“图片”形式,这使得CNN具有了时间序列学习的能力。(2)当卷积核作用于股票因子数据时,本质上是在进行因子合成,因此本文只使用了一层卷积层。(3)池化层是对因子数据的“模糊化”,这对体现因子的明确意义是不地下大厅的深处利的,因此本文未使用池化层。(4)因子数据在“图片”中的排列顺序会影响到CNN的学习结果。

  2. 我们构建了卷积神经网络、全连接神经网络、线性回归三个模型,在2011-01-31至2019-1-31的回测区间中分年度进行训练和测试,样本空间为全A股。从单因子测试的角度来看,CNN合成因子的RankIC均值为13.62%,因子收益率均值为1.021%,略高于全连接神经网络,也要高于线性回归。在分五层测试中,CNN合成因子的TOP组合年化收益率为20.05%,夏普比率为0.72,信息比率为4.04,多空组合的夏普比率为4.84,表现都要优于全连接神经网络和线性回归。

  3. 基于卷积神经网络、全连接神经网络和线性回归,我们构建了行业、市值中性全A选股策略并进行回测。在2011-01-31至2019-1-31的回测区间中,当以沪深300为基准时,两种神经钟铭选网络在年化超额收益率、信息比率和Calmar比率上的表现都不如线性回归。当以中证500为基准时,CNN的年化超额收益在13.69%~16.38%之间,超额收益最大回撤在4.80%~7.55%之间,信息比率在2.29~2.56之间,Calmar比率在2.16~2.85之间,CNN在以上各项指标上的表现都优于另外两个模型,全连接神经网络略优于线性回归。

  4. 随着ImageNet旗下的大规模视觉识别挑战赛(ILSVRC)连续数年的推动,卷积神经网络正在日新月异地进步中,还有诸多技术值得我们学习和尝试,例如增大训练样本数量的“数据增强”方法;ResNet中的残差学习方法;Inception网络中的多种尺寸卷积核混合的方法等等。此外,在高频、海量的金融数据中使用CNN也是一个值得尝试的方向。

风险提示

通过卷积神经网络构建的选股策略是历史经验的总结,存在失效的可能。卷积神经网络模型可解释程度较低,使用须谨慎。

免责申明

本报告仅供华泰证券股份有限公司(以下简称“本公司”)客户使用。本公司不因接收人收到本报告而视其为客户。

本报告基于本公司认为可靠的、已公开的信息编制,但本公司对该等信息的准确性及完整性不作任何保证。本报告所载的意见、评估及预测仅反映报告发布当日的观点和判断。在不同时期,本公司可能会发出与本报告所载意见、评估及预测不一致的研究报告。同时,本报告所指的证券或投资标的的价格、价值及投资收入可能会波动。本公司不保证本报告所含信息保持在最新状态六合彩开奖。本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。

本公司力求报告内容客观、公正,但本报告所载的观点、结论和建议仅供参考,不构成所述证券的买卖出价或征价。该等观点、建议并未考虑到个别投资者的具体投资目的、财务状况以及特定需求,在任何时候均不构成对客户私人投资建议。投资者应当充分考虑自身特定状况,并完整理解和使用本报告内容,不应视本报告为做出投资决策的唯一因素。对依据或者使用本报告所造成的一切后果,本公司及作者均不承担任何法律责任。任何形式的分享证券投资收益或者分担证券投资损失的书面或口头承诺均为无效。

本公司及作者在自身所知情的范围内,与本报告所指的证券或投资标的不存在法律禁止的利害关系。在法律许可的情况下,本公司及其所属关联机构可能会持有报告中提到的公司所发行的证券头寸并进行交易,也可能为之提供或者争取提供投资银行、财务顾问或者金融产品等相关服务。本公司的资产管理部门、自营部门以及其他投资业务部门可能独立做出与本报告中的意见或建议不一致的投资决策。

本报告版权仅为本公司所有。未经本公司书面许可,任何机构或个人不得以翻版、复制、发表、引用或再次分发他人等任何形式侵犯本公司版权。如征得本公司同意进行引用、刊发的,需在允许的范围内使用,并注明出处为“华泰证券研究所”,且不得对本报告进行任何有悖原意的引用、删节和修改。本公司保留追究相关责任的权力。所有本报告中使用的商标、服务标记及标记均为本公司的商标、服务标记及标记。

本公司具有中国证监会核准sexy18的“证券投资咨询”业务资格,经营许可证编号为:91320000704041011J。

全资子公司华泰金融控股(香港)有限公司具有香港证监会核准的“就证券提供意见”业务资格,经营许可证编号为:AOK809

版权所有2019年华泰证券股份有限公司

林晓明

执业证书编号:S0570516010001

华泰金工深度报告一览

金融周期系列研究(资产配置)

【华泰金工林晓明团队】二十载昔日重现,三四年周期轮回——2019年中国与全球市场量化资产配置年度观点(上)

【华泰金工林晓明团队】二十载昔日重现,三四年周期轮回——2019年中国与全球市场量化资产配置年度观点(下)

【华泰金工林晓明团队】周期轮动下的BL资产配置策略

【华泰金工林晓明团队】周期理论与机器学习资产收益预测——华泰金工市场周期与资产配置研究

【华泰金工林晓明团队】市场拐点的判断方法

【华泰金工林晓明团队】2018中国与全球市场的机会、风险 年度策略报告(上)

【华泰金工林晓明团队】基钦周期的量化测度与历史规律妙角士 华泰金工周期系列研究

【华泰金工林晓明团队】周期三因子定价与资产配置模型(四)——华泰金工周期系列研究

【华泰金工林晓明团队】周期三因子定价与资产配置模型(三)——华泰金工周期系列研究

【华泰金工林晓明团队】周期三因子定价与资产配置模型(二)——华泰金工周期系列研究

【华泰金工林晓明团队】周期三因子定价与资产配置模型(一)——华泰金工周期系列研究

【华泰金工林晓明团队】华泰快播金工周期研究系列 基于DDM模型的板块轮动探索

【华泰金工林晓明团队】市场周期的量化分解

【华泰金工林晓明团队】周期研究对大类资产的预测观点

【华泰金工林晓明团队】金融经济系统周期的确定(下)——华泰滴血貔貅 小姨妈下海 资生堂紧急召回金工周期系列研究

【华泰金工林晓明团队】金融经济系统周期的确定(上)——华泰金工周期系列研究

【华泰金工林晓明团队】全球多市场择时配置初探——华泰周期择时研究系列

行业指数频谱分析及配置模型:市场的周期分析系列之三

【华泰金工林晓明团队】市场的频率——市场轮回,周期重生

【华泰金工林克隆杀手晓明团队】市场的轮回——金融市场周期与经济周期关系初探

FOF与金融创新产品

【华泰金工】生命周期基金Glide Path开发实例——华泰FOF与金融创新产品系列研究报告之一

因子周期(因子择时)

【华泰金工林晓明团队】周期视角下的因子投资时钟--华泰因子周期研究系列之二

【华泰金工林晓明团队】因子收益率的周期性研究初探

择时

【华泰金工林晓明团队】华泰风险收益一致性择时模型

【华泰金工林晓明团队】技术指标与周期量价择时模型的结合

【华泰金工林晓明团队】华泰价量择时模型——市场周期在择时领域的应用

行业轮动

【华泰金工林晓明团队】估值因子在行业配置中的应用——华泰行业轮动系列报告之五

【华泰金工林晓明团队】动量增强因子在行业配置中的应用--华泰黄h行业轮动系列报告之四

【华泰金工林晓明团队】财务质量因子在行业配置中的应用--华泰行业轮动系列报告之三

【华泰金工林晓明团队】周期视角下的行业轮动实证分析华泰行业轮动系列之二

【华泰金工林晓明团队】基于通用回归模型的行业轮动策略 华泰行业轮动系列之一

多因子选股

【华泰金工林晓明团队】华泰单因子测试之一致预期因子 ——华泰多因子系列之九

【华泰金工林晓明团队】华泰单因子测试之财务质量因子——华泰多因子系列之八

【华泰金工林晓明团队】华泰单因子测试之资金流向因子——华泰多因子系列之七

【华泰金工林晓明团队】华泰单因子测试之波动率类因子——华泰多因子系列之六

【华泰金工林晓明团队】华泰单因子测试之换手率类因子——华泰多因子系列之五

【华泰金工林晓明团队】华泰单因子测试之动量类因子——华泰多因子系列之四

【华泰金工林晓明团队】华泰单因子测试之成长类因子——华泰多因子系列之三

【华泰金工林晓明团队】华泰单因子测试之估值类因子——华泰多因子系列之二

【华泰金工林晓明团队】华泰多因子模型体系初探——华泰多因子系列之一

【华泰金工林晓明团队】五因子模型A股实证研究

【华泰金工林晓明团队】红利因子的有效性研究——华泰红利指数与红利因子系列研究报告之二

人工智能

【华泰金工林晓明团队】对抗过拟合:从时序交叉验证谈起

【华泰金工林晓明团队】人工智能选股之损失函数的改进——华泰人工智能系列之十三

【华泰金工林晓明团队】人工智能选股之特征选择——华泰人工智能系列之十二

【华泰金工林晓明团队】人工智能选股之Stacking集成学习——华泰人工智能系列之十一

【华泰金工林晓明团队】宏观周期指标应用于随机森林选股——华泰人工智能系列之十

【华泰金工林晓明团队】人工智能选股之循环神经网络——华泰人工智能系列之九

【华泰金工林晓明团队】人工智能选股之全连接神经网络——华泰人工智能系列之八

【华泰金工林晓明团队】人工智能选股之Python实战——华泰人工智能系列之七

【华泰金工林晓明团队】人工智能选股之Boosting模型——华泰人工智能系列之六

【华泰金工林晓明团队】人工智能选股之随机森林模型——华泰人工智能系列之五

【华泰金工林晓明团队】人工智能选股之朴素贝叶斯模型——华泰人工智能系列之四

【华泰金工林晓明团队】人工智能选股之支持向量机模型— —华泰人工智能系列之三

【华泰金工林晓明团队】人工智能选股之广义线性模型——华泰人工智能系列之二

指数增强基金分析

【华泰金工林晓明团队】再探回归法测算基金持股仓位——华泰基金仓位分析专题报告

【华泰金工林晓明团队】酌古御今:指数增强基金收益分析

【华泰金工林晓明团队】基于回归法的基金持股仓位测算

【华泰金工林晓明团队】指数增强方法汇总及实例——量化多因子指数增强策略实证

基本面选股

【华泰金工林晓明团队】华泰价值选股之相对市盈率港股模型——相对市盈率港股通模型实证研究

【华泰金工林晓明团队】华泰价值选股之FFScore模型

【华泰金工林晓明团队】相对市盈率选股模型A股市场实证研究

【华泰金工林晓明团队】华泰价值选股之现金流因子研究——现金流因子选股策略实证研究

【华泰金工林晓明团队】华泰基本面选股之低市收率模型——小费雪选股法g7052 A 股实证研究

【华泰金工林晓明团队】华泰基本面选股之高股息率模型之奥轩尼斯选股法A股实证研究

基金定投

【华泰金工林晓明团队】大成旗下基金2018定投策略研究

【华泰金工林晓明团队】布林带与股息率择时定投模型——基金定投系列专题研究报告之四

【华泰金工林晓明团队】基金定投3—马科维茨有效性检验

【华泰金工林晓明团队】基金定投2—投资标的与时机的选择方法

【华泰金工林晓明团队】基金定投1—分析方法与理论基础

Smartbe沈诺傅擎ta

【华泰金工林晓明团队】Smartbeta在资产配置中的优势——华泰金工Smartbeta专题研究之一

其它

【华泰金工林晓明团队】A股市场及行业的农历月份效应——月份效应之二

A股市场及行业的月份效应——详解历史数据中的隐藏法则