多因子模型
多因子模型标签描述

背景 最近在小安老师建议下做端到端阿尔法模型的构建复现,踩了不少坑,也有一些收获。这篇文章是结合招商证券那篇《端到端的动态Alpha模型》研报的第一部分,以及我自己的实践经验整理出来的,顺便附了我画的图来梳理结构。 一、线性因子模型逐渐失效了? 研报里其实讲得很清楚,线性模型的问题并不只是过时这么简单,而是它在理论假设上就有点站不住脚。比如APT模型假设资产收益率和因子之间是线性关系,而且残差是独立同分布的、无异方差的。但现实中的金融市场,残差往往具有强烈的异方差性和截面相关性。 这也...

1.1背景 这几天踩了不少数据的坑,趁热打铁总结一下,也希望能帮大家少走点弯路。数据清洗这块,很多人觉得是琐事,其实它对最终策略效果的影响非常大。模型的好坏,很多时候不是算法决定的,而是你喂进去的数据质量决定的。下面我举几个例子,大家就懂了: 1.数据不清洗,就像你要做个火爆肥肠结果菜都没洗,味道能对吗?哈哈哈。 2.第一次拿到因子数据,乍一看数值有点大,就想着直接log一下压缩,结果模型训练完发现还是在学风格因子,整段预测方向跑偏。 3.有些字段比如ROE、净利润增长率,值是0或者极端异常,模...

<br $\rmWe\,\,define\,\,a\,\,function\,\,{\mathcal{O}(k)}\,\,similar\,\,to\,\,the\,\,Riemann\,\,Zeta\,\,function\,\,\zeta(s)$ $$\mathcal{O(k)}=\displaystyle\lim_{n\to+\infty}\sum_{\tau=2}^n\frac1{\tau^{k}}\,\,\,\,\,\,\,\,\,\,\,\forall\,s\in\mathbb{...

一引言 本文基于下述研究框架撰写: [基于机器学习的多因子选股策略](https://www.joinquant.com/view/community/detail/7a63b350815f79bfd4d83ab22d0f291a?type=4) 1.1研究背景 当前市场处于经济弱复苏、流动性宽松与高波动并存的复杂环境之下。投资者对收益的需求与对风险的规避形成张力,使得策略分化格局愈加明显。在这样的市场背景下,小市值股票凭借其高弹性在反弹行情中具备出色的表现潜力,而红利低波股票则依靠其高分红特...

一概述 市场对日频及以上频率的量价因子研究由来已久,也比较成熟。相对而言,高频因子研究较为新颖,拥挤度较低,有效性也较高。中金公司的研报《量化多因子系列12:高频因子手册》比较系统的介绍了高频因子的构建及表现,对于我们挖掘高频因子有较好的指导作用。 1.1高频因子的优势 高频因子主要是以股票日内交易价量、逐笔成交、逐笔委托以及分钟k线等数据为基础构建的。捕捉日内交易行为,维度更高,能刻画更精细的市场行为。相对中低频因子,高频因子的优势在于(1)信息含量更为丰富。高频数据量比低频数据大几个量...