1.概述 在计算完因子数据之后,进行下一步的模型训练之前,通常需要对因子数据进行预处理,以及中性化处理。其中预处理比较简单,一般就是3倍MAD截断,zscore标准化,缺失值填充为0。中性化稍微复杂一些,本文将从市值中性化开始介绍如何进行市值中性化,下一篇将介绍如何进行行业中性化。 2.市值中性化 2.1市值中性化的必要性与逻辑 市值中性化是因子中性化处理中最常见且重要的一种,其核心目的是剔除因子值中由于市值(Size)因素引起的系统性影响,使得因子能够更纯粹地反映其自身的信息,从而提升因...

引言 在Niederhoffer和Osborne的证券交易所的市场做市与价格反转(1996)一文中,作者通过观察并举例股票价格在连续交易的变动ΔYt-1,ΔYt试图寻找在时序上的运动规律,并且得出如股票价格的短期波动并非完全随机,而是由市场制造机制和投资者行为共同塑造等结论。其中,作者认为股票价格在高频数据中存在显著的负自相关特性,即前一期价格ΔYt-1上涨会增加本期ΔYt下跌的概率,反之亦然。作者将这种现象归因于交易所做市商制度和限价订单簿的非均匀分布等市场微观结构因素。另外一个相对更近期的例...

1.概述 平时大家搭建自己的因子库,肯定要会涉及到行情数据的下载,因子库的计算入库等工作,股票数据相对来说数量比较大,更新一次需要不少时间,本文将分享如何通过多线程的方式加快数据的下载,以此为例,也可以扩展到其他大数据任务的计算中。 本文使用Tushare作为数据源,下载A股市场所有股票的日线数据(open,high,low,close,vol),我们将分析串行跟并行两种方法在时间效率上的表现。 2.串行下载 串行下载是最直观的实现方式,按顺序逐个处理每只股票的数据下载请求。注册好tushar...

1.概述 笔者最近搭建了一套因子库,参考的是《20230522-招商证券-AI系列研究之一:端到端的动态Alpha模型》附录中的因子,但因子数量还是有限,于是决定引入一些常见的因子库,本文将分享如何用cursor来帮我们快速生成alpha101因子。 2.cursor安装与激活 从官网下载cursor,新注册的用户有免费的使用次数,如果次数用完,可以到某宝上去购买账户,也可以自己充值。 ![image.png](1) 安装好之后,就可以在右边打开对话框,进行对话式编程了,选择@可以指定代码...

以下是依据两篇研报因子的文字描述,通过deepseek/pandaai解读生成的Python代码实现,保留了AI生成过程和注释。意识到很多学员用户也正在做这个工作,为节约人力算力能源,在量变学院社群分享一下。 ![image.png](1) ![1748494420354.png](2) 这里是上篇《中金价量》的部分: 通过网盘分享的文件:alpha191中金量价_dspandaai(上).docx 链接:https://pan.baidu.com/s/1O9pvVkP_C_N54kbwAN...

上一篇文章中我们对高频因子的优势和类型做了简要介绍,从这篇文章开始,我们将对每一大类因子做介绍,并从中选取具体一例因子,实现从数据构建到测试评估的整个过程。 研究环境利用聚宽因子分析API,构建因子函数类;研究在日内高频分钟级数据中挖掘构建高频因子,并对该因子进行有效性检验。 一、动量反转因子 1.1动量反转因子 第一类因子为动量反转因子。动量反转因子通常由过去一段时间的特定类型的涨跌幅构造,其因子收益一方面可能来源于非理性投资者的行为偏差造成的错误定价,另一方面也可能来源于承担特定风险获得...

对于刚转向因子投资的交易者,选择站在前辈肩膀上复现已有的研报因子是不可回避的学习途径。 PandaAI集成了数据/回测/分析框架及代码AI助手一体,为因子学习探索提供了极大便利。 2022年中金《价量因子手册》对于量价覆盖全面,不少量价因子在报告期和以后的很长时间均表现良好。 ![image.png](1) 刚开始尝试的是动量&反转因子: ![image.png](2) 构建方式和计算公式如下: ![image.png](3) 步骤如下: Step1:进入[pandaai因子大赛官...

1.概述 这篇文章我们将分享《中金公司-量化多因子系列(6):关于动量,你所希望了解的那些事》中关于动量因子的适用场景,研报中提到截面分域中,动量特征在高机构覆盖、大市值、低波动、高价值的股票池中更明显;而反转效果在低覆盖、小市值、高波动、低流动性、低价值的股票池内更为显著。本篇文章将使用PandaAI平台快速构建市值、波动性、流动性因子再叠加动量因子,验证研报中关于动量的结论。本文也算是线性多因子组合的入门教程,大家看完就明白一点都不难了。 2.市值因子 相信大家都听说过小市值策略,今天我们...

1.概述 接上一篇,为什么在A股动量因子会呈现出反转特征呢?直接说答案,就是因为散户太多了。 这篇文章我们将分享《中金公司-量化多因子系列(6):关于动量,你所希望了解的那些事》提到的四类投资者,我们试着从投资者结构的角度出发去揭示反转特征,同时也思考作为个人,应该选择成为哪一个象限的投资者。 2.A股投资者结构下的四类典型投资者画像 在理解动量为何在A股呈现出“反转特性”之前,我们需要从投资者结构出发,分析不同类型投资者的行为模式及其对市场价格形成机制的影响。 我们可以从两个维度对投资者...

  AlphaSmith   21天前   78   1   0 新手入门经验分享

1.概述 在过去,想要复现一篇多因子研究的研报往往是一项艰巨的任务。市面上缺乏成熟、统一的多因子研究平台,研究者不得不从零开始:自行下载数据、进行复杂的数据清洗、构建因子库,搭建因子评价体系,整个过程既耗时又容易出错。对于那些没有编程基础、但对量化投资充满兴趣的人来说,这几乎成为一道无法跨越的门槛。许多想入门的人因此望而却步,迟迟无法真正踏入量化研究的大门。 而如今,PandaAI的出现极大地降低了量化的门槛。它为因子研究提供了一个高效、统一、易用的平台,只需掌握一套简单的函数体系,就可以快...

  AlphaSmith   22天前   196   1   0 新手入门经验分享

一概述 市场对日频及以上频率的量价因子研究由来已久,也比较成熟。相对而言,高频因子研究较为新颖,拥挤度较低,有效性也较高。中金公司的研报《量化多因子系列12:高频因子手册》比较系统的介绍了高频因子的构建及表现,对于我们挖掘高频因子有较好的指导作用。 1.1高频因子的优势 高频因子主要是以股票日内交易价量、逐笔成交、逐笔委托以及分钟k线等数据为基础构建的。捕捉日内交易行为,维度更高,能刻画更精细的市场行为。相对中低频因子,高频因子的优势在于(1)信息含量更为丰富。高频数据量比低频数据大几个量...

期货量化交易:数据驱动的市场博弈新范式 随着金融科技的快速发展,量化交易逐渐成为期货市场的重要参与力量。通过数学模型、统计分析和算法技术的结合,量化交易试图从海量市场数据中捕捉短期价格波动的规律性,为投资者提供更高效的风险收益解决方案。 1.核心策略:从趋势捕捉到统计套利 期货量化策略的核心在于对价格、成交量、持仓量等高频数据的挖掘。常见的策略包括: 趋势跟踪策略:通过均线突破、动量因子等模型识别趋势信号,例如基于布林带通道的价格突破策略。 统计套利策略:利用跨品种、跨期合约价差的均值回归特性,如螺纹钢与铁矿石期货的对冲组合。 高频做市策略:在毫秒级时间窗口内捕捉盘口价差,依赖低延迟交...

  17737610618   2025年04月14日   131   1   0 量化策略

<br <center<fontface="华文行楷"size=6em量化关键指标详解与案例解析</font</center <br <fontface="华文行楷"size=4em一、$\rmSharpe$</font<fontface="华文行楷"color=greensize=4em(夏普比率)</font<br &emsp;&emsp;$\sf1$.<fontface="华文行楷"size=4em定义</font &emsp;&emsp;&emsp;<fontface="华文行楷"size=4em夏普比率用于衡量投资组合每承受一单位总风险所获得的超额回报。它综合考虑了收益和风...

  Navier-Stokesequations   2025年04月07日   10212   1   1 新手入门量化策略