量化算子工具类使用文档 本文档汇总介绍了量化算子工具类中所有函数的功能、输入/输出说明以及使用示例。所有函数均以静态方式提供,调用时直接使用函数名称,无需添加类名前缀。 示例中均采用如下调用格式,例如: CORRELATION(CLOSE,VOLUME,20) 注意 数据要求:各函数要求输入的数据为带有日期和标的信息的多级索引时间序列。如果数据格式不符合要求,内部会自动将索引调整为`date`与`symbol`两级。 参数说明:下列说明中,输入输出参数采用通俗描述,不涉及具体编程语言的数据类型。 --- 基础计算函数 RANK 描述 对横截面数据进行排序,并归一化到区间[-0.5...

上篇[基于《AI系列研究之二:多模型集成量价Alpha策略》理论分析](https://www.pandaai.online/community/article/90) 本篇文章会对其中各部分进行代码研究 项目需求分析与技术架构设计 业务需求梳理 项目的核心目标是构建一个多模型股票预测系统,具体需求包括: 数据层面的要求: 股票池:全A股票市场,但需要剔除ST、ST股票、退市股票以及上市不满三个月的新股 数据源:使用数据库中的日线量价数据,包含高开低收价格、成交量以及市值信息 预测目标:T+1日至T+11日的复权日内VWAP价格收益率 数据预处理:采用3倍MAD截断、zscore标...

  Co   7小时前   4   0   0 Pythonc#机器学习机器学习模型

引言 招商证券的这份研究报告代表了传统金融机构在人工智能应用领域的重要探索。作为AI系列研究的第二篇,该报告聚焦于多模型集成技术在量价Alpha策略中的应用,为量化投资提供了一套完整的技术解决方案。 通过深入研读,我发现这份报告最大的价值在于其模型选择的系统性思考和集成策略的实用性设计,为行业提供了宝贵的方法论参考。 --- 第一部分:为什么需要多模型集成? 1.1传统单一模型的根本局限 在量化投资领域,单一模型面临着无法克服的结构性缺陷: 预测精度的天花板效应 即使是最先进的单...

一、引言 在金融市场投资策略研究领域,小市值和红利低波策略近年来备受关注。在过往研究在这两种策略应用中存在一定缺陷,本文旨在深入剖析并优化,本次着重解决上一次研究中小市值年化收益不足和回撤波动较大的问题。 [小市值与红利低波的互补研究:风险对冲与收益增强的双重路径](https://www.pandaai.online/community/article/76) 1.1上文研究不足之处 上文在优化小市值和红利低波动策略回撤上不够具体,主要体现小市值最大回撤高达34.78%,可以引入熔断机制或者宏...

以下是依据两篇研报因子的文字描述,通过deepseek/pandaai解读生成的Python代码实现,保留了AI生成过程和注释。意识到很多学员用户也正在做这个工作,为节约人力算力能源,在量变学院社群分享一下。 ![image.png](1) ![1748494420354.png](2) 这里是上篇《中金价量》的部分: 通过网盘分享的文件:alpha191中金量价_dspandaai(上).docx 链接:https://pan.baidu.com/s/1O9pvVkP_C_N54kbwAN...

1.1背景 这几天踩了不少数据的坑,趁热打铁总结一下,也希望能帮大家少走点弯路。数据清洗这块,很多人觉得是琐事,其实它对最终策略效果的影响非常大。模型的好坏,很多时候不是算法决定的,而是你喂进去的数据质量决定的。下面我举几个例子,大家就懂了: 1.数据不清洗,就像你要做个火爆肥肠结果菜都没洗,味道能对吗?哈哈哈。 2.第一次拿到因子数据,乍一看数值有点大,就想着直接log一下压缩,结果模型训练完发现还是在学风格因子,整段预测方向跑偏。 3.有些字段比如ROE、净利润增长率,值是0或者极端异常,模...

上一篇文章中我们对高频因子的优势和类型做了简要介绍,从这篇文章开始,我们将对每一大类因子做介绍,并从中选取具体一例因子,实现从数据构建到测试评估的整个过程。 研究环境利用聚宽因子分析API,构建因子函数类;研究在日内高频分钟级数据中挖掘构建高频因子,并对该因子进行有效性检验。 一、动量反转因子 1.1动量反转因子 第一类因子为动量反转因子。动量反转因子通常由过去一段时间的特定类型的涨跌幅构造,其因子收益一方面可能来源于非理性投资者的行为偏差造成的错误定价,另一方面也可能来源于承担特定风险获得...

对于刚转向因子投资的交易者,选择站在前辈肩膀上复现已有的研报因子是不可回避的学习途径。 PandaAI集成了数据/回测/分析框架及代码AI助手一体,为因子学习探索提供了极大便利。 2022年中金《价量因子手册》对于量价覆盖全面,不少量价因子在报告期和以后的很长时间均表现良好。 ![image.png](1) 刚开始尝试的是动量&反转因子: ![image.png](2) 构建方式和计算公式如下: ![image.png](3) 步骤如下: Step1:进入[pandaai因子大赛官...

1.概述 这篇文章我们将分享《中金公司-量化多因子系列(6):关于动量,你所希望了解的那些事》中关于动量因子的适用场景,研报中提到截面分域中,动量特征在高机构覆盖、大市值、低波动、高价值的股票池中更明显;而反转效果在低覆盖、小市值、高波动、低流动性、低价值的股票池内更为显著。本篇文章将使用PandaAI平台快速构建市值、波动性、流动性因子再叠加动量因子,验证研报中关于动量的结论。本文也算是线性多因子组合的入门教程,大家看完就明白一点都不难了。 2.市值因子 相信大家都听说过小市值策略,今天我们...

1.概述 接上一篇,为什么在A股动量因子会呈现出反转特征呢?直接说答案,就是因为散户太多了。 这篇文章我们将分享《中金公司-量化多因子系列(6):关于动量,你所希望了解的那些事》提到的四类投资者,我们试着从投资者结构的角度出发去揭示反转特征,同时也思考作为个人,应该选择成为哪一个象限的投资者。 2.A股投资者结构下的四类典型投资者画像 在理解动量为何在A股呈现出“反转特性”之前,我们需要从投资者结构出发,分析不同类型投资者的行为模式及其对市场价格形成机制的影响。 我们可以从两个维度对投资者...

  AlphaSmith   18天前   63   1   0 新手入门经验分享

背景 最近在小安老师建议下做端到端阿尔法模型的构建复现,踩了不少坑,也有一些收获。这篇文章是结合招商证券那篇《端到端的动态Alpha模型》研报的第一部分,以及我自己的实践经验整理出来的,顺便附了我画的图来梳理结构。 一、线性因子模型逐渐失效了? 研报里其实讲得很清楚,线性模型的问题并不只是过时这么简单,而是它在理论假设上就有点站不住脚。比如APT模型假设资产收益率和因子之间是线性关系,而且残差是独立同分布的、无异方差的。但现实中的金融市场,残差往往具有强烈的异方差性和截面相关性。 这也...

1.概述 在过去,想要复现一篇多因子研究的研报往往是一项艰巨的任务。市面上缺乏成熟、统一的多因子研究平台,研究者不得不从零开始:自行下载数据、进行复杂的数据清洗、构建因子库,搭建因子评价体系,整个过程既耗时又容易出错。对于那些没有编程基础、但对量化投资充满兴趣的人来说,这几乎成为一道无法跨越的门槛。许多想入门的人因此望而却步,迟迟无法真正踏入量化研究的大门。 而如今,PandaAI的出现极大地降低了量化的门槛。它为因子研究提供了一个高效、统一、易用的平台,只需掌握一套简单的函数体系,就可以快...

  AlphaSmith   18天前   168   1   0 新手入门经验分享

上篇[基于《AI系列研究之一:端到端的动态Alpha模型》理论分析](https://www.pandaai.online/community/article/77) 本篇文章会对其中各部分进行代码研究 大概流程划分为下 ![1.png](1) 数据清洗 目的 保证输入数据的质量,剔除不符合要求的样本。 减少后续特征工程和模型训练的偏差。 过滤掉ST和退市股,可避免模型学到噪声或极端异常;空值剔除确保计算指标和归一化不出错。 python defget_all_stocks(self,e...

  Co   22天前   97   0   4 机器学习Python历史数据

一概述 市场对日频及以上频率的量价因子研究由来已久,也比较成熟。相对而言,高频因子研究较为新颖,拥挤度较低,有效性也较高。中金公司的研报《量化多因子系列12:高频因子手册》比较系统的介绍了高频因子的构建及表现,对于我们挖掘高频因子有较好的指导作用。 1.1高频因子的优势 高频因子主要是以股票日内交易价量、逐笔成交、逐笔委托以及分钟k线等数据为基础构建的。捕捉日内交易行为,维度更高,能刻画更精细的市场行为。相对中低频因子,高频因子的优势在于(1)信息含量更为丰富。高频数据量比低频数据大几个量...

1.引言 招商证券发布的这篇研究报告《AI系列研究之一:端到端的动态Alpha模型》探讨了一种基于深度神经网络的动态Alpha因子模型,旨在解决传统线性Alpha模型的局限性。这项研究不仅展示了机器学习在量化金融领域的应用,也为投资决策提供了新的思路和方法。本文将详细分析报告中提出的模型架构、实验设计、创新点以及实际效果。 2.传统因子投资框架及其局限性 2.1传统多因子Alpha模型的构建流程 传统的多因子Alpha模型构建一般包括以下步骤: 单因子研究与筛选 因子预处理(异常值处理、标准...

一引言 本文基于下述研究框架撰写: [基于机器学习的多因子选股策略](https://www.joinquant.com/view/community/detail/7a63b350815f79bfd4d83ab22d0f291a?type=4) 1.1研究背景 当前市场处于经济弱复苏、流动性宽松与高波动并存的复杂环境之下。投资者对收益的需求与对风险的规避形成张力,使得策略分化格局愈加明显。在这样的市场背景下,小市值股票凭借其高弹性在反弹行情中具备出色的表现潜力,而红利低波股票则依靠其高分红特...

一因子原理 我们先明白一个原理,主力一定是在低位建仓,一定是在波动小的时候建仓,不会在暴跌,暴涨的票建仓,反之如果建仓,那之前被套的不就解套了?大资金就成接盘侠了。所以也产生了一个反人性的逻辑事实,就是是因为他们建仓,所以那里才成为低位。 二利用原理反推因子规则 接着前面的话说,要规避掉暴涨,暴跌的票子,那么就是在大盘里面找价格比较稳定的,赌主力要拉这个票,于是我让ai帮我写一个策略,就是找价格稳定的来投资,代码: classStabilityRankFactor(Factor): de...

期货量化交易:数据驱动的市场博弈新范式 随着金融科技的快速发展,量化交易逐渐成为期货市场的重要参与力量。通过数学模型、统计分析和算法技术的结合,量化交易试图从海量市场数据中捕捉短期价格波动的规律性,为投资者提供更高效的风险收益解决方案。 1.核心策略:从趋势捕捉到统计套利 期货量化策略的核心在于对价格、成交量、持仓量等高频数据的挖掘。常见的策略包括: 趋势跟踪策略:通过均线突破、动量因子等模型识别趋势信号,例如基于布林带通道的价格突破策略。 统计套利策略:利用跨品种、跨期合约价差的均值回归特性,如螺纹钢与铁矿石期货的对冲组合。 高频做市策略:在毫秒级时间窗口内捕捉盘口价差,依赖低延迟交...

  17737610618   2025年04月14日   125   1   0 量化策略

<br $\rmWe\,\,define\,\,a\,\,function\,\,{\mathcal{O}(k)}\,\,similar\,\,to\,\,the\,\,Riemann\,\,Zeta\,\,function\,\,\zeta(s)$ $$\mathcal{O(k)}=\displaystyle\lim_{n\to+\infty}\sum_{\tau=2}^n\frac1{\tau^{k}}\,\,\,\,\,\,\,\,\,\,\,\forall\,s\in\mathbb{...

<br <center<fontface="华文行楷"size=6em量化关键指标详解与案例解析</font</center <br <fontface="华文行楷"size=4em一、$\rmSharpe$</font<fontface="华文行楷"color=greensize=4em(夏普比率)</font<br &emsp;&emsp;$\sf1$.<fontface="华文行楷"size=4em定义</font &emsp;&emsp;&emsp;<fontface="华文行楷"size=4em夏普比率用于衡量投资组合每承受一单位总风险所获得的超额回报。它综合考虑了收益和风...

  Navier-Stokesequations   2025年04月07日   10204   1   1 新手入门量化策略