<fontcolor="brown"一、开篇</font <fontcolor="orange"Lifeisshort,youneedPython!</font <fontcolor="red"人生苦短,我用Python!</font ![python之父.2.png](1) 文科生学习量化投资,确实存在诸多门槛。在前文提及的数理、代码、金融、交易这四个维度里,我觉得数理当属最为关键且难度最高的部分。毕竟里面有线性代数、统计、概率论、计量经济这些硬核内容,咱可以先Pass这部分。...

  我是宽客   2025年06月29日   642   3   0 学习资源新手入门经验分享

<fontcolor="brown"一、背景</font <fontcolor="red"谁是西蒙斯?</font ![夜景001.jpg](2) 2019年,我天天对着堆成山的财务报表加班,眼睛都快看花了。Excel和财务软件上跳动的数字突然变得陌生——难道我的人生就要永远困在这些冰冷的账目里?难道我就这样替人做利润表一辈子,自己的财务人生却还是空白? 想起大学时炒股的“黑历史”,看了两本技术指标书后,啥也不懂就瞎买,最后被割得干干净净,成了妥妥的韭菜。但心里一直藏着个梦想:...

  我是宽客   2025年06月26日   656   8   3 学习资源新手入门经验分享

最近在研究时间序列分析时,读到一篇关于相空间粗粒化的论文,让我对符号动力学产生了浓厚兴趣。作为量化交易者,我们总是在寻找市场转折点——从上涨转向下跌,从震荡转向趋势,从高波动转向低波动。传统的技术分析往往基于价格的绝对数值,但符号动力学提供了一个全新的视角:不要纠结于具体的价格,而是要关注状态的转换逻辑。 这个思路很有意思,让我想起做高频交易时的一个困惑:同样是上涨10个tick,在不同的市场状态下意义完全不同。如果我们能够准确识别和预测状态转换,是否就能在关键时刻抓住机会? 为什么要关注状...

报告原文下载链接:https://pan.baidu.com/s/1yShAqy_AY8aB8Vx4RvgvNg提取码:lvi0 和上次一样,我们先来分析标签、特征和因子分别是什么。在这篇研报中,标签有股票代码、每日开盘价、每日收盘价、交易者结构等未经加工的底层市场数据。特征有交易者结构(大小单)、交易占比(如小单交易占比=小单成交金额/总成交金额)、过去20日累计涨跌幅(Ret20)、过去240日累计涨跌幅(Ret240)、剔除最近40日的过去200日涨跌幅(Ret240_40)等从原始标签...

  18958283423   2025年06月24日   141   0   0 量化策略Python

报告原文下载链接:https://pan.baidu.com/s/1xPDtXF138Q6bGZ4CxoTd7g提取码:dy4o 在这篇研报中,标签为每日开盘价、每日收盘价、每日换手率、指数隔夜涨跌幅等未经加工的底层市场数据。特征为传统隔夜涨跌幅、隔夜涨跌幅绝对值、超额隔夜涨跌幅、超额换手率、滚动相关性等从原始标签中提取或计算出的尚未验证预测能力的中间变量。因子为传统隔夜因子、隔夜跳空因子、新因子MIF等对收益率有显著解释力的特征。 本篇研报的核心与上一篇研报相同,都是利用A股市场的非有效性...

一、标签 1.定义 标签是原始数据中直接观测到的底层属性,是分析的基础原材料。 2.核心特点 未经加工的自然记录(如数据库中的原始字段)。 可能包含无关变量,需筛选后才能用于建模。 3.示例 金融领域:股票每日收盘价、成交量、财务报表中的净利润。 其他领域:气温、犯罪率、冰淇淋销量。 二、特征 1.定义 特征是从标签中筛选或派生出的变量,与当前分析目标直接相关。 2.核心特点 是标签的子集或变换结果(如对数收益率、移动平均线)。 需经过业务逻辑过滤(如投资分析中排除“天气数据”)。 3.示...

  18958283423   2025年06月16日   135   1   3 学习资源新手入门经验分享

最近几年在做量化研究时,我有一个很深的感受:A股市场正在发生一些根本性的变化。以前那种靠题材炒作、概念驱动的投资方式越来越难赚钱了,反而是一些基本面扎实的公司开始受到资金青睐。 这种变化背后有两个很重要的推手。第一个是外资的持续流入。我记得2016年刚开始关注北上资金的时候,很多人还把它当作一个短期的资金流向指标来看。但现在回头看,外资买入的逻辑其实很清晰:ROE高、现金流好、行业地位稳固的龙头公司。这些公司可能不是最sexy的,但确实是最赚钱的。 第二个推手是监管层面的变化。2020年的退...

  alphonse   2025年06月16日   162   1   0 策略讨论新手入门经验分享Python

1.概述 这两天看到一个开源项目,[TradingAgents项目GitHub](https://github.com/TauricResearch/TradingAgents)还挺火的,下来来玩了玩,给大家分享下。 ![image.png](1) 这涨星的速度还是可以的。 2.安装 安装就看github上的readme页有介绍。 ![image.png](2) 先把各个库安装好,如果没有安装conda的,需要先安装下conda。 环境安装好之后,还需要设置KEY,一共有两个 ![im...

  AlphaSmith   2025年06月10日   230   0   0 学习资源经验分享

上一篇文章我们介绍了高频因子的动量反转类因子,这一篇继续介绍波动率因子,并在因子分析的基础上加入策略回测。 研究环境利用聚宽因子分析API,构建因子函数类;研究在日内高频分钟级数据中挖掘构建高频因子,对该因子进行有效性检验,并利用回测平台进行回测。 一波动率因子 1.1波动率因子构建 第二大类因子为波动率因子。波动率因子刻画了股票价格或股票收益在过去一段时间的不确定性程度,高波动率通常反映其不确定性程度较高,未来收益表现可能相对较弱。 ![pic1.png](1) 将传统的收益波动、振...

1.概述 行业中性化(IndustryNeutralization)旨在从因子中剔除行业所带来的系统性偏差,使因子能够更真实地反映个股的特质(idiosyncraticcharacteristics)。许多因子天然地与特定行业相关联,比如市盈率因子在金融行业普遍较低,而在科技行业可能较高。 行业中性化通常通过分行业去均值或引入行业哑变量回归等方式实现,处理后因子值在行业间趋于均衡,从而避免策略因行业偏好而产生非预期的暴露。经过行业中性化处理的因子,更具普适性和解释力,在多因子模型、因子排序及回...

  AlphaSmith   2025年06月07日   229   1   2 数据清洗新手入门经验分享Python

开篇:什么是量化投资? 想象你是一个经验丰富的菜市场买菜高手。每次买菜时,你都有自己的一套"规则": 西红柿要挑红润饱满的 价格比平时低20%时大量采购 避开周末人多的时候去买 量化投资就是把这套"买菜经验"用代码写出来,让电脑帮你在股市里"买菜"。 传统投资靠感觉和经验,量化投资靠的是数据+规则+纪律执行。就像用GPS导航代替问路一样,虽然偶尔会绕路,但长期看更靠谱。 为什么从双均线开始? 双均线策略是量化投资的"九九乘法表",简单但包含了完整的投资逻辑: 趋势判断:短期均线长期均线...

1.概述 在计算完因子数据之后,进行下一步的模型训练之前,通常需要对因子数据进行预处理,以及中性化处理。其中预处理比较简单,一般就是3倍MAD截断,zscore标准化,缺失值填充为0。中性化稍微复杂一些,本文将从市值中性化开始介绍如何进行市值中性化,下一篇将介绍如何进行行业中性化。 2.市值中性化 2.1市值中性化的必要性与逻辑 市值中性化是因子中性化处理中最常见且重要的一种,其核心目的是剔除因子值中由于市值(Size)因素引起的系统性影响,使得因子能够更纯粹地反映其自身的信息,从而提升因...

  AlphaSmith   2025年06月06日   271   2   2 数据清洗新手入门经验分享Python

引言 在Niederhoffer和Osborne的证券交易所的市场做市与价格反转(1996)一文中,作者通过观察并举例股票价格在连续交易的变动ΔYt-1,ΔYt试图寻找在时序上的运动规律,并且得出如股票价格的短期波动并非完全随机,而是由市场制造机制和投资者行为共同塑造等结论。其中,作者认为股票价格在高频数据中存在显著的负自相关特性,即前一期价格ΔYt-1上涨会增加本期ΔYt下跌的概率,反之亦然。作者将这种现象归因于交易所做市商制度和限价订单簿的非均匀分布等市场微观结构因素。另外一个相对更近期的例...

1.概述 平时大家搭建自己的因子库,肯定要会涉及到行情数据的下载,因子库的计算入库等工作,股票数据相对来说数量比较大,更新一次需要不少时间,本文将分享如何通过多线程的方式加快数据的下载,以此为例,也可以扩展到其他大数据任务的计算中。 本文使用Tushare作为数据源,下载A股市场所有股票的日线数据(open,high,low,close,vol),我们将分析串行跟并行两种方法在时间效率上的表现。 2.串行下载 串行下载是最直观的实现方式,按顺序逐个处理每只股票的数据下载请求。注册好tushar...

  AlphaSmith   2025年06月05日   148   2   1 数据存储新手入门经验分享Python

1.概述 笔者最近搭建了一套因子库,参考的是《20230522-招商证券-AI系列研究之一:端到端的动态Alpha模型》附录中的因子,但因子数量还是有限,于是决定引入一些常见的因子库,本文将分享如何用cursor来帮我们快速生成alpha101因子。 2.cursor安装与激活 从官网下载cursor,新注册的用户有免费的使用次数,如果次数用完,可以到某宝上去购买账户,也可以自己充值。 ![image.png](1) 安装好之后,就可以在右边打开对话框,进行对话式编程了,选择@可以指定代码...

以下是依据两篇研报因子的文字描述,通过deepseek/pandaai解读生成的Python代码实现,保留了AI生成过程和注释。意识到很多学员用户也正在做这个工作,为节约人力算力能源,在量变学院社群分享一下。 ![image.png](1) ![1748494420354.png](2) 这里是上篇《中金价量》的部分: 通过网盘分享的文件:alpha191中金量价_dspandaai(上).docx 链接:https://pan.baidu.com/s/1O9pvVkP_C_N54kbwAN...

  Cai   2025年05月29日   260   0   0 学习资源新手入门代码分享Python

上一篇文章中我们对高频因子的优势和类型做了简要介绍,从这篇文章开始,我们将对每一大类因子做介绍,并从中选取具体一例因子,实现从数据构建到测试评估的整个过程。 研究环境利用聚宽因子分析API,构建因子函数类;研究在日内高频分钟级数据中挖掘构建高频因子,并对该因子进行有效性检验。 一、动量反转因子 1.1动量反转因子 第一类因子为动量反转因子。动量反转因子通常由过去一段时间的特定类型的涨跌幅构造,其因子收益一方面可能来源于非理性投资者的行为偏差造成的错误定价,另一方面也可能来源于承担特定风险获得...

对于刚转向因子投资的交易者,选择站在前辈肩膀上复现已有的研报因子是不可回避的学习途径。 PandaAI集成了数据/回测/分析框架及代码AI助手一体,为因子学习探索提供了极大便利。 2022年中金《价量因子手册》对于量价覆盖全面,不少量价因子在报告期和以后的很长时间均表现良好。 ![image.png](1) 刚开始尝试的是动量&反转因子: ![image.png](2) 构建方式和计算公式如下: ![image.png](3) 步骤如下: Step1:进入[pandaai因子大赛官...

  Cai   2025年05月18日   263   0   0 活动与比赛新手入门因子大赛

1.概述 这篇文章我们将分享《中金公司-量化多因子系列(6):关于动量,你所希望了解的那些事》中关于动量因子的适用场景,研报中提到截面分域中,动量特征在高机构覆盖、大市值、低波动、高价值的股票池中更明显;而反转效果在低覆盖、小市值、高波动、低流动性、低价值的股票池内更为显著。本篇文章将使用PandaAI平台快速构建市值、波动性、流动性因子再叠加动量因子,验证研报中关于动量的结论。本文也算是线性多因子组合的入门教程,大家看完就明白一点都不难了。 2.市值因子 相信大家都听说过小市值策略,今天我们...

  AlphaSmith   2025年05月17日   267   2   2 学习资源新手入门代码分享

1.概述 接上一篇,为什么在A股动量因子会呈现出反转特征呢?直接说答案,就是因为散户太多了。 这篇文章我们将分享《中金公司-量化多因子系列(6):关于动量,你所希望了解的那些事》提到的四类投资者,我们试着从投资者结构的角度出发去揭示反转特征,同时也思考作为个人,应该选择成为哪一个象限的投资者。 2.A股投资者结构下的四类典型投资者画像 在理解动量为何在A股呈现出“反转特性”之前,我们需要从投资者结构出发,分析不同类型投资者的行为模式及其对市场价格形成机制的影响。 我们可以从两个维度对投资者...

  AlphaSmith   2025年05月16日   192   1   0 新手入门经验分享