1.概述 前段时间搭好了一个多因子框架,从几十个因子里面挑出了5个表现比较好的因子,先进行了MLP的训练,但是因为因子数据太少,模型基本上没学习到什么东西,迭代一次,损失就不再下降了。于是决定采用随机森林模型来训练,这个系列将把自己学习模型过程中的经验分享出来,与大家一同交流。大家都知道,随机森林是由若干决策树组成的,所谓几十个臭皮匠,顶个诸葛亮。那么本文就先分享决策树模型,我们将从零开始实现完整的代码。 2.决策树 我们以下面这个例子为例,假如我们要租房,需要根据西区还是东区以及房间的数量来...

1.概述 这两天看到一个开源项目,[TradingAgents项目GitHub](https://github.com/TauricResearch/TradingAgents)还挺火的,下来来玩了玩,给大家分享下。 ![image.png](1) 这涨星的速度还是可以的。 2.安装 安装就看github上的readme页有介绍。 ![image.png](2) 先把各个库安装好,如果没有安装conda的,需要先安装下conda。 环境安装好之后,还需要设置KEY,一共有两个 ![im...

  AlphaSmith   2025年06月10日   133   0   0 学习资源经验分享

1.概述 行业中性化(IndustryNeutralization)旨在从因子中剔除行业所带来的系统性偏差,使因子能够更真实地反映个股的特质(idiosyncraticcharacteristics)。许多因子天然地与特定行业相关联,比如市盈率因子在金融行业普遍较低,而在科技行业可能较高。 行业中性化通常通过分行业去均值或引入行业哑变量回归等方式实现,处理后因子值在行业间趋于均衡,从而避免策略因行业偏好而产生非预期的暴露。经过行业中性化处理的因子,更具普适性和解释力,在多因子模型、因子排序及回...

  AlphaSmith   2025年06月07日   118   1   2 新手入门数据清洗Python经验分享

1.概述 在计算完因子数据之后,进行下一步的模型训练之前,通常需要对因子数据进行预处理,以及中性化处理。其中预处理比较简单,一般就是3倍MAD截断,zscore标准化,缺失值填充为0。中性化稍微复杂一些,本文将从市值中性化开始介绍如何进行市值中性化,下一篇将介绍如何进行行业中性化。 2.市值中性化 2.1市值中性化的必要性与逻辑 市值中性化是因子中性化处理中最常见且重要的一种,其核心目的是剔除因子值中由于市值(Size)因素引起的系统性影响,使得因子能够更纯粹地反映其自身的信息,从而提升因...

  AlphaSmith   2025年06月06日   147   2   2 新手入门数据清洗Python经验分享

1.概述 平时大家搭建自己的因子库,肯定要会涉及到行情数据的下载,因子库的计算入库等工作,股票数据相对来说数量比较大,更新一次需要不少时间,本文将分享如何通过多线程的方式加快数据的下载,以此为例,也可以扩展到其他大数据任务的计算中。 本文使用Tushare作为数据源,下载A股市场所有股票的日线数据(open,high,low,close,vol),我们将分析串行跟并行两种方法在时间效率上的表现。 2.串行下载 串行下载是最直观的实现方式,按顺序逐个处理每只股票的数据下载请求。注册好tushar...

  AlphaSmith   2025年06月05日   79   2   1 新手入门Python经验分享数据存储

1.概述 笔者最近搭建了一套因子库,参考的是《20230522-招商证券-AI系列研究之一:端到端的动态Alpha模型》附录中的因子,但因子数量还是有限,于是决定引入一些常见的因子库,本文将分享如何用cursor来帮我们快速生成alpha101因子。 2.cursor安装与激活 从官网下载cursor,新注册的用户有免费的使用次数,如果次数用完,可以到某宝上去购买账户,也可以自己充值。 ![image.png](1) 安装好之后,就可以在右边打开对话框,进行对话式编程了,选择@可以指定代码...

1.概述 这篇文章我们将分享《中金公司-量化多因子系列(6):关于动量,你所希望了解的那些事》中关于动量因子的适用场景,研报中提到截面分域中,动量特征在高机构覆盖、大市值、低波动、高价值的股票池中更明显;而反转效果在低覆盖、小市值、高波动、低流动性、低价值的股票池内更为显著。本篇文章将使用PandaAI平台快速构建市值、波动性、流动性因子再叠加动量因子,验证研报中关于动量的结论。本文也算是线性多因子组合的入门教程,大家看完就明白一点都不难了。 2.市值因子 相信大家都听说过小市值策略,今天我们...

  AlphaSmith   2025年05月17日   178   2   2 新手入门学习资源代码分享

1.概述 接上一篇,为什么在A股动量因子会呈现出反转特征呢?直接说答案,就是因为散户太多了。 这篇文章我们将分享《中金公司-量化多因子系列(6):关于动量,你所希望了解的那些事》提到的四类投资者,我们试着从投资者结构的角度出发去揭示反转特征,同时也思考作为个人,应该选择成为哪一个象限的投资者。 2.A股投资者结构下的四类典型投资者画像 在理解动量为何在A股呈现出“反转特性”之前,我们需要从投资者结构出发,分析不同类型投资者的行为模式及其对市场价格形成机制的影响。 我们可以从两个维度对投资者...

  AlphaSmith   2025年05月16日   144   1   0 新手入门经验分享

1.概述 在过去,想要复现一篇多因子研究的研报往往是一项艰巨的任务。市面上缺乏成熟、统一的多因子研究平台,研究者不得不从零开始:自行下载数据、进行复杂的数据清洗、构建因子库,搭建因子评价体系,整个过程既耗时又容易出错。对于那些没有编程基础、但对量化投资充满兴趣的人来说,这几乎成为一道无法跨越的门槛。许多想入门的人因此望而却步,迟迟无法真正踏入量化研究的大门。 而如今,PandaAI的出现极大地降低了量化的门槛。它为因子研究提供了一个高效、统一、易用的平台,只需掌握一套简单的函数体系,就可以快...

  AlphaSmith   2025年05月16日   306   1   0 新手入门经验分享