摘要: 本报告为机器学习选股策略系列第三篇专题优化研究,系统比较了两代策略的设计演进与绩效差异。策略一(优化前)基于支持向量回归(SVR)结合RSRS择时信号,以沪深300为基准,持仓10只股票,2016-2026年回测年化收益22.20%,最大回撤43.22%,夏普比率0.838,累计收益601.97%。策略二(优化后)基于多因子线性回归评分体系,以中证500为基准,集中持仓1只股票,预训练五组回归系数覆盖质量、动量、技术与风险因子,回测年化收益大幅提升至49.39%,最大回撤压缩至20.5...

量化策略研究报告:基于XGBoost与Optuna优化的选股模型 一、策略基本信息 策略类型:机器学习多因子选股(截面回归/分类) 核心算法:XGBoost(ExtremeGradientBoosting) 优化工具:Optuna(自动超参数搜索) 目标变量(Label):`FUTURE_RETURNS(close,1)`(预测下一日的收益率) 回测区间:2025-01-01至2025-02-28(约2个月样本外测试) --- 二、策略构建逻辑(WorkflowAnalysis) 根据工...

  136****1300   2026年04月04日   419   0   0 机器学习

一内测完结撒花之智能体 1.1建立你的智能体——此处用官方模版 ![image.png](https://oss.pandaai.online/community/d2b19467a8974e218f9b34383c732286.png) 我们可以先按照如图所示搭建工作流,这个就是智能体的“单因子模版了”我把这个模板命名为单智能体模版; 简单描述其功能,就是用提示词描述一个智能体,用过扣子搭建agent的同学对这个步骤应该很熟悉,不会用提示词也没有关系,我会在文章末尾附提示词填空模板; 1....

  易斋   2026年04月03日   207   1   0 量化策略机器学习策略

一、基于现成的因子进行框架适配 之前有过现成的因子库,不过是基于Python代码,或者是一些公式描述。在自己的框架中回测有点慢,于是计划将原有的因子和策略重新迁移到PandaAI中。 将指令传入AI助手中 ![image.png](https://oss.pandaai.online/community/60d5edd036cd4330aca1e1608f68c42d.png) AI助手自动解析代码,准确的解析出我的的指令 二、因子结果展示 ![image.png](https://oss.pa...

  138****5665   2026年03月26日   289   0   0 Python中频交易

很久没写作业了,怕智姐伤心,开始了补作业的过程 1.1很开心简单因子的挖掘 聪明的AI说干就干; ![image.png](https://oss.pandaai.online/community/55a5cd3190414d6e9c9609029fb261ec.png) 干完啦; ![30084f6b9a80561451524d15153b61fd.png](https://oss.pandaai.online/community/49dd79c0afe349128ec650e9b191...

  LOJU   2026年03月24日   233   0   0 机器学习策略

PandaAI第五周内测|多因子机器学习挖掘:从公式到模型的完整工作流 做量化有个经典难题:你手里有五六个因子,每个单看都有点道理,但你不知道怎么把它们合在一起用。等权加总?太粗糙。人工设阈值做条件过滤?参数爆炸,根本调不完。 这周在PandaAI上跑通了一条完整的多因子机器学习工作流,从因子公式编写到XGBoost训练再到合成因子输出,三个节点串起来就能跑。下面把整个流程拆开聊聊,希望对刚上手的朋友有帮助。 整体流程:三个节点,一条链 工作流的结构很简单: 特征工程构建→XGBoos...

一完整的因子挖掘功能体验 1.1单因子工作流 首先通过AI助手,生成关于动量的基础因子分析框架。包含公式的输入,现行因子的构建,因子的分析和解析因子分析结果四个节点。使用公式或Python代码构建线性因子,计算指定日期内的所有股票的因子值,并对所有股票进行横截面排序。 其次是参数设置。调仓周期上限30组,分组数量影响每组股票数量,因子方向选择0或1会影响IC值和数据展示。 第三是因子方向判断,根据因子值的正负来选择因子的正向或者负向。也可通过在公式中增加负号来将因子进行反向操作。 第四是参赛节点的连接。这是很神奇的功能,我一直很好奇在很多平台中如何只接入个人的部分代码就可以进行比拼。这里也...

尝试公式因子,机器学习因子 写一个股票基础市值因子分析框架,用于参加因子大赛,在2025年. ![图片.png](1) 构建xgboost预测收益率,作为因子预测.可以添加多个公式因子作为因子输入,预测第二天的收益率,构建因子. ![图片.png](2) ![图片.png](3)

  浴缸   2026年03月22日   462   0   0 机器学习

一通过模版构建机器学习工作流 创建工作流时选择“因子大赛-非线性因子-xgboost示例”,构建自己的机器学习工作流,如下图: ![image.png](2) 运行成功后查看因子分析结果 ![image.png](3) 从上图可以看出IC_mean=-0.0042是负相关,并且组2的年化收益率最高, 二调试特征 2.1在公式输入增加open,调整因子分析中的印在方向由0改成1 ![image.png](1) 运行成功后查看因子分析结果,组5排在第一位,显示IC_mean=0.0205,Rank_...

  瑞泉   2026年03月22日   319   0   0 机器学习策略

一学习如何挖掘因子 1.1价值因子和动量因子 学习如何把各个因子之间的权重串联起来,并且完成回测 ![e678790bd6f863a9a12c3acd8684bf52.png](1)

  180****6419   2026年03月22日   149   0   0 Python

PS:事先说明,对于我来说在金融领域常把RGN当作LSTM等常用模型极简版使用,所以此篇不讨论每个具体模型细节 一来点震撼,仙之人兮列如麻,ML/DL如过江之鲫 ![image.png](2) 1.1陷入困境,什么困境 学生思维的困境:工具越学越多,亏损越来越大 很多学习者有一个致命的思维误区:把"知道"等同于"会做"。 我见过太多这样的场:学完均线金叉→兴奋实盘→连续止损→放弃学完,MACD背离→兴奋实盘→连续止损→放...... 但真正的问题在于:只是在堆砌工具,而不是构建系统。 不断...

  135****1703   2026年03月13日   224   0   0 机器学习策略

摘要 本报告对基于机器学习技术但实现路径迥异的两套小市值选股策略—---策略一(传统SVR市值偏离度模型,优化前)与策略二(贝叶斯岭回归多因子评分模型,优化后)进行了长达十年(2015年1月1日至2025年1月1日)的全面实证分析。研究结果显示,策略二以3240.62%的总收益率、43.45%的年化收益率及-28.50%的最大回撤,在收益与风险控制上全面超越策略一(总收益93.39%,年化7.02%)。绩效差距的根源在于方法论的根本性差异。 1.策略一依赖"市值偏离度预测"的单一维度套利逻辑,...

优秀的AI量化普及仿真软件平台1 1.1传统算法和机器学习的融合 由于博士期间做管理学和AI交叉融合的研究,然而AI让我非常惊喜经验,管理学却让我无比痛苦。因此毕业以后,不再从事管理学,而是决定寻找AI的其他研究方向。尝试过AI机器方向后发现这个方向还有中期来难以克服的困难导致其不能投入工厂工作,这意味着中短期内很难转化为生产力,此外也需要补充非常多机械自动化的基础知识,专业壁垒较大;后来同学推荐AI量化方向,这个方式与博士期间的研究基础相通的更多,并且学透以后能够尽快转化为生产力,因此自学已经三五个月了。这个方向的传统算法比较受限,如VARMA主要是基于线性拟合特性来进行时间序列预测,而...

因子合成的实践和方法 使用GPlean训练出来的一些因子表达式存在很高的相关性,当卡掉相关性以后我们要做因子合成来提高信息的有效性,这次介绍一些常见的合成方法。 1.1因子相关性处理 这一步的核心在于我们如何发现刻画并解决因子间的多重共线性(风格集中暴露)的问题。并最终实现alpha之间相互对冲关系。 首先是识别共线性问题,可以使用VIF检验 VIF检验(方差膨胀因子检验) VIF(VarianceInflationFactor)是用于量化回归模型中自变量之间多重共线性严重程度的指标。它衡量了由...

  ELVES   2025年09月15日   1379   0   1 机器学习

1.1一些思考 世坤的alpha101给大家展示了因子如何变成表达式,那怎么快速生成表达式是一个问题 普通的量价因子和基本面因子效果一般,能不能通过遗传的方法让他们产生新的因子; 1.2遗传算法基础 1.背景概念 遗传规划是一种启发式的公式演化技术,通过模拟自然界中遗传进化的过程来逐渐生成契合特定目标的公式群体,适合进行特征工程。将遗传规划运用于选股因子挖掘时,可以充分利用计算机的强大算力,同时突破人类的思维局限,挖掘出某些隐藏的、难以通过人脑构建的因子。在量化多因子选股里,大家最关心的一...

  ELVES   2025年09月09日   1384   0   1 机器学习

各类机器学习模型常见的应用场景 1.1机器学习在量化交易当中的底层逻辑 -量化交易的核心是通过数据,统计,找出市场的规律,从而预测市场走势, 常见的规律有线性规律与非线性规律, 而机器学习就像一个“数据翻译官”,能从海量金融数据中找出非线性规律 核心逻辑:用历史数据训练模型,让模型学会“识别”数据中的模式(如价格波动、因子相关性等),再用这些模式预测未来市场变化,辅助交易决策。 1.2二级标题 1.二、常见模型原理与应用场景 1.决策树(DecisionTree) 原理: 像“层层问答”的流程图,通过不断问问题(如“价格是否突破20日均线?”“成交量是否放大?”)将数据分成不同类别。 ...

因子积累的探索与踩坑 1.1探究的原因 因为XGB或者MLP等等吧,模型如果需要有好的效果,最核心的不是模型参数或复杂度,而是因子的非线性复杂度要高。核心还是因子。一般作为普通投资者来说,最简单的就是研报复现以及公共平台的因子获取,虽然已经没什么超额了,但也属于“没得选的选择”,所以先试试看吧。本次记录的就是研报复现和平台获取因子的过程。 1.2研报复现的过程 找了上个月最新的一篇研报,叫《20250602-东北证券-盈利偏度和估值偏度因子》,这篇研报主要讲的是:传统偏度研究多聚焦在收...

  ELVES   2025年08月01日   1102   0   1 数据存储数据API数据清洗量化策略

1.概述 前段时间搭好了一个多因子框架,从几十个因子里面挑出了5个表现比较好的因子,先进行了MLP的训练,但是因为因子数据太少,模型基本上没学习到什么东西,迭代一次,损失就不再下降了。于是决定采用随机森林模型来训练,这个系列将把自己学习模型过程中的经验分享出来,与大家一同交流。大家都知道,随机森林是由若干决策树组成的,所谓几十个臭皮匠,顶个诸葛亮。那么本文就先分享决策树模型,我们将从零开始实现完整的代码。 2.决策树 我们以下面这个例子为例,假如我们要租房,需要根据西区还是东区以及房间的数量来...

  AlphaSmith   2025年06月28日   841   2   1 经验分享新手入门Python学习资源

探讨因子的本质与检验方法 1.1探究的原因 因子、标签、特征是什么关系,我们买的到底是什么? 因子到底是什么,研究因子如何区别民科还是具备科学的方法? 因子如此重要如何正确的科学检验?因子分布如何看等等 GPlean到底该学什么因子?最后产出什么因子? 论坛都有各种复现和生成因子,不仅有中金的因子手册还有阿尔法101等等,但是归根结底因子到底是什么,其检验和实战意义暂时还没人讨论,在此我讲下我的一些理解,希望大家纠错,共同进步。 1.2因子、标签、特征的关系 1.首先是按照我们做机器学...

  ELVES   2025年06月20日   1159   2   0 因子大赛多因子模型

上篇[基于《AI系列研究之二:多模型集成量价Alpha策略》理论分析](https://www.pandaai.online/community/article/90) 本篇文章会对其中各部分进行代码研究 项目需求分析与技术架构设计 业务需求梳理 项目的核心目标是构建一个多模型股票预测系统,具体需求包括: 数据层面的要求: 股票池:全A股票市场,但需要剔除ST、ST股票、退市股票以及上市不满三个月的新股 数据源:使用数据库中的日线量价数据,包含高开低收价格、成交量以及市值信息 预测目标:T+1日至T+11日的复权日内VWAP价格收益率 数据预处理:采用3倍MAD截断、zscore标...

  Co   2025年06月03日   935   1   1 c#Python机器学习模型机器学习