做完了测试 今天做完测试,感觉Pandaai极大地方便了量化,降低了门槛,期待解锁更多功能。
接上一篇:Alphagen学习笔记(1.Qlib因子生成部分)。接下来尝试简化和重写qlib因子生成(更准确说应该是“因子计算”),即:1.替换成本地parquet文件行情数据2.再按表达式计算出因子值。 行情和因子值在各个模块中传递顺序为从左至右:data—loader—stock_data。  小白编程还是要多用deepseek。我刚开始采用胡乱试的办法,把以上各个模块扔进对话框,先帮我解释一下代码,然后阐明接下来工作目标是要把mongodb行情数据替换成本地c...
<fontcolor="brown"一、引言</font <fontcolor="red"强化学习已经开始“闯”量化!</font  在参加《量变学院》第五期线下课程后,我首次接触到AlphaGen这一基于强化学习的公式化Alpha因子挖掘框架。其核心思想是通过策略梯度方法(如PPO算法)自动生成具有协同作用的Alpha因子集合,从而提升量化投资策略的性能。为深入理解《GeneratingSynergisticFormulaicAlphaCollec...
1.1一些思考 世坤的alpha101给大家展示了因子如何变成表达式,那怎么快速生成表达式是一个问题 普通的量价因子和基本面因子效果一般,能不能通过遗传的方法让他们产生新的因子; 1.2遗传算法基础 1.背景概念 遗传规划是一种启发式的公式演化技术,通过模拟自然界中遗传进化的过程来逐渐生成契合特定目标的公式群体,适合进行特征工程。将遗传规划运用于选股因子挖掘时,可以充分利用计算机的强大算力,同时突破人类的思维局限,挖掘出某些隐藏的、难以通过人脑构建的因子。在量化多因子选股里,大家最关心的一...
PandaAI的第一周内侧体验 作为一个5年的主观交易员,在听到量化交易可以模块化进行研究回测,我是不太相信的。但是当我打开pandaAI的网页以后,颠覆了我对量化交易的认知。之后就加入pandaAI的群聊,也拿到了内侧名额。所以我来聊聊拿到了内侧名额后的第一周体验。 1.1操作体验 如你所见,内置了很多模块化的设计(如果你有编程基础,也可以自定义),也有很多机器学习的模型。之前我自学了一点机器学习和Python的入门课程,当然是偏向于理论的,但实践能力一直很差。虽然花费了大量时间练习,但也很...
一一级标题网站大部分内容非常直观 1.1二级标题导入策略 xxxx;一开始找不到入口,询问过老师之后对整个页面更加熟悉了 xxxx;跟着视频教学学习了如何导入、修改以及保存我的策略;并且运用PandaAI学习我对于策略不太熟悉的地方  1.2二级标题运行策略 1.xxxx;在超级图表中,学习了如何创建账号,在实盘中运行策略 2.xxxx;学习如何出入金;整个过程非常流畅,操作简单易懂  这次我让他修改了代码逻辑,从双均线改为10个bar的单均线策略,他也一次性改完,并可以成功运行。  ...
因子合成的实践和方法 使用GPlean训练出来的一些因子表达式存在很高的相关性,当卡掉相关性以后我们要做因子合成来提高信息的有效性,这次介绍一些常见的合成方法。 1.1因子相关性处理 这一步的核心在于我们如何发现刻画并解决因子间的多重共线性(风格集中暴露)的问题。并最终实现alpha之间相互对冲关系。 首先是识别共线性问题,可以使用VIF检验 VIF检验(方差膨胀因子检验) VIF(VarianceInflationFactor)是用于量化回归模型中自变量之间多重共线性严重程度的指标。它衡量了由...
一一级标题网站大部分内容非常直观 1.1二级标题导入策略 xxxx;一开始找不到入口,询问过老师之后对整个页面更加熟悉了 xxxx;跟着视频教学学习了如何导入、修改以及保存我的策略;并且运用PandaAI学习我对于策略不太熟悉的地方  1.2二级标题运行策略 1.xxxx;在超级图表中,学习了如何创建账号,在实盘中运行策略 2.xxxx;学习如何出入金;整个过程非常流畅,操作简单易懂  2.使用XGBoost模型进行回归训练,输出预测值:  3.对预测收益率进行排序...
背景 最近在小安老师建议下做端到端阿尔法模型的构建复现,踩了不少坑,也有一些收获。这篇文章是结合招商证券那篇《端到端的动态Alpha模型》研报的第一部分,以及我自己的实践经验整理出来的,顺便附了我画的图来梳理结构。 一、线性因子模型逐渐失效了? 研报里其实讲得很清楚,线性模型的问题并不只是过时这么简单,而是它在理论假设上就有点站不住脚。比如APT模型假设资产收益率和因子之间是线性关系,而且残差是独立同分布的、无异方差的。但现实中的金融市场,残差往往具有强烈的异方差性和截面相关性。 这也...
优秀的AI量化普及仿真软件平台1 1.1传统算法和机器学习的融合 由于博士期间做管理学和AI交叉融合的研究,然而AI让我非常惊喜经验,管理学却让我无比痛苦。因此毕业以后,不再从事管理学,而是决定寻找AI的其他研究方向。尝试过AI机器方向后发现这个方向还有中期来难以克服的困难导致其不能投入工厂工作,这意味着中短期内很难转化为生产力,此外也需要补充非常多机械自动化的基础知识,专业壁垒较大;后来同学推荐AI量化方向,这个方式与博士期间的研究基础相通的更多,并且学透以后能够尽快转化为生产力,因此自学已经三五个月了。这个方向的传统算法比较受限,如VARMA主要是基于线性拟合特性来进行时间序列预测,而...
1.1背景 这几天踩了不少数据的坑,趁热打铁总结一下,也希望能帮大家少走点弯路。数据清洗这块,很多人觉得是琐事,其实它对最终策略效果的影响非常大。模型的好坏,很多时候不是算法决定的,而是你喂进去的数据质量决定的。下面我举几个例子,大家就懂了: 1.数据不清洗,就像你要做个火爆肥肠结果菜都没洗,味道能对吗?哈哈哈。 2.第一次拿到因子数据,乍一看数值有点大,就想着直接log一下压缩,结果模型训练完发现还是在学风格因子,整段预测方向跑偏。 3.有些字段比如ROE、净利润增长率,值是0或者极端异常,模...
各类机器学习模型常见的应用场景 1.1机器学习在量化交易当中的底层逻辑 -量化交易的核心是通过数据,统计,找出市场的规律,从而预测市场走势, 常见的规律有线性规律与非线性规律, 而机器学习就像一个“数据翻译官”,能从海量金融数据中找出非线性规律 核心逻辑:用历史数据训练模型,让模型学会“识别”数据中的模式(如价格波动、因子相关性等),再用这些模式预测未来市场变化,辅助交易决策。 1.2二级标题 1.二、常见模型原理与应用场景 1.决策树(DecisionTree) 原理: 像“层层问答”的流程图,通过不断问问题(如“价格是否突破20日均线?”“成交量是否放大?”)将数据分成不同类别。 ...
引言 招商证券的这份研究报告代表了传统金融机构在人工智能应用领域的重要探索。作为AI系列研究的第二篇,该报告聚焦于多模型集成技术在量价Alpha策略中的应用,为量化投资提供了一套完整的技术解决方案。 通过深入研读,我发现这份报告最大的价值在于其模型选择的系统性思考和集成策略的实用性设计,为行业提供了宝贵的方法论参考。 --- 第一部分:为什么需要多模型集成? 1.1传统单一模型的根本局限 在量化投资领域,单一模型面临着无法克服的结构性缺陷: 预测精度的天花板效应 即使是最先进的单...
上篇[基于《AI系列研究之二:多模型集成量价Alpha策略》理论分析](https://www.pandaai.online/community/article/90) 本篇文章会对其中各部分进行代码研究 项目需求分析与技术架构设计 业务需求梳理 项目的核心目标是构建一个多模型股票预测系统,具体需求包括: 数据层面的要求: 股票池:全A股票市场,但需要剔除ST、ST股票、退市股票以及上市不满三个月的新股 数据源:使用数据库中的日线量价数据,包含高开低收价格、成交量以及市值信息 预测目标:T+1日至T+11日的复权日内VWAP价格收益率 数据预处理:采用3倍MAD截断、zscore标...
傅立叶变换的核心能力,与Twap与Vwap的案例结合 傅立叶变换的本质是“将时域信号分解为频域信号”——简单说,就是把“随时间变化的价格/成交量数据”(比如1分钟K线的价格序列),拆解成由不同频率(周期)、振幅(强度)、相位(时间偏移)组成的正弦波叠加。 其核心价值在于:把“难以直接量化的‘趋势/震荡/周期性’”,转化为“可精准计算的频率特征”。例如: 低频成分:对应长期趋势(如1小时级别的慢涨/慢跌); 中频成分:对应中期震荡(如15分钟级别的来回波动); 高频成分:对应短期噪音(如1分钟内的...