Claudecode进行研报复现 1.环境安装 https://code.claude.com/docs/zh-CN/overview参考这个文档安装,Mac比较简单,使用 jsx curl-fsSLhttps://claude.ai/install.sh|bash ![image.png](1) 安装成功后允许Claude出现以上界面,然后是配置大模型的API接口,如果是windows用户在目录下创建setting.json文件: jsx { "env":{ "ANTHROP...

  ELVES   6天前   52   0   0 编程与工具

为什么要做日内策略 之前在大A做指数增强,主要是微盘指数增强。从长期看,这可能是大A里相对更稳的贝塔,但也难免受周期影响,可能出现持续数月甚至半年的风格中断,进而导致收入中断。结合各个群的讨论和看到的资料,我认为高频策略不仅大约3个月就能验证有效性,而且有望带来更持续的收入;同时,alpha也更多沉淀在高频数据中,参与者相对较少。最终决定在已有β基本盘的基础上,再做一套高频或日内策略。 选择什么标的 在大A只能T+1,但有个比较特殊的存在:30年期国债ETF,零手续费、零佣金,支持T0交易...

因子合成的实践和方法 使用GPlean训练出来的一些因子表达式存在很高的相关性,当卡掉相关性以后我们要做因子合成来提高信息的有效性,这次介绍一些常见的合成方法。 1.1因子相关性处理 这一步的核心在于我们如何发现刻画并解决因子间的多重共线性(风格集中暴露)的问题。并最终实现alpha之间相互对冲关系。 首先是识别共线性问题,可以使用VIF检验 VIF检验(方差膨胀因子检验) VIF(VarianceInflationFactor)是用于量化回归模型中自变量之间多重共线性严重程度的指标。它衡量了由...

  ELVES   2025年09月15日   952   0   1 机器学习

1.1一些思考 世坤的alpha101给大家展示了因子如何变成表达式,那怎么快速生成表达式是一个问题 普通的量价因子和基本面因子效果一般,能不能通过遗传的方法让他们产生新的因子; 1.2遗传算法基础 1.背景概念 遗传规划是一种启发式的公式演化技术,通过模拟自然界中遗传进化的过程来逐渐生成契合特定目标的公式群体,适合进行特征工程。将遗传规划运用于选股因子挖掘时,可以充分利用计算机的强大算力,同时突破人类的思维局限,挖掘出某些隐藏的、难以通过人脑构建的因子。在量化多因子选股里,大家最关心的一...

  ELVES   2025年09月09日   897   0   1 机器学习

因子积累的探索与踩坑 1.1探究的原因 因为XGB或者MLP等等吧,模型如果需要有好的效果,最核心的不是模型参数或复杂度,而是因子的非线性复杂度要高。核心还是因子。一般作为普通投资者来说,最简单的就是研报复现以及公共平台的因子获取,虽然已经没什么超额了,但也属于“没得选的选择”,所以先试试看吧。本次记录的就是研报复现和平台获取因子的过程。 1.2研报复现的过程 找了上个月最新的一篇研报,叫《20250602-东北证券-盈利偏度和估值偏度因子》,这篇研报主要讲的是:传统偏度研究多聚焦在收...

  ELVES   2025年08月01日   705   0   1 数据存储量化策略数据API数据清洗

探讨因子的本质与检验方法 1.1探究的原因 因子、标签、特征是什么关系,我们买的到底是什么? 因子到底是什么,研究因子如何区别民科还是具备科学的方法? 因子如此重要如何正确的科学检验?因子分布如何看等等 GPlean到底该学什么因子?最后产出什么因子? 论坛都有各种复现和生成因子,不仅有中金的因子手册还有阿尔法101等等,但是归根结底因子到底是什么,其检验和实战意义暂时还没人讨论,在此我讲下我的一些理解,希望大家纠错,共同进步。 1.2因子、标签、特征的关系 1.首先是按照我们做机器学...

  ELVES   2025年06月20日   833   2   0 因子大赛多因子模型

1.1背景 这几天踩了不少数据的坑,趁热打铁总结一下,也希望能帮大家少走点弯路。数据清洗这块,很多人觉得是琐事,其实它对最终策略效果的影响非常大。模型的好坏,很多时候不是算法决定的,而是你喂进去的数据质量决定的。下面我举几个例子,大家就懂了: 1.数据不清洗,就像你要做个火爆肥肠结果菜都没洗,味道能对吗?哈哈哈。 2.第一次拿到因子数据,乍一看数值有点大,就想着直接log一下压缩,结果模型训练完发现还是在学风格因子,整段预测方向跑偏。 3.有些字段比如ROE、净利润增长率,值是0或者极端异常,模...

背景 最近在小安老师建议下做端到端阿尔法模型的构建复现,踩了不少坑,也有一些收获。这篇文章是结合招商证券那篇《端到端的动态Alpha模型》研报的第一部分,以及我自己的实践经验整理出来的,顺便附了我画的图来梳理结构。 一、线性因子模型逐渐失效了? 研报里其实讲得很清楚,线性模型的问题并不只是过时这么简单,而是它在理论假设上就有点站不住脚。比如APT模型假设资产收益率和因子之间是线性关系,而且残差是独立同分布的、无异方差的。但现实中的金融市场,残差往往具有强烈的异方差性和截面相关性。 这也...