延续上次对市场"状态转换逻辑"的探讨,我们知道识别市场状态固然重要,但真正的挑战在于如何快速执行。最近在学习天山老妖的QuantFabric教程([edu.csdn.net/learn/37051/572467](https://edu.csdn.net/learn/37051/572467?spm=1002.2001.3001.4157)),对高频交易系统的架构有了更深入的理解。 作为量化交易者,我们都知道速度和精确性的重要性。今天分享一下从教程中学到的QuantFabric系统架构,看看它如何通过精妙的设计和优化,帮助交易者在毫秒甚至纳秒间执行交易。 高频交易的核心需求 在高频交易的...
报告原文下载链接:https://pan.baidu.com/s/165I89OfDhxVeoCdtWDylDA提取码:cryy 高、低位放量是技术分析中经典的价量形态,通常被用于择时或事件驱动类型的研究,本篇报告尝试将其拓展到横截面选股领域,构建有效的选股因子。按常理来说,若股价触发“高位放量”形态,往往预示着主力资金开始出货,股票未来下跌的概率较大;反之若触发“低位放量”形态,则通常表明主力资金开始进场,股票未来有正向超额。  在本篇研报中,标签有每日开盘价...
报告原文下载链接:https://pan.baidu.com/s/1jBGmWCS1l-SolG02kOF_Rw提取码:zu97 相对强弱指标RSI(RelativeStrengthIndex)是最常用的技术分析指标之一,常被用来评估多空力量的强弱程度,被广泛应用于各种金融产品的研究分析中,但是RSI通常被用于时序择时,较少被用来在横截面上进行选股。本篇研报则将RSI技术指标扩展到横截面选股领域,构建有效的选股因子。 在本篇研报中,标签有股票代码,每日开盘价、收盘价,成交量,分钟级涨跌幅,市...
GitHub网址:https://github.com/PandaAI-Tech/panda_factor?tab=readme-ov-file 一、环境准备 1.Python3.9及以上 2.从GitHub上克隆项目到本地 gitclonehttps://github.com/your_org/panda_factor.git cdpanda_factor 二、MongoDB数据库安装 1.安装MongoDB8.x 数据库网盘链接:https://pan.baidu.com/s/1q...
接上一篇:Alphagen学习笔记(1.Qlib因子生成部分)。接下来尝试简化和重写qlib因子生成(更准确说应该是“因子计算”),即:1.替换成本地parquet文件行情数据2.再按表达式计算出因子值。 行情和因子值在各个模块中传递顺序为从左至右:data—loader—stock_data。  小白编程还是要多用deepseek。我刚开始采用胡乱试的办法,把以上各个模块扔进对话框,先帮我解释一下代码,然后阐明接下来工作目标是要把mongodb行情数据替换成本地c...
一、引言 在A股量化投资中,构建完善的因子库对于策略研发和回测效率至关重要。传统基于CSV文件存储因子数据存在冗余、跨周期计算效率低和扩展性差等问题,而通过建立数据库式的因子库,可以显著提升数据管理和检索效率。本项目旨在基于AkShare和MongoDB构建一个A股的价格-成交量因子库,将常见的技术指标和量价指标按日保存,为选股和策略开发提供数据支持。借助开源工具,我们可以批量获取数据、自动清洗和计算因子,并方便地存入数据库,为后续的回测与分析打下基础。 二、技术架构与依赖工具 2.1该项目采用...
上一篇文章我们介绍了高频因子的波动率类因子,这一篇继续介绍高阶特征因子,并在因子分析的基础上加入策略回测。 研究环境利用聚宽因子分析API,构建因子函数类;研究在日内高频分钟级数据中挖掘构建高频因子,对该因子进行有效性检验,并利用回测平台进行回测。 一高阶特征因子 1.1构建方法 第三大类因子为高阶特征因子。高阶特征利用股票高阶矩与其未来收益建立联系,刻画日内价格分布以及快速变化的特征,能够有效反映价格的除动量和波动率这样一阶和二阶特征外更高阶的特征。  将分...
-----想定制魔改qlib因子计算和改用小型数据文件的,希望有帮助----- 今年深圳课上接触到的alphagen,最吸引人的部分是:仅通过表达式就可以快速生成相应因子可在表达式层面高效开展因子探索。意识到引入这个部分对我当前投研数据工作会是一个很大提升。初步了解这部分内容是使用qlib实现的而qlib使用的是MongoDB数据库。初步了解MongoDB后决定暂时放弃(目前只做股票日间交易,A股全市场daily数据1GB左右目前的parquet够用)。 细化一下研究工作域边界和内容:研究q...
<fontcolor="brown"一、开篇</font <fontcolor="orange"Lifeisshort,youneedPython!</font <fontcolor="red"人生苦短,我用Python!</font  文科生学习量化投资,确实存在诸多门槛。在前文提及的数理、代码、金融、交易这四个维度里,我觉得数理当属最为关键且难度最高的部分。毕竟里面有线性代数、统计、概率论、计量经济这些硬核内容,咱可以先Pass这部分。...
1.概述 前段时间搭好了一个多因子框架,从几十个因子里面挑出了5个表现比较好的因子,先进行了MLP的训练,但是因为因子数据太少,模型基本上没学习到什么东西,迭代一次,损失就不再下降了。于是决定采用随机森林模型来训练,这个系列将把自己学习模型过程中的经验分享出来,与大家一同交流。大家都知道,随机森林是由若干决策树组成的,所谓几十个臭皮匠,顶个诸葛亮。那么本文就先分享决策树模型,我们将从零开始实现完整的代码。 2.决策树 我们以下面这个例子为例,假如我们要租房,需要根据西区还是东区以及房间的数量来...
<fontcolor="brown"一、背景</font <fontcolor="red"谁是西蒙斯?</font  2019年,我天天对着堆成山的财务报表加班,眼睛都快看花了。Excel和财务软件上跳动的数字突然变得陌生——难道我的人生就要永远困在这些冰冷的账目里?难道我就这样替人做利润表一辈子,自己的财务人生却还是空白? 想起大学时炒股的“黑历史”,看了两本技术指标书后,啥也不懂就瞎买,最后被割得干干净净,成了妥妥的韭菜。但心里一直藏着个梦想:...
最近在研究时间序列分析时,读到一篇关于相空间粗粒化的论文,让我对符号动力学产生了浓厚兴趣。作为量化交易者,我们总是在寻找市场转折点——从上涨转向下跌,从震荡转向趋势,从高波动转向低波动。传统的技术分析往往基于价格的绝对数值,但符号动力学提供了一个全新的视角:不要纠结于具体的价格,而是要关注状态的转换逻辑。 这个思路很有意思,让我想起做高频交易时的一个困惑:同样是上涨10个tick,在不同的市场状态下意义完全不同。如果我们能够准确识别和预测状态转换,是否就能在关键时刻抓住机会? 为什么要关注状...
报告原文下载链接:https://pan.baidu.com/s/1yShAqy_AY8aB8Vx4RvgvNg提取码:lvi0 和上次一样,我们先来分析标签、特征和因子分别是什么。在这篇研报中,标签有股票代码、每日开盘价、每日收盘价、交易者结构等未经加工的底层市场数据。特征有交易者结构(大小单)、交易占比(如小单交易占比=小单成交金额/总成交金额)、过去20日累计涨跌幅(Ret20)、过去240日累计涨跌幅(Ret240)、剔除最近40日的过去200日涨跌幅(Ret240_40)等从原始标签...
概述 因为高频数据量非常大,若要进行多年度的回测需要大量的时间计算,所以我采用先计算因子值,计算完之后再执行回测,本篇主要分享可以优化的方向以及一些高频数据预处理的发现。 1.高频因子特点 相比低频因子IC半衰期更短 需要更高频的调仓(如日频),带来换手率的增加,但基金业绩表明,即使高频因子的换手率更高,但高频因子的信息收益在合适的控制下仍然高于高换手率的成本 Level2级的数据资讯更多但同时也有更大的噪声 本系列将依照高频数据低频...
引言:想通过一招擒龙大法就梦想长期盈利的人,我只能说,你想多了。 一、为什么私募不喜欢高夏普单策略? 1.高夏普意味着显著的优势 比如夏普比率=3或更高,这通常意味着策略非常赚钱又不怎么波动。 然而这种策略容易被别人发现,因为信号太明显、回测曲线太好看、某些因子一眼就能看出来,还没有等你赚钱就很快被别人反向收割了。 2.卷来卷去会快速失效 一旦市场上的人都用这个策略,阿尔法就被榨干,比如套利空间越来越小、滑点越来越大。 所以为了不愿“跟别人卷”——高级的量化私募不是不想赚这个钱,而是知道这个钱赚不长久。 二、他们为什么喜欢“夏普为1,相关性为0(理想状态下)”的多个策略...
探讨因子的本质与检验方法 1.1探究的原因 因子、标签、特征是什么关系,我们买的到底是什么? 因子到底是什么,研究因子如何区别民科还是具备科学的方法? 因子如此重要如何正确的科学检验?因子分布如何看等等 GPlean到底该学什么因子?最后产出什么因子? 论坛都有各种复现和生成因子,不仅有中金的因子手册还有阿尔法101等等,但是归根结底因子到底是什么,其检验和实战意义暂时还没人讨论,在此我讲下我的一些理解,希望大家纠错,共同进步。 1.2因子、标签、特征的关系 1.首先是按照我们做机器学...
<fontcolor="firebrick"一、背景</font <fontcolor="red"Alpha101的核心是通过特征工程优化因子,以此简化模型构建并提升训练效率与效果。</font  Alpha101因子体系如同量化投资领域的一座宝藏,其中101个因子构成了众多投资策略的"地基",始终备受关注。 此前的两篇文章已深入拆解这些因子的设计逻辑及其预测市场走势的底层原理,可参考以下链接获取深度解析: [<fontcolor="pu...
报告原文下载链接:https://pan.baidu.com/s/1xPDtXF138Q6bGZ4CxoTd7g提取码:dy4o 在这篇研报中,标签为每日开盘价、每日收盘价、每日换手率、指数隔夜涨跌幅等未经加工的底层市场数据。特征为传统隔夜涨跌幅、隔夜涨跌幅绝对值、超额隔夜涨跌幅、超额换手率、滚动相关性等从原始标签中提取或计算出的尚未验证预测能力的中间变量。因子为传统隔夜因子、隔夜跳空因子、新因子MIF等对收益率有显著解释力的特征。 本篇研报的核心与上一篇研报相同,都是利用A股市场的非有效性...
一、标签 1.定义 标签是原始数据中直接观测到的底层属性,是分析的基础原材料。 2.核心特点 未经加工的自然记录(如数据库中的原始字段)。 可能包含无关变量,需筛选后才能用于建模。 3.示例 金融领域:股票每日收盘价、成交量、财务报表中的净利润。 其他领域:气温、犯罪率、冰淇淋销量。 二、特征 1.定义 特征是从标签中筛选或派生出的变量,与当前分析目标直接相关。 2.核心特点 是标签的子集或变换结果(如对数收益率、移动平均线)。 需经过业务逻辑过滤(如投资分析中排除“天气数据”)。 3.示...
最近几年在做量化研究时,我有一个很深的感受:A股市场正在发生一些根本性的变化。以前那种靠题材炒作、概念驱动的投资方式越来越难赚钱了,反而是一些基本面扎实的公司开始受到资金青睐。 这种变化背后有两个很重要的推手。第一个是外资的持续流入。我记得2016年刚开始关注北上资金的时候,很多人还把它当作一个短期的资金流向指标来看。但现在回头看,外资买入的逻辑其实很清晰:ROE高、现金流好、行业地位稳固的龙头公司。这些公司可能不是最sexy的,但确实是最赚钱的。 第二个推手是监管层面的变化。2020年的退...
2025-04-07
2025-08-26
2025-07-24
2025-07-25
2025-10-11
2025-10-28
2025-09-15
2025-10-08
2025-10-12
2025-09-27