主动买卖,是为了衡量成交是受买方驱动还是卖方驱动。我们使用批量成交划分法来区分买方成交量和卖方成交量,方法如下: ![image.png](1) ![image.png](2) 关键创新:用t分布实现“连续映射”。传统方法(如逐笔对比挂单价)是离散判断(要么主动买,要么主动卖),而这里通过t()函数实现了连续划分:当价格变动为正且大时,t()输出接近1,主动买入金额接近总成交额;当价格变动为负且大时,t()输出接近0,主动买入金额接近0。 批量成交划分法以价格变动作为自变量,为了防止不同个股价...

  18958283423   2025年08月15日   876   0   3 学习资源

上一篇文章我们介绍了高频因子的高阶特征因子,这一篇继续介绍流动性因子、量价相关性因子,并在因子分析的基础上加入策略回测。 研究环境利用聚宽因子分析API,构建因子函数类;研究在日内高频分钟级数据中挖掘构建高频因子,对该因子进行有效性检验,并利用回测平台进行回测。 一流动性因子 1.1因子介绍 第四大类因子为流动性因子。流动性刻画股票交易所需要的时间和成本,一般来说,流动性较差的个股通常有更高的预期收益,这是对流动性风险的风险补偿。因此,流动性因子通常表现为流动性越低,未来收益越高的特征(也会...

  迪仔   2025年08月06日   2343   2   0 多因子模型学习资源Python经验分享

高频交易深度解析:从历史演进到技术实现的完整图景 继续跟着天山老妖的QuantFabric教程学习,这次的内容让我对高频交易有了更全面和深入的认识。如果说前面两篇文章是在讲"工具",那么这一篇就是在讲"战场"——高频交易这个充满传奇色彩又极具技术挑战的领域。 从17世纪罗斯柴尔德家族用信鸽传递消息进行跨国套利,到今天用纳秒级系统捕捉微观价差,高频交易的本质始终未变:在信息传递的速度差中寻找利润。但技术的进步让这个"速度差"从几天缩短到了几纳秒,竞争的激烈程度也达到了前所未有的高度。 什么是高频交易? 高频交易(HFT)本质上是一种程序化交易,目标是从极其短暂的市场变化中获取利润。这种"...

  alphonse   2025年07月30日   1254   1   1 学习资源经验分享高频交易

<fontcolor="brown"一、引言</font <fontcolor="red"TheFutureofCodingis‘TabTabTab’</font ![image.png](1) OpenAI创始成员AndrejKarpathy曾说过:"编码的未来是按Tab键自动补全"。 Cursor的出现推动开发者角色从“编写代码”转向“引导AI生成正确代码”。未来编程将高度依赖AI自动化补全能力,开发者只需通过反复按“Tab键”即可快速生成代码。目前,Cursor、GitHub...

  我是宽客   2025年07月28日   1681   4   4 学习资源Python经验分享代码分享

我们运用统计上的显著性来检验因子是否有效。但是简单地使用统计检验得到的因子有时并不一定是靠“实力”,还有很大一部分“运气”成分。我们把显著性水平设为α,如果我们检测100个因子,至少有1个因子显著的概率高达1−(1−5%)^100=99.4%!因此,单纯检验每一个因子存在缺陷,我们需要引入多重检验的方法,同时检验多个假设(hypothesis)。 一、多重检验(multipletesting) 1.1核心思想 多重检验的核心思想可分为两种。一种是为了控制家族错误率(Family-wiseEr...

  18958283423   2025年07月28日   384   0   0 学习资源

<fontcolor="brown"一、开篇</font <fontcolor="red"工作流解锁量化大众化,全民玩转量化时代已来!</font ![01pandaai.png](7) 上篇文章详细介绍了PandaAI线性模型工作流的完整流程,同时也阐述了策略回测分析与因子相关性分析的具体步骤。正如我们之前所强调的——任何任务都能拆解为清晰可控的工作流,因此我们将进一步把机器学习相关工作流应用到量化分析场景中。 在下面连接中可以看到关于PandaAI工作流的详细介绍和多因子模...

一一级标题 1.1二级标题 xxxx; xxxx;![xx.png](1) 1.2二级标题 1.xxxx; 2.xxxx; 3.![xx.png](1)

  稀饭   2025年07月25日   270   1   1 新手入门

上次我们通过天山老妖的教程了解了QuantFabric的系统架构设计,从理论层面认识了这套高频交易系统。今天继续跟着教程的第二部分,看看这个系统在实际运行时是什么样子的。 如果说上一篇是在看"设计图纸",那么这一篇就是在看"驾驶舱"——一个真正运行中的量化交易系统,交易员每天面对的操作界面,以及系统背后各个组件是如何协同工作的。 从理论到实践的跨越 理论再完美,最终还是要落地到实际使用中。天山老妖在这个演示中,展示了一个完整的QuantFabric测试环境,让我们能够直观地看到: 行情数...

  alphonse   2025年07月21日   805   1   0 学习资源经验分享C++高频交易

报告原文下载链接:https://pan.baidu.com/s/165I89OfDhxVeoCdtWDylDA提取码:cryy 高、低位放量是技术分析中经典的价量形态,通常被用于择时或事件驱动类型的研究,本篇报告尝试将其拓展到横截面选股领域,构建有效的选股因子。按常理来说,若股价触发“高位放量”形态,往往预示着主力资金开始出货,股票未来下跌的概率较大;反之若触发“低位放量”形态,则通常表明主力资金开始进场,股票未来有正向超额。 ![image.png](1) 在本篇研报中,标签有每日开盘价...

  18958283423   2025年07月13日   2775   1   0 量化策略

报告原文下载链接:https://pan.baidu.com/s/1jBGmWCS1l-SolG02kOF_Rw提取码:zu97 相对强弱指标RSI(RelativeStrengthIndex)是最常用的技术分析指标之一,常被用来评估多空力量的强弱程度,被广泛应用于各种金融产品的研究分析中,但是RSI通常被用于时序择时,较少被用来在横截面上进行选股。本篇研报则将RSI技术指标扩展到横截面选股领域,构建有效的选股因子。 在本篇研报中,标签有股票代码,每日开盘价、收盘价,成交量,分钟级涨跌幅,市...

  18958283423   2025年07月13日   1214   0   0 编程与工具

GitHub网址:https://github.com/PandaAI-Tech/panda_factor?tab=readme-ov-file 一、环境准备 1.Python3.9及以上 2.从GitHub上克隆项目到本地 gitclonehttps://github.com/your_org/panda_factor.git cdpanda_factor 二、MongoDB数据库安装 1.安装MongoDB8.x 数据库网盘链接:https://pan.baidu.com/s/1q...

  18958283423   2025年07月13日   1306   0   0 数据存储

上一篇文章我们介绍了高频因子的波动率类因子,这一篇继续介绍高阶特征因子,并在因子分析的基础上加入策略回测。 研究环境利用聚宽因子分析API,构建因子函数类;研究在日内高频分钟级数据中挖掘构建高频因子,对该因子进行有效性检验,并利用回测平台进行回测。 一高阶特征因子 1.1构建方法 第三大类因子为高阶特征因子。高阶特征利用股票高阶矩与其未来收益建立联系,刻画日内价格分布以及快速变化的特征,能够有效反映价格的除动量和波动率这样一阶和二阶特征外更高阶的特征。 ![pic1.png](1) 将分...

-----想定制魔改qlib因子计算和改用小型数据文件的,希望有帮助----- 今年深圳课上接触到的alphagen,最吸引人的部分是:仅通过表达式就可以快速生成相应因子可在表达式层面高效开展因子探索。意识到引入这个部分对我当前投研数据工作会是一个很大提升。初步了解这部分内容是使用qlib实现的而qlib使用的是MongoDB数据库。初步了解MongoDB后决定暂时放弃(目前只做股票日间交易,A股全市场daily数据1GB左右目前的parquet够用)。 细化一下研究工作域边界和内容:研究q...

<fontcolor="brown"一、开篇</font <fontcolor="orange"Lifeisshort,youneedPython!</font <fontcolor="red"人生苦短,我用Python!</font ![python之父.2.png](1) 文科生学习量化投资,确实存在诸多门槛。在前文提及的数理、代码、金融、交易这四个维度里,我觉得数理当属最为关键且难度最高的部分。毕竟里面有线性代数、统计、概率论、计量经济这些硬核内容,咱可以先Pass这部分。...

  我是宽客   2025年06月29日   1428   3   0 学习资源新手入门经验分享

<fontcolor="brown"一、背景</font <fontcolor="red"谁是西蒙斯?</font ![夜景001.jpg](2) 2019年,我天天对着堆成山的财务报表加班,眼睛都快看花了。Excel和财务软件上跳动的数字突然变得陌生——难道我的人生就要永远困在这些冰冷的账目里?难道我就这样替人做利润表一辈子,自己的财务人生却还是空白? 想起大学时炒股的“黑历史”,看了两本技术指标书后,啥也不懂就瞎买,最后被割得干干净净,成了妥妥的韭菜。但心里一直藏着个梦想:...

  我是宽客   2025年06月26日   2013   9   6 学习资源新手入门经验分享

最近在研究时间序列分析时,读到一篇关于相空间粗粒化的论文,让我对符号动力学产生了浓厚兴趣。作为量化交易者,我们总是在寻找市场转折点——从上涨转向下跌,从震荡转向趋势,从高波动转向低波动。传统的技术分析往往基于价格的绝对数值,但符号动力学提供了一个全新的视角:不要纠结于具体的价格,而是要关注状态的转换逻辑。 这个思路很有意思,让我想起做高频交易时的一个困惑:同样是上涨10个tick,在不同的市场状态下意义完全不同。如果我们能够准确识别和预测状态转换,是否就能在关键时刻抓住机会? 为什么要关注状...

报告原文下载链接:https://pan.baidu.com/s/1yShAqy_AY8aB8Vx4RvgvNg提取码:lvi0 和上次一样,我们先来分析标签、特征和因子分别是什么。在这篇研报中,标签有股票代码、每日开盘价、每日收盘价、交易者结构等未经加工的底层市场数据。特征有交易者结构(大小单)、交易占比(如小单交易占比=小单成交金额/总成交金额)、过去20日累计涨跌幅(Ret20)、过去240日累计涨跌幅(Ret240)、剔除最近40日的过去200日涨跌幅(Ret240_40)等从原始标签...

  18958283423   2025年06月24日   737   0   0 量化策略Python

报告原文下载链接:https://pan.baidu.com/s/1xPDtXF138Q6bGZ4CxoTd7g提取码:dy4o 在这篇研报中,标签为每日开盘价、每日收盘价、每日换手率、指数隔夜涨跌幅等未经加工的底层市场数据。特征为传统隔夜涨跌幅、隔夜涨跌幅绝对值、超额隔夜涨跌幅、超额换手率、滚动相关性等从原始标签中提取或计算出的尚未验证预测能力的中间变量。因子为传统隔夜因子、隔夜跳空因子、新因子MIF等对收益率有显著解释力的特征。 本篇研报的核心与上一篇研报相同,都是利用A股市场的非有效性...

一、标签 1.定义 标签是原始数据中直接观测到的底层属性,是分析的基础原材料。 2.核心特点 未经加工的自然记录(如数据库中的原始字段)。 可能包含无关变量,需筛选后才能用于建模。 3.示例 金融领域:股票每日收盘价、成交量、财务报表中的净利润。 其他领域:气温、犯罪率、冰淇淋销量。 二、特征 1.定义 特征是从标签中筛选或派生出的变量,与当前分析目标直接相关。 2.核心特点 是标签的子集或变换结果(如对数收益率、移动平均线)。 需经过业务逻辑过滤(如投资分析中排除“天气数据”)。 3.示...

  18958283423   2025年06月16日   679   1   3 学习资源新手入门经验分享

最近几年在做量化研究时,我有一个很深的感受:A股市场正在发生一些根本性的变化。以前那种靠题材炒作、概念驱动的投资方式越来越难赚钱了,反而是一些基本面扎实的公司开始受到资金青睐。 这种变化背后有两个很重要的推手。第一个是外资的持续流入。我记得2016年刚开始关注北上资金的时候,很多人还把它当作一个短期的资金流向指标来看。但现在回头看,外资买入的逻辑其实很清晰:ROE高、现金流好、行业地位稳固的龙头公司。这些公司可能不是最sexy的,但确实是最赚钱的。 第二个推手是监管层面的变化。2020年的退...

  alphonse   2025年06月16日   619   1   0 策略讨论新手入门Python经验分享