新手入门
新手入门标签描述

一、引言: 在进行回测系统的搭建中,了解指标评估因子的质量的意义是重要的,现在写出一篇帖子用于评估策略。 本文采用的策略指标复现源自PandaAi开源项目截取。 量化策略的回测评估依赖多项绩效指标。通过分析年化收益率、超额收益率、最大回撤、波动率、夏普比率和信息比率等指标,可以全面了解策略的收益能力与风险特征。例如,夏普比率是一种衡量单位风险所获超额收益的指标,而超额收益表示相对于选定基准的附加回报。 此外,因子质量指标(如信息系数IC、IC信息比率ICIR、秩相关系数等)可用于评估单个因子的预...

开篇:什么是量化投资? 想象你是一个经验丰富的菜市场买菜高手。每次买菜时,你都有自己的一套"规则": 西红柿要挑红润饱满的 价格比平时低20%时大量采购 避开周末人多的时候去买 量化投资就是把这套"买菜经验"用代码写出来,让电脑帮你在股市里"买菜"。 传统投资靠感觉和经验,量化投资靠的是数据+规则+纪律执行。就像用GPS导航代替问路一样,虽然偶尔会绕路,但长期看更靠谱。 为什么从双均线开始? 双均线策略是量化投资的"九九乘法表",简单但包含了完整的投资逻辑: 趋势判断:短期均线长期均线...

1.概述 行业中性化(IndustryNeutralization)旨在从因子中剔除行业所带来的系统性偏差,使因子能够更真实地反映个股的特质(idiosyncraticcharacteristics)。许多因子天然地与特定行业相关联,比如市盈率因子在金融行业普遍较低,而在科技行业可能较高。 行业中性化通常通过分行业去均值或引入行业哑变量回归等方式实现,处理后因子值在行业间趋于均衡,从而避免策略因行业偏好而产生非预期的暴露。经过行业中性化处理的因子,更具普适性和解释力,在多因子模型、因子排序及回...

  AlphaSmith   2025年06月07日   289   1   2 新手入门数据清洗Python经验分享

报告原文下载链接:https://pan.baidu.com/s/1ab9uNgS2Ydhimlu1jf5raA提取码:hgei 本篇研报以趋势资金为切入点:通过日内分钟级别的成交量来识别趋势资金,再通过对应的价、量数据推测其交易行为,构建有效的选股因子。该因子主要利用了市场的无效性,根据A股市场散户占比高,定价效率较低的特征,得出主力资金行为更容易产生超额收益机会这一结论,并将将主观交易经验(如“跟庄策略”)转化为可量化的指标。 由于获取数据上的限制,我在复现研报时只采用了2024-03-...

<fontcolor="firebrick"一、背景</font Alpha101 <br Weemphasizethatthe101alphaswepresentherearenot‘toy’alphasbutreal-lifetradingalphasusedinproduction. <fontcolor="red"101个阿尔法因子并非用于理论研究的“玩具”因子,而是在实际交易中使用的真实因子。</font ![alpha511012.JPG](1) 此前,在《Alp...

<fontcolor="brown"一、开篇</font <fontcolor="red"一切任务都可以抽象成一个工作流!</font ![01PandaAIlogo.png](1) 要踏入量化投资的复杂领域,本需艰难拼凑编程、交易实操、高阶数学、AI算法、金融市场等知识拼图。但掌握已专业定制的“工作流”这一核心绝技,就能直接复用专业投资者的经验路径——像搭积木般调用现成流程,把复杂任务拆解成清晰步骤,让新手也能快速对齐专业视角,少踩坑、少绕路,高效逼近量化投资的核心能力。 在20...

最近几年在做量化研究时,我有一个很深的感受:A股市场正在发生一些根本性的变化。以前那种靠题材炒作、概念驱动的投资方式越来越难赚钱了,反而是一些基本面扎实的公司开始受到资金青睐。 这种变化背后有两个很重要的推手。第一个是外资的持续流入。我记得2016年刚开始关注北上资金的时候,很多人还把它当作一个短期的资金流向指标来看。但现在回头看,外资买入的逻辑其实很清晰:ROE高、现金流好、行业地位稳固的龙头公司。这些公司可能不是最sexy的,但确实是最赚钱的。 第二个推手是监管层面的变化。2020年的退...

  alphonse   2025年06月16日   191   1   0 新手入门策略讨论Python经验分享

一、标签 1.定义 标签是原始数据中直接观测到的底层属性,是分析的基础原材料。 2.核心特点 未经加工的自然记录(如数据库中的原始字段)。 可能包含无关变量,需筛选后才能用于建模。 3.示例 金融领域:股票每日收盘价、成交量、财务报表中的净利润。 其他领域:气温、犯罪率、冰淇淋销量。 二、特征 1.定义 特征是从标签中筛选或派生出的变量,与当前分析目标直接相关。 2.核心特点 是标签的子集或变换结果(如对数收益率、移动平均线)。 需经过业务逻辑过滤(如投资分析中排除“天气数据”)。 3.示...

  18958283423   2025年06月16日   160   1   3 新手入门学习资源经验分享

报告原文下载链接:https://pan.baidu.com/s/1xPDtXF138Q6bGZ4CxoTd7g提取码:dy4o 在这篇研报中,标签为每日开盘价、每日收盘价、每日换手率、指数隔夜涨跌幅等未经加工的底层市场数据。特征为传统隔夜涨跌幅、隔夜涨跌幅绝对值、超额隔夜涨跌幅、超额换手率、滚动相关性等从原始标签中提取或计算出的尚未验证预测能力的中间变量。因子为传统隔夜因子、隔夜跳空因子、新因子MIF等对收益率有显著解释力的特征。 本篇研报的核心与上一篇研报相同,都是利用A股市场的非有效性...

概述 最近由于Tushare服务故障,导致无法获取到行情数据,捉急之下,笔者想起miniqmt也是可以获取数据的,而且还能拿到一年的分钟频率数据,刚好最近也想着复现下高频数据的研报。那么,下面笔者就简单介绍下miniqmt如何获取数据。 1.开通账户 在使用miniqmt之前,需要找券商开通相关的服务,各位可以联系pandaai官方小助手,他们有开通的渠道,一般审核验证大概2-3个工作日就差不多了。开通成功之后,对接人员也会给相应的教程,指导如何使用,大家开通之后,直接参考教程即可。 2.数...

概述 因为高频数据量非常大,若要进行多年度的回测需要大量的时间计算,所以我采用先计算因子值,计算完之后再执行回测,本篇主要分享可以优化的方向以及一些高频数据预处理的发现。 1.高频因子特点 相比低频因子IC半衰期更短![螢幕擷取畫面20250622150117.png](1) 需要更高频的调仓(如日频),带来换手率的增加,但基金业绩表明,即使高频因子的换手率更高,但高频因子的信息收益在合适的控制下仍然高于高换手率的成本 Level2级的数据资讯更多但同时也有更大的噪声 本系列将依照高频数据低频...

<fontcolor="brown"一、背景</font <fontcolor="red"谁是西蒙斯?</font ![夜景001.jpg](2) 2019年,我天天对着堆成山的财务报表加班,眼睛都快看花了。Excel和财务软件上跳动的数字突然变得陌生——难道我的人生就要永远困在这些冰冷的账目里?难道我就这样替人做利润表一辈子,自己的财务人生却还是空白? 想起大学时炒股的“黑历史”,看了两本技术指标书后,啥也不懂就瞎买,最后被割得干干净净,成了妥妥的韭菜。但心里一直藏着个梦想:...

  我是宽客   2025年06月26日   709   8   3 新手入门学习资源经验分享

1.概述 前段时间搭好了一个多因子框架,从几十个因子里面挑出了5个表现比较好的因子,先进行了MLP的训练,但是因为因子数据太少,模型基本上没学习到什么东西,迭代一次,损失就不再下降了。于是决定采用随机森林模型来训练,这个系列将把自己学习模型过程中的经验分享出来,与大家一同交流。大家都知道,随机森林是由若干决策树组成的,所谓几十个臭皮匠,顶个诸葛亮。那么本文就先分享决策树模型,我们将从零开始实现完整的代码。 2.决策树 我们以下面这个例子为例,假如我们要租房,需要根据西区还是东区以及房间的数量来...

  AlphaSmith   2025年06月28日   236   2   1 新手入门学习资源Python经验分享

继续跟着天山老妖的QuantFabric教程深入学习,这次聚焦于开发环境搭建的核心组件——Qt和CMake的安装配置。如果说前面的基础环境搭建是地基,那么Qt和CMake就是框架的主体结构。没有稳固的开发工具链,再好的策略想法也无法落地实现。 这次的学习让我深刻体会到,量化交易系统开发不仅需要扎实的金融知识和编程技能,更需要对开发工具有深入的理解。特别是在Linux环境下配置图形化开发环境,每一个细节都可能影响后续的开发效率。从版本选择到环境变量配置,从账户验证到套件检测,看似简单的安装过程实际上蕴含着丰富的技术细节。 Qt安装:图形化开发的基石 版本选择的策略考量 在Qt的版本选择上...

<fontcolor="brown"一、开篇</font <fontcolor="orange"Lifeisshort,youneedPython!</font <fontcolor="red"人生苦短,我用Python!</font ![python之父.2.png](1) 文科生学习量化投资,确实存在诸多门槛。在前文提及的数理、代码、金融、交易这四个维度里,我觉得数理当属最为关键且难度最高的部分。毕竟里面有线性代数、统计、概率论、计量经济这些硬核内容,咱可以先Pass这部分。...

  我是宽客   2025年06月29日   678   3   0 新手入门学习资源经验分享

-----想定制魔改qlib因子计算和改用小型数据文件的,希望有帮助----- 今年深圳课上接触到的alphagen,最吸引人的部分是:仅通过表达式就可以快速生成相应因子可在表达式层面高效开展因子探索。意识到引入这个部分对我当前投研数据工作会是一个很大提升。初步了解这部分内容是使用qlib实现的而qlib使用的是MongoDB数据库。初步了解MongoDB后决定暂时放弃(目前只做股票日间交易,A股全市场daily数据1GB左右目前的parquet够用)。 细化一下研究工作域边界和内容:研究q...

一一级标题 1.1二级标题 xxxx; xxxx;![xx.png](1) 1.2二级标题 1.xxxx; 2.xxxx; 3.![xx.png](1)

  稀饭   2025年07月25日   58   0   0 新手入门

一、引言 在A股量化投资中,构建完善的因子库对于策略研发和回测效率至关重要。传统基于CSV文件存储因子数据存在冗余、跨周期计算效率低和扩展性差等问题,而通过建立数据库式的因子库,可以显著提升数据管理和检索效率。本项目旨在基于AkShare和MongoDB构建一个A股的价格-成交量因子库,将常见的技术指标和量价指标按日保存,为选股和策略开发提供数据支持。借助开源工具,我们可以批量获取数据、自动清洗和计算因子,并方便地存入数据库,为后续的回测与分析打下基础。 二、技术架构与依赖工具 2.1该项目采用...

继续深入天山老妖的QuantFabric教程学习之旅,这次的内容涵盖了两个关键主题:Git子模块的管理实践和C单例模式的设计实现。看似技术细节各异,但实际上都体现了系统工程中的核心思想——模块化管理和资源统一控制。 在量化交易系统开发中,代码组织和架构设计的重要性不言而喻。Git子模块解决了多团队协作中的代码复用问题,而单例模式则确保了系统关键组件的唯一性和一致性。工程实践中的每一个设计决策,都直接影响着系统的可维护性和稳定性。 这次学习让我深刻认识到,量化交易系统的复杂性不仅体现在算法策略上,更体现在工程架构的精细化管理。从版本控制到设计模式,从编译构建到资源管理,每一个环节都需要深入的...

<fontcolor="brown"一、开篇</font <fontcolor="red"工作流解锁量化大众化,全民玩转量化时代已来!</font ![01pandaai.png](7) 上篇文章详细介绍了PandaAI线性模型工作流的完整流程,同时也阐述了策略回测分析与因子相关性分析的具体步骤。正如我们之前所强调的——任何任务都能拆解为清晰可控的工作流,因此我们将进一步把机器学习相关工作流应用到量化分析场景中。 在下面连接中可以看到关于PandaAI工作流的详细介绍和多因子模...