一 因子分析工作流介绍
1.1 因子构建
- 可以通过Python代码或者公式两种方式来编写因子计算方式;
- Python构建中可以把想法交给AI,然后微调;
- 建议参照官方基础因子编写,否则有概率AI会瞎搞生成的东西不符合平台背后的规范而报错;
- 官方基础因子路径:
https://www.pandaai.online/community/article/176
- 因子构建环节包括Python因子+线性因子构建这两个节点
1.2 因子组合
- 我选了多因子合并的这个节点,这个组合的方式应该是因子值标准化后等权结合。
- 因子集合器是用来输出到因子相关性分析去看相关性的,因子组合中,因子之间低相关是比较好的,否则失去组合因子的意义;
1.3 因子分析
- 这个就是把因子值去在你选择的选股域里面去做分组回测;
- 我的这两个因子组合起来不知道为啥选到很多st股,笑哭;
- 注意因子值的方向,这是容易忽视的地方;
- 这个环节需要连接到因子分析结果来可视化查看,否则不会输出什么东西的;
1.4 因子相关性分析
- 包含了你的因子之间的相关性和你的因子与Barra风格因子之间的相关性;
- 我的这两个因子之间相关性还是比较低的,做组合就会产生1+1>2的效果;
- 不过奇怪的是我的一个因子是size,居然和Barra的size相关性不高,不知道pandaai底层的Barra因子是如何计算的。
二 一些体会
人工挖因子真的好难啊,考验你的主观交易经验、研报阅读消化能力等等。
不过随着AI能力的加强,已经有同业搞agent集群来挖因子了。
事实上古法机器学习挖因子,一直被诟病可解释性差,失效快;而新型的AI自动化挖因子可以批量把各种研报全部构建知识库让ai去复现、挖掘,相当于用AI群来替代传统人工因子工厂中的实习生和初级因子研究员的工作,大幅提升因子挖掘效率并保持了人工因子的可解释性和PM可控性。可以预见的是行业会越来越卷、因子失效会越来越快。
如果pandaai能出个一键复现研报的功能就好了。我们只需要把研报丢进去,然后把握因子回测分析的关键节点和环节是准确的,就可以初步信任AI自动化回测的结果。然后选取因子评价指标把有价值进一步分析的因子筛选出来,人工重点看整个因子构建和回测的逻辑,没问题直接入库。接下来因子组合的方式也是同理。这样每个人都可以构建一套AI助手集群,一个人就是一家量化公司。