因子挖掘能力已经常规化了,工具可以提高效率,和思路上的启发,但长期量化中使用多因子实战下来的经验其实更重要,比如在牛市,振荡市,熊市,因子有效性会有较大的差异,所以我觉得这是一个更大的工程,非一个工作流能完成的,需要构建一个自己的因子库体系,以及因子切换逻辑,评估体系,什么时候该用什么样的因子,因子如何组合。
这个问题应该更多从工程角度上去做这件事情更合适,更灵活。
https://github.com/PandaAI-Tech/panda_factor
所以我的思路是研究panda-factor开源工程,借助当前claudecode,cudebuddy 工具调用大模型的能力,去搭建因子库体系,和学习因子有效性,数据处理这一套流程,能更好的在复杂竞争中取得优势。
目前在初步探索阶段:比如我想丰富panda-factor开源工程中的基本面因子,来生产出大量的基本面因子,并对这些因子打分,排序,给予不同的权重去做回测
大模型在理解了panda-factor工程代码后,新建了panda_fundamental模块,因为我担心大模型改坏原工程所以,让他根据规范把心的逻辑都封装到新模块中,目前大模型已经完成了代码,和部分基本面因子
目前整体功能孩子啊开发测试中,目前已经成功导入了akshare的财务数据做测试