基于机器学习的因子挖掘功能介绍
  瑞泉 12天前 100 0

一 通过模版构建机器学习工作流

创建工作流时选择“因子大赛-非线性因子-xgboost示例”,构建自己的机器学习工作流,如下图:
image.png
运行成功后查看因子分析结果
image.png
从上图可以看出IC_mean=-0.0042是负相关,并且组2的年化收益率最高,

二 调试特征

2.1 在公式输入增加open,调整因子分析中的印在方向由0改成1

image.png
运行成功后查看因子分析结果,组5排在第一位,显示IC_mean=0.0205,Rank_IC=0.0285
image.png

2.2 从上图分析,是增加open特征改变了 IC_mean为正相关,把close去掉,看看效果如下图:

image.png
IC_mean=0.0108,下降了,发现还是open和close结合更合适

三 调试参数

调整xgboost参数,增加决策树数量从100到200,学习率0.01到0.005,IC_mean=0.0298,Rank_IC=0.0468,执行结果如下图:

image.png
总之,通过对特征改变和gboost参数修改,确实能够提高IC和Rank_IC等参数更接近合理范围。

最后一次编辑于 12天前 0

暂无评论