多因子实操总体结构
1.1 总体流程
- 数据获取;
- 构造因子;
- 数据处理;
- 单因子测试;
- 多因子集中测试;
- 共线性分析;
- 因子变换;
- 因子组合;
- 构建策略;
1.2 数据获取
- 数据说明:27×个中国市场指数(日期、收盘价、成交量等);
- 周期:20年以上的日频数据;
- 输入:原始行情数据 Excel;
- 输出:整理后的因子原始数据 Excel;
1.3 构造因子
- 因子来源:价量顺势、反转、波动率、估值、盈利、成长等;
- 计算工具:通过 Python / Jupyter 计算并写回 Excel;
- 示例:构造单个价格斜率因子(slope类),如 past_5_price_slope;
1.4 数据处理
- 去极值:均值 ±3×中位数绝对偏差(MAD)或 Winsorize 处理;
- 标准化:将因子值转为 z-score 标准正态分布;
- 中性化:行业中性、市值中性,取残差作为纯因子暴露;
1.5 单因子测试
- IC / Rank IC 分析:衡量因子与未来收益的相关性(均值、IR、t值);
- 多空测试:将标的按因子值等分N组(如10组),计算“最高组 - 最低组”收益;
- 输出指标:年化收益、夏普比率、最大回撤、胜率等;
1.6 共线性分析
- 目的:识别高度相关的因子,避免冗余信息;
- 方法:计算因子收益率相关性、截面因子相关性矩阵;
1.7 因子变换与组合
- 因子变换:一元回归加权、排序加权(Rank)、IC/IR加权;
- 多元回归:PCA主成分分析合成、多元回归残差因子;
- 因子组合:等权组合、IC加权组合、风险约束组合;
1.8 构建策略
- 资产池定义:选股或选指数(如A股全市场、行业子集);
- 调仓规则:设定调仓频率(如20日)与持仓方式(等权/市值加权);
- 效果评估:观察多空组合净值曲线、Calmar比率、收益回撤比;