一 引言
本文基于下述研究框架撰写:
基于机器学习的多因子选股策略
1.1 研究背景
当前市场处于经济弱复苏、流动性宽松与高波动并存的复杂环境之下。投资者对收益的需求与对风险的规避形成张力,使得策略分化格局愈加明显。在这样的市场背景下,小市值股票凭借其高弹性在反弹行情中具备出色的表现潜力,而红利低波股票则依靠其高分红特性和低波动性,在市场震荡或下行阶段提供一定程度的风险对冲。两者策略存在风格互补的可能。
本文尝试从风险-收益特征的角度出发,研究小市值与红利低波策略的结构特性,并探讨在不同市场风格下两者的组合是否能形成更稳健的收益曲线。
1.2 研究内容
分析小市值因子的表现及有效性特征,包括何时有效、为何有效、失效逻辑及最大回撤期间的表现原因;
分析红利低波因子的收益来源、胜率、回撤控制能力,以及其作为防御性策略的稳定性与限制;
通过将二者构建为互补策略组合,研究其在不同市场风格切换下的稳定性与超额表现。
1.3 研究思路
本文基于手动编写的参数遍历算法,对中证全指成分股进行系统性选股与回测分析。本研究不依赖机器学习模型,回测时间区间设定为2020年4月22日至2025年3月21日。
研究流程如下:
分别对“小市值”与“红利低波”策略进行收益、回撤、胜率、盈亏比等关键指标评估;
探索各策略的持仓数量对整体表现的影响,寻求最优持仓规模;
根据市场风格变化构建组合权重动态调整机制,比较不同阶段的收益曲线及回撤表现。
二 数据获取和数据预处理
2.1 数据获取
本文采用数据joinQuant平台,获取中证全指及沪深300、中证500、中证1000指数样本股在2020年4月22日至2025年3月21日期间每个交易日的截面数据作为测试集样本。另外,当天停牌或者开盘涨跌停的样本股作为对象外。
2.2 因子选取与模型构建
2.2.1 因子选取
本文对于小市值和红利低波的研究,选取相关因子及指标作为本文探讨。
2.3 数据预处理
本文通过JoinQuant平台获取所需的市值及因子数据。在进行模型构建与分析之前,为了提高数据的质量,需要对部分数据进行预处理。
2.3.1缺失值填充
缺失数据统一以0填充;
2.3.2标准化处理
为消除因子量纲差异,使用z-score标准化方法,将均值调为0,标准差调为1;
2.3.3排序处理
依据因子特征对样本进行排序,便于构建投资组合。
3.实证分析
3.1 回测参数设置
本文采用历史回测的方式进行实证分析。回测参数设置的不同所得到的测试结果差异很大,客观设置回测参数关系到策略交易效果的真伪和对策略的最终取舍。本文的回测参数设置及全局设定参考如下。
(一)投资金额
假定投资金额为:10万。
(二)回测区间
未指定的情况下,默认回测区间为:2020年4月22日至2025年3月21日
(三)佣金及印花税
为了使回测结果更加接近真实的交易成本,在实证分析中,设置佣金及印花税的比例。
买入时佣金万分之二,卖出时佣金万分之二加千分之一印花税, 每笔交易佣金最低扣5块钱
(四)滑点
所谓滑点,是指下单价与实际成交价之间的差价。由于滑点对最终结果的影响较小,本文滑点设定为0。
(五)仓位
根据每次买入时所剩资金,按照买入股票数平均资金,全仓买入。
(六)可行股票池
如无特别指定的情况,本文的可行股票池默认为中证全指。实际情况中,当天停牌的股票是无法进行买卖操作的,所以在整体回测前,将当日停牌的股票剔除。另外,本文在跌停状态下策略不进行买入,涨停状态下策略不进行卖出。
(七)比较基准
对应可行股票池,选取中证1000的每日价格作为判断策略好坏和一系列风险值计算的基准。
(八)其他
1)回测使用市价单下单,并假设不存在买不到或卖不出的现象。
2)财报和市值数据使用的回测日的前一天数据,从而避免未来函数。
(九)回测数据展示
3.10伪代码展示:
红利低波动
1. 初始化
- 设定基准指数: 沪深1000
- 参数: 持仓数=20, 调仓周期=360天
- 手续费: 买入0.02%, 卖出0.02% (含0.1%印花税)
2. 每日运行
IF 调仓周期到达 THEN
a. 清空当前持仓
b. 选股策略:
① 全市场股票池
② 计算过去3年平均股息率 → 因子A [3](@ref)
③ 获取20日波动率 → 因子B [3,6](@ref)
④ 标准化因子A、B → 合成得分 = A - B
⑤ 按得分降序取前20只非停牌股 [4](@ref)
c. 等资金买入新选股票
ELSE
调仓计数器+1
END
小市值
1. 初始化配置
- 基准: 沪深1000指数
- 调仓周期: 每120交易日
- 持仓数: 20只
- 手续费: 买0.02%/卖0.02%(含0.1%印花税)
2. 每日执行交易逻辑
IF 调仓日到达 THEN
a. 清空当前持仓
b. 选股策略:
① 筛选市值介于20-40亿的股票
② 按市值升序排列
③ 过滤停牌股 → 取前20只
c. 等分资金买入新选股票
重置调仓计数器
ELSE
交易日计数器+1
END
4.结论
4.1 小市值选股分析
本文构建的小市值选股模型在2020年4月-2025年3月间累计收益率最高可达到171.12%,年化收益率达到23.29%%,远远超出同期比较基准(中证1000)的业绩表现(超额收益率:144.35%),可见本文的策略具有较好的选股效果。
小市值因子在流动性宽松与市场风格切换期表现显著:主因疫情后全球放水推升风险偏好,资金涌入高弹性小盘股,叠加量化调仓(日频交易)捕捉短期反转效应;其有效性源于风险溢价补偿(小市值企业高波动性需更高收益补偿)和市场非有效性(机构覆盖低、散户定价偏差);
失效逻辑:主要源于政策冲击(注册制推行导致壳价值缩水)、因子拥挤(量化资金大规模参与稀释收益)及市场结构变化(外资涌入推高大盘股估值);
最大回撤表现:极端回撤多发生于流动性危机和监管干预期,如2024年2月A股微盘股单周暴跌16.87%,主因量化策略反身性踩踏及杠杆资金撤离;此外,经济超预期复苏引发的利率上行(如2022年美联储加息)也会导致小市值与成长股同步承压。
4.2 红利低波选股分析
本文构建的量化选股模型在2020年4月-2025年3月间累计收益率最高可达到64.69%,年化收益率达到11.17%%,远远超出同期比较基准(中证1000)的业绩表现(超额收益率:49.97%),可见本文的策略具有较好的选股效果。
结合回测数据,红利低波因子的收益源于高股息现金流与低波动防御属性的双重优势:策略收益64.69%(基准中证1000仅9.81%),超额收益49.97%主要来自成熟行业(如金融、公用事业)的稳定分红(股息率>4%)及低波动个股的抗跌性(贝塔0.618,波动敏感度较低)。胜率方面,日胜率53.1%体现交易方向判断有效性一般,但通过“小胜积累”(日均收益0.084%)实现复利增长,信息比率0.603表明超额收益稳定性中等。
回撤控制能力上,最大回撤26.60%(2021/09-2022/04区间)显著高于纯债策略,但对比同期中证1000的剧烈波动仍体现防御性,主因高股息企业现金流支撑(如长江电力等龙头逆势上涨)及行业分散(金融+公用事业占比超50%)。
作为防御性策略,其稳定性体现在:
弱市抗跌:2022年美联储加息冲击下,超额收益策略回撤仅为21.75%;
低利率适配性:股息率相对国债收益率溢价明显,吸引避险资金。
4.3 组合策略优势
小市值与红利组合的核心优势体现在风险对冲与收益弹性的动态平衡,通过图表分析可见其抗回撤能力显著优于单一因子策略。
在2020-2025年回测数据显示,等权比例的红利+小市值组合年化收益达17.23%,最大回撤仅30.69%(同期小市值回撤34.78%),其抗回撤能力源于双因子互补机制:红利资产在弱市提供稳定现金流,而小市值因子在经济复苏期捕捉高弹性收益。
4.2 不足之处
本文在优化小市值和红利低波动策略回撤上不够具体,主要体现小市值最大回撤高达34.78%,可以引入熔断机制或者宏观因子作为优化方向;
本文在优化红利低波动的选股仅使用股票数据,没有计算相应的分红收入;
本文在组合的时候遇到困难,由于调仓时间不同,面临组合策略编写困难,优化组合数据仅仅简单本地下载组合,采用等权组合优化。
4.2优化方向
本研究初步验证了小市值策略与红利低波策略的收益风格互补性。在牛市中小市值策略提供了高超额收益能力,而在市场震荡或下行期,红利低波策略则提供了防御性与稳定性。两者结合有望构建出风险可控、收益较稳健的多因子组合策略。下一步研究可进一步结合宏观因子、行业轮动等要素,探索更为稳定高盈利的策略。