本文从论证港股的风格轮动效应入手,构建了基于五大类信息的多因子模型,在中证港股通科技与红利指数上月度轮动,使用岭逻辑回归模型以及简单二分类捕捉风格切换,取得19.50%的年化收益以及相较于等权基准的年化超额8.98%。
摘要
港股风格的轮动特点及影响因素
作为港股市场内讨论度较高的两个细分风格,港股科技与红利风格长期收益负向相关,存在明显轮动现象,短期优势月频轮动,长期优势平均延续超半年。我们以指数来表征对应风格的收益表现,分别统计了恒生系以及中证系港股通科技与红利指数的超额收益表现,发现:1)恒生系与中证系港股通的超额收益从2020年年中开始维持强正相关且趋于稳定;2)港股的红利与科技风格超额收益从2020年年中至今呈现强负相关,适合构建风格轮动策略;3)科技与红利风格的轮动速度适中,短期优势月频轮动,长期优势平均延续超半年。
验证了港股风格存在一定轮动现象后,我们从五个维度找寻风格轮动背后的影响因素,分别是宏观经济类、资金类、市场类、基本面类和估值类指标。由于港股风格短期优势呈现月频轮动,且大部分宏观指标均为月度更新,因此我们将所有的指标均统一为月度频率。
岭逻辑回归下的多因子风格轮动模型框架
我们使用的是一种带有共线性惩罚项的逻辑回归方法,通过滚动回归的方式确认参数和因子,再通过简单二分类确定观点。
1) 如何判断单指标对风格的预测能力:我们首先从上述五大类影响因素中挑选出共101个指标。考虑到轮动目标为二元选择,最终模型采取逻辑回归的方式判断未来收益差方向,我们设计了秩相关性检验和单指标Logit系数显著性两种测试方式。滚动窗口长度则选择2年完整窗口(24个月频数据点)。
2) 滚动训练的岭逻辑回归:为了尽可能兼顾指标近期有效性和样本外适用性,我们选择滚动选取有效因子组合并训练模型。在模型选取上,考虑到最终的预测目标为下期收益差方向,即下月港股科技风格战胜港股高股息风格的概率,我们选用了逻辑回归模型。此外,由于在筛选因子时仅考虑单因子有效性,并未考虑多因子之间的相关性,因此我们加入正则化处理因子之间的共线性。
3) 从预测概率到风格持仓观点:尝试了两种从预测概率到仓位观点的转化方式——简单二分类法(即预测跑赢概率大于50%时满仓持有科技指数)与缓冲区间法(即缓冲区间内沿用上期观点)。生成风格持仓观点后,科技风格对应持仓标的为中证港股通科技全收益指数(931573HKD01.CSI),红利风格则对应中证港股通高股息投资全收益指数(H20914.CSI)。每月末根据最新因子数据更新观点后,月初第一个交易日收盘进行调仓,换仓成本设置为双边千1.5%。
模型收益增强能力显著,年化超额收益9%
简单二分类、季度训练的风格轮动模型年化收益19.50%,相较于科技红利指数等权平均的年化超额8.98%,相对波动13.62%,有显著的收益增强能力。模型预测科技风格跑赢的月份平均收益为1.78%,预测红利风格跑赢的月份平均收益为1.17%。从分年收益来看,除2023年跑输基准外,其他年度均有一定正向超额收益。
模型的换仓频率在2017至2019年间较为频繁,2020至2024年年中大部分时间均配置红利风格,2024年下半年的几次月度风格切换均带来正向超额收益,2025年1-2月配置科技风格精准捕捉科技板块行情,此后延续配置红利风格。
对比缓冲区间法,简单二分类法由于预测概率有效性增益高于其带来的额外波动,因此收益表现优于缓冲区间法。缓冲区间设置为[0.4, 0.6]的方法由于有均衡配置基准阶段,因此超额收益从8.98%下降至7.93%,但同时相对收益波动和回撤也有所减小。
从入选有效因子来看,2024年年末以来,波动率、价差、南向资金以及美国新增非农就业数据的风格预测能力较强。相比2024年之前,中国大陆和中国香港地区的宏观因子、估值因子有效性顺位有所下降,近期并未入选优选因子组合,市场价量信息有效性保持稳定。
截至2025/9/30,最新观点推荐配置港股红利风格。2025年2月以来配置红利风格主要由于入选的多个波动率比值因子与下期科技跑赢概率负向相关,即低波风格未来跑赢概率较大,而今年港股科技风格的波动率持续高于红利风格,因此红利风格在避险维度有一定优势。此外,入选的基金流入占比之差因子系数为正,说明获得外资关注的风格未来更可能表现更佳。该项指标从2月起大多数月份为负值,说明现存产品维度的外资配置更偏红利风格。
风险提示:本文观点及结论均基于公开数据分析所得,历史数据不代表未来、存在失效风险,不构成投资建议。
正文
寻找港股风格轮动的钥匙
港股风格如何轮动?
作为港股市场内讨论度较高的两个细分风格,港股科技与红利风格长期收益负向相关,存在明显轮动现象,短期优势月频轮动,长期优势平均延续超半年。我们以指数来表征对应风格的收益表现。
我们分别统计了恒生系以及中证系港股通科技与红利指数的超额收益表现。具体而言,恒生系为恒生科技与高股息率全收益指数相较于恒生综指全收益指数(HSI6.HI)的超额收益,中证系则为中证港股通科技与高股息指数相较于中证港股通综合全收益指数(h20930.CSI)。总结规律如下:
1) 恒生系与中证系港股通的超额收益从2020年年中开始维持强正相关且趋于稳定。
2) 港股的红利与科技风格超额收益从2020年年中至今呈现强负相关,适合构建风格轮动策略。我们日度统计了同系列不同风格的超额收益滚动过去一年的相关性。恒生科技与红利超额收益始终保持负向相关。无论是恒生或中证港股通科技与红利指数在2020年年中以来均保持稳定强负相关(相关性低于-0.5)。对于风格轮动策略而言,目标风格收益保持分化使得正确的风格判断带来的超额回报更为显著。
图表1:港股科技与红利风格超额收益滚动1年相关性
注:统计区间2015/12/31-2025/8/29
资料来源:Wind,中金公司研究部
3) 科技与红利风格的轮动速度适中,短期优势月频轮动,长期优势平均延续超半年。相较于恒生科技与红利,港股通科技与红利的风格延续区间更长,整体风格切换次数更少。从整体趋势来看,2015-2016、2019-2020、2024下半年为科技风格显著占优区间,红利风格在2021-2024年上半年持续维持优势。
图表2:恒生科技与红利风格超额占优阶段
注:统计区间2014/12/31-2025/8/29
资料来源:Wind,中金公司研究部
图表3:港股通科技与红利风格超额占优阶段
注:统计区间2014/12/31-2025/8/29
资料来源:Wind,中金公司研究部
在港股选择科技与红利风格轮动策略,而非传统的成长与价值轮动,核心在于港股市场结构特征以及风格与指数的对应关系。科技与红利风格一定程度上是更为极化的成长与价值风格。港股科技板块高度集中化,恒生科技内信息技术行业总权重近50%,使科技风格兼具成长属性与高波动性。而红利板块低估值与稳定分红属性与科技形成风险对冲。相比之下,港股传统价值与成长风格较为分散,历史上缺乏指数化表征工具。港股通成长策略(932152.CSI)与港股通价值策略(932153.CSI)在2025年4月30日发布,无此前成分股数据,无法构建历史复合时序指标与策略。
考虑到恒生科技的指数发布起点较晚(2020/07/27),轮动模型中我们选用了存续时间较长的中证港股通科技全收益指数(931573HKD01.CSI)代表港股科技风格,中证港股通高股息投资全收益指数(H20914.CSI)代表港股红利风格。
风格轮动的五维影响因素
我们从五个维度找寻风格轮动背后的影响因素,分别是宏观经济类、资金类、市场类、基本面类和估值类,构建了共101个备选指标。如上文所述,港股风格短期优势呈现月频轮动,且大部分宏观指标均为月度更新,因此我们将所有的指标均统一为月度频率,根据指标含义选择月度平均或取月末最新数据点的方式。
► 宏观经济类:包括中国大陆、中国香港、美国宏观经济指标,反映各经济体增长、通货膨胀、流动性等状态。考虑三地经济状况指标是由于中国香港市场货币上与美元绑定,经济上与中国大陆融合。因为中国香港实行联系汇率制度,美元利率变化直接影响本地资金成本,而大多数港股上市公司主要业务在内地,中国经济走势又决定企业盈利前景。
► 资金类:包括南向资金、全球公募基金资金的流入与配置偏好。
南向持仓分别根据科技与红利指数成分股信息从个股聚合到风格维度,并统计科技相对于红利风格的南向资金净流入以及持仓偏好。
外资基金资金流向基于EPFR数据库统计所有注册地非中国香港、投资港股的基金产品,筛选投资科技和红利主题的基金,并统计两类基金的净流入之差、收益差等。
► 市场类:包括市场价量信息所蕴含的风格情绪和状态刻画。包括风格价差、波动率之比、相对技术指标(如RSI、MACD等)、恒生科技期权的成交额认沽认购比、恒生科技指数期货基差率等。
► 基本面类:将质量、成长、安全性等基本面维度根据风格指数成分股信息从个股复合到风格维度后,计算指数基本面指标的时序分位数,体现该风格相较过去的基本面改善情况。然后再计算科技与红利基本面分位数之差,刻画风格基本面变化的相对优势。通过这种方式,可以尽可能消除不同风格间基本面信息不可比的问题。
► 估值类:包括风格指数的估值溢价、当前估值差分位数等,衡量市场对风格定价的高低水平。估值差分位数衡量了显示风格相对估值在历史上的变化,例如科技与红利风格PE差值在过去1年的分位数;相对估值溢价则通过比较相对估值距离时序中点的距离,判断相对估值的安全空间。
图表4:港股风格轮动的五维影响因素
资料来源:中金公司研究部
岭逻辑回归下的多因子风格轮动模型
模型框架
如何判断单指标对风格的预测能力
在设计指标有效性检验时,我们主要考虑了以下三个方面:1)滚动窗口测试,以刻画指标有效性的变化与稳定性;2)由于月频数据量较少,在滚动测试时需确保统计检验的样本量要求满足;3)统计检验所蕴含的有效性信息类型与最终指标的处理方式相匹配。
最终,考虑到轮动目标为二元选择,最终模型采取逻辑回归的方式判断未来收益差方向,设计了秩相关性检验和单指标Logit系数显著性两种测试方式。滚动窗口长度则选择2年完整窗口(24个月频数据点)。我们将在后文详细描述为何选用逻辑回归模型。
► 秩相关性检验:在滚动窗口内计算当月自变量指标x_t与下月科技与红利风格收益差y_(t+1)的秩相关性。使用秩相关性能够有效捕捉非线性关系并抵抗极端值干扰,更适合检验指标排序相对变化与收益差方向变动的关联强度。
► 单指标Logit系数显著性:对下月科技与红利风格收益差y_(t+1)状态化处理,判断下期收益差是否为正(科技是否下月占优)即1_(y_(t+1)>0),对当月自变量指标xₜ进行单因子逻辑回归,检验该指标系数是否显著(p<0.05)。该指标衡量了当月自变量xₜ独立解释下月风格方向变动的能力。不同于秩相关性捕捉的 排序关联强度,Logit系数更聚焦于变量变动触发方向切换的概率。
滚动训练的岭逻辑回归
为了尽可能兼顾指标近期有效性和样本外适用性,我们选择滚动选取有效因子组合并训练模型。每个周期(例如每季度)根据滚动过去2年的有效性测试数据,选取显著有效的因子组合,训练模型,并在未来一个周期使用该组因子参数,直至下周期末重新训练因子组合以及模型系数。
图表5:滚动筛选因子及参数训练示意图(以半年周期为例)
资料来源:中金公司研究部
筛选因子的设置上,由于每个时点滚动测试有效的因子数量不同,使用固定阈值可能会导致部分时点没有因子通过筛选,使得当期模型空缺,所以我们分别设置了相对有效性和绝对有效性的双重筛选:选取秩相关性绝对值排名前8,或单因子逻辑回归系数p值<5%的因子。前者相对有效性确保最小因子数量为8,两者并集使得因子数量理论最大上限为因子总个数。
在模型选取上,考虑到最终的预测目标为下期收益差方向,即下月港股科技风格战胜港股高股息风格的概率,我们选用了逻辑回归模型。逻辑回归模型通过 Sigmoid函数将因子线性组合z=X^T β映射为条件概率值P(y=1|x)=1/(1+e^(-z) ),其中y=1为港股科技风格战胜港股高股息风格事件,即下月收益差大于0。该模型契合风格轮动的二元决策本质,不改变因子本身经济学含义,且量化其对预测目标的解释力度(因子系数为单位因子变动对科技风格胜率的边际贡献)。
此外,由于在筛选因子时仅考虑单因子有效性,并未考虑多因子之间的相关性,因此我们加入正则化处理因子之间的共线性。具体而言,通过岭回归(Ridge Regression)在损失函数中引入系数向量的L2范数惩罚项,使高相关性因子的系数权重向零收缩,从而降低模型估计方差。相较于普通最小二乘法,岭回归在保持因子解释力的同时提升参数估计的稳定性,且不依赖主观的因子剔除操作,更适合本文中系统化滚动选取单因子并集机制。
图表6:滚动训练的岭逻辑回归机制
资料来源:中金公司研究部
从预测概率到风格持仓观点
在岭逻辑回归在每个月末输出对于下月港股科技风格跑赢概率的预测P ̂后,如何将其转化为科技与红利风格的持仓观点?最直观的方式是当预测科技跑赢概率大于50%时,持有科技风格,反之则持有红利风格。这种简单的分类方式可能较为极化,例如当P ̂为51%时将被分类为满仓持有科技风格,因此我们设计了具有缓冲区间的观点转换方式,具体如下:
1. 简单50%分类法:P ̂≥50%时下个月持有科技风格指数,反之则持有红利风格指数。
2. 缓冲区间沿用上期观点:设置缓冲区间[a,b],0<a<0.5<b<1。当预测概率向上突破上限,即P ̂>b时,持有科技风格指数;当预测概率向下突破下限,即P ̂<a时,持有红利风格指数;若预测概率落在缓冲区间内,即P ̂∈[a,b]时,均衡配置科技与红利指数。该方法优势在于观点偏弱时配置等权基准,提高相对收益稳定性,仅在极化观点时满仓切换风格配置。
生成风格持仓观点后,科技风格对应持仓标的为中证港股通科技全收益指数(931573HKD01.CSI),红利风格则对应中证港股通高股息投资全收益指数(H20914.CSI)。每月末根据最新因子数据更新观点后,月初第一个交易日收盘进行调仓,换仓成本设置为双边千1.5%。测试时间为2015年至2025年9月末。由于模型滚动训练,每季度根据过去两年训练参数后,对下一季度进行预测,因此最终的预测结果为滚动季度样本外拼接而成。初次训练需要滚动2年生成优选因子以及模型参数,所以实际模型净值起点为2017年。
图表7:策略回测参数设定
资料来源:中金公司研究部
模型收益增强能力显著,年化超额收益9%
简单二分类法稳定捕捉风格切换超额
简单二分类、季度训练的风格轮动模型年化收益19.50%,相较于科技红利指数等权平均的年化超额8.98%,相对波动13.62%,有显著的收益增强能力。模型预测科技风格跑赢的月份平均收益为1.78%,预测红利风格跑赢的月份平均收益为1.17%。
模型的换仓频率在2017至2019年间较为频繁,2020至2024年年中大部分时间均配置红利风格,2024年下半年的几次月度风格切换均带来正向超额收益,2025年1-2月配置科技风格精准捕捉科技板块行情,此后延续配置红利风格。
截至2025/9/30,最新观点推荐配置港股红利风格。2025年2月以来配置红利风格主要由于入选的多个波动率比值因子与下期科技跑赢概率负向相关,即低波风格未来跑赢概率较大,而今年港股科技风格的波动率持续高于红利风格,因此红利风格在避险维度有一定优势。此外,入选的基金流入占比之差因子系数为正,说明获得外资关注的风格未来更可能表现更佳。该项指标从2月起大多数月份为负值,说明现存产品维度的外资配置更偏红利风格。
图表8:岭逻辑回归模型预测科技风格跑赢概率
资料来源:Wind,中金公司研究部
图表9:简单二分类模型收益统计
资料来源:Wind,中金公司研究部
图表10:简单二分类模型净值表现与持仓
资料来源:Wind,中金公司研究部
从分年收益来看,除2023年跑输基准外,其他年度均有一定正向超额收益。其中,收益增强最为显著的年份为2020年和2024年,超额超20%,2020年配置科技风格,2024年在长期红利配置中精准捕捉9月科技行情。2021年和2025年至今的超额收益均超10%。
图表11:简单二分类模型分年收益
资料来源: Wind,中金公司研究部
对比缓冲区间法,简单二分类法由于预测概率有效性增益高于其带来的额外波动,因此收益表现优于缓冲区间法。缓冲区间设置为[0.4, 0.6]的方法由于有均衡配置基准阶段,因此超额收益从8.98%下降至7.93%,但同时相对收益波动和回撤也有所减小。根据模型对于科技风格下月跑赢概率的预测结果(图表14),2021年下半年和2024年预测概率均在50%上下浮动,并无明显观点方向。从分年收益来看,由于2024年观点强度较弱,因此大多时间均衡配置基准,超额收益有所下降。
图表12:缓冲区间模型净值表现与持仓
注:空白持仓代表均衡配置科技与红利风格资料来源:Wind,中金公司研究部
入选有效因子
上述的缓冲区间法与简单二分类法仅在预测概率到观点映射方法论上有所不同,而其底层模型参数以及选用因子均保持一致。出于篇幅考虑,下表展示了2024年以来模型滚动选取的因子,例如最新一期2025年7月末的因子即根据2023年7月末到2025年7月末的已有信息挑选因子并训练逻辑模型参数,用于2025年8月到10月末的判断。
2024年年末以来,波动率、价差、南向资金以及美国新增非农就业数据的风格预测能力较强。相比2024年之前,中国大陆和中国香港的宏观因子、估值因子有效性顺位有所下降,近期并未入选优选因子组合,市场价量信息有效性保持稳定。
图表13:2024年以来季度选取因子组合
资料来源:Wind,中金公司研究部
参数敏感性分析
此外,我们也探索了不同参数组合对模型结果的影响。具体测试参数如下表所示。其中,岭逻辑回归的方法通过调节超参数C控制惩罚强度,当因子间存在多重共线性时,减小正则项系数倒数C可有效抑制系数波动,避免因子冗余导致的过拟合;反之当共线性较弱时,增加C可保留信息量。下文以缓冲方法为例展示参数变化的边际影响。
图表14:模型训练超参数
资料来源:中金公司研究部
► 略宽松的因子有效性筛选表现较好(top_n=8)。无论是半年度还是季度训练因子时,top_n个数为8时表现更有优势。这一现象也符合训练逻辑,在低频训练时,筛选更多可能有效的备选因子,从而提高其不同状态下的适用性。
► 缓冲区间细微宽度调整和训练频率的参数敏感度较低。
► 正则项系数倒数C较为敏感,惩罚共线性将损失一定模型收益。在上文的结果展示中,我们使用C=1的参数设置。当增加共线性惩罚时(C=0.1),模型表现有所下降,主要源于正则化对重要因子的过度压缩。
图表15:缓冲区间法下的参数敏感性测试
资料来源:Wind,中金公司研究部
注:本文摘自2025年10月10日已经发布的《风格轮动系列(4):港股风格投资的简洁解法》;分析员:陈宜筠 S0080524080004,郑文才 S0080523110003,曹钰婕 S0080524020013,周萧潇 S0080521010006,刘均伟 S0080520120002