Alpha 从哪来,又到哪去

"市场不是一台提款机,而是一面镜子——你看到的,是自己的认知在某个瞬间与现实的分歧。"

2015 年夏天,一位基本面量化基金经理在纽约的一场闭门会议上说出了这句话。当时他管理的基金刚经历了创立以来最惨烈的回撤——一个过去五年稳定年化 18% 的多因子模型,在三个月内亏损了 23%。

不是市场变了,是太多人知道了同一个秘密。

这不是一个关于"如何寻找 Alpha"的励志故事。这是一个关于** Alpha 为什么会死**的残酷解剖课。在深入代码和模型之前,我们需要先回答一个更根本的问题:量化策略赚的钱,本质上是从哪里来的?


一、Alpha 的数学定义:超越市场的"超额"

在金融学语境下,Alpha 至少有三种定义,它们的精确程度截然不同。

第一种定义(最常用,也最模糊):

$$
R_p = R_f + \beta \cdot (R_m - R_f) + \alpha
$$

这里的 Alpha 是截距项,代表投资组合收益率中无法被市场风险暴露解释的部分。一个年化收益 12% 的组合,如果它的 Beta 是 1.2,市场无风险利率是 4%,市场超额收益是 8%,那么:

$$
\alpha = 12% - 4% - 1.2 \times 8% = -1.6%
$$

这只基金表面上跑赢了基准,实际上在扣除市场风险后,它是一个负 Alpha 的策略——它赚的每一分钱,都是市场上涨带来的 Beta,不是真正的超额收益。

第二种定义(来自 Barra 风险模型):

$$
R_p = \sum_{k} \beta_k \cdot F_k + \sum_{j} w_j \cdot \text{Factor}_j + \epsilon
$$

这里的 Alpha 被分解为多个因子暴露(Size、BV、 Momentum 等)加上特质收益 $\epsilon$。风格因子暴露带来的收益不叫 Alpha,叫因子溢价——它是风险的补偿,不是超额能力。

第三种定义(最接近本质):

$$
\alpha = E[R_p] - E[R_{\text{所有已知策略}}]
$$

Alpha 是你的策略与"市场中已知最好策略"之间的差距。当这个差距趋近于零,你的信息优势已经消失,你的 Alpha 归零。

理解这三种定义的递进关系,是理解 Alpha 衰减的第一步。


二、Alpha 的四个真实来源

市场中存在真实的、非随机的 Alpha 来源。它们各自有不同的持续性特征,也对应着不同的衰减机制。

2.1 信息不对称:少数人知道的事

这是最直观的 Alpha 来源,也是法律灰色地带最大的。

当上市公司高管知道即将公布的财报将大幅低于预期,他们提前卖出股票——这是利用信息不对称获利。在合规框架内,类似的优势可能来自:

  • 对产业链的深度调研(比分析师更早发现需求变化)
  • 对供应链数据的独家追踪
  • 对政策制定者意图的提前预判

信息不对称的 Alpha 本质上是信息租金——你为获取信息付出的成本,转化为相对于信息劣势方的超额收益。

关键特征:持续性取决于信息壁垒的稳固程度。当你的调研方法被复制,或者知情者越来越多,信息优势就会快速消散。

2.2 认知偏差:市场犯错的地方

行为金融学揭示了人类决策者系统性的非理性偏差:

偏差类型 表现 Alpha 来源
锚定效应 投资者过度依赖买入价格作为参照 反转策略:超跌后买入被低估的资产
损失厌恶 亏损的痛苦感是同等盈利快感的两倍 事件驱动:利空出尽后的反弹
过度自信 高估自己判断的准确率 流动性提供:利用订单簿中的情绪波动
羊群效应 跟随他人决策而非独立判断 趋势跟踪:利用动量加速

这些偏差不是随机噪声,而是系统性的、可预测的偏差。它们创造 Alpha 的前提是:你的模型捕捉到了偏差,市场还没有自我修正

关键特征:持续性取决于"错误定价被发现的速度"。当行为金融学成为量化基金的标配课程,这些偏差就像路灯下的阴影——越来越难找到。

2.3 制度性摩擦:流动性的代价

每一笔交易都有成本:佣金、印花税、买卖价差、滑点。这些摩擦对于短期交易者来说是成本,对于做市商来说是利润来源。

聪明的交易者可以利用摩擦创造 Alpha

  • 拆单算法:将大单拆分为小单,减少市场冲击成本
  • 订单类型选择:在波动率高时使用限价单,在流动性好时使用市价单
  • 时序选择:利用盘前盘后的低流动性环境做价差交易

更深层的制度性摩擦来自不同市场的规则差异

  • A 股的 T+1 制度与涨跌停板
  • 港股的无日内回转交易
  • 美股的做市商竞争与暗池

这些规则差异创造了一个稳定的 Alpha 来源:跨市场监管套利。当三个市场的规则逐渐趋同(尤其是沪港通、深港通之后),这个 Alpha 源正在萎缩。

关键特征:持续性取决于制度套利的参与者密度。参与者越多,价差越小,Alpha 越薄。

2.4 风险溢价:主动承担的代价

这可能是最"诚实"的 Alpha 来源。

低波动因子在过去 50 年持续跑赢高波动股票——不是因为市场错了,而是因为大多数人不愿意持有低波动股票,他们觉得"涨得慢"等于"没意思"。这种偏好本身就是一种风险溢价的来源。

类似的风险溢价来源包括:

  • 价值因子:估值便宜的公司长期跑输,但短期波动大,愿意坚守的人获得溢价
  • 质量因子:盈利稳定、资产负债表健康的公司溢价,因为"踩雷"的概率低
  • 趋势因子:追涨杀跌看起来愚蠢,但在高杠杆产品中,趋势跟踪提供了宝贵的流动性

这些 Alpha 其实是风险的补偿——你承担了别人不愿意承担的风险,获得了相应的回报。

关键特征:持续性最强,但不代表不会衰减。当太多人涌入同一个风险溢价策略,拥挤交易会压缩回报,直到新的风险补偿机制出现。


三、你赚的钱,是谁亏的?

理解了 Alpha 的来源,接下来要问一个更直接的问题:这些钱从哪来?

3.1 零和博弈的精确含义

金融市场的交易并不总是零和的。股票市场整体长期上涨,是因为经济增长和企业盈利的系统性增加——这是正和博弈。

量化策略的短期超额收益,几乎都是零和的

考虑一个简化的例子:

某事件驱动策略利用财报前的期权异动买入跨式组合,财报公布后股价大涨 15%,策略获利 30%。

这 30% 的利润,来自三个可能的对手方:

  1. 在财报前卖出期权的做市商——他们定价偏低估了波动率,被套利者"捡漏"
  2. 基于"消息面"追高买入的散户——他们在消息落地后才冲进去,成为最后的多头
  3. 持有反向头寸的其他量化基金——当你的策略赚钱时,市场上一定有相反方向的押注者亏损

在一个高效市场中,每一个赚钱的策略背后,都有一个(或多个)亏钱的对手方。

3.2 对手方画像分析

对手方类型 行为特征 被收割的典型场景
散户投资者 追涨杀跌、过度交易、迷信"内幕" 突破买入陷阱、财报后追高
杠杆产品多头 被动持有、止损线强制平仓 尾部风险事件触发的踩踏
反向量化策略 均值回归信仰、过早左侧布局 趋势加速阶段的逼空
做市商 被动报价、依赖价差获利 波动率低估时的 gamma squeeze
其他 Alpha 策略 相似因子暴露、策略拥挤 流动性枯竭时的连环平仓

认识到你的对手方是谁,不只是道德问题,更是策略设计的核心约束

一个有效的 Alpha 策略,必须清晰地知道:

  • 我的利润来自谁的错误判断?
  • 这个错误是系统性的还是随机的?
  • 当对手方学习并修正错误时,我的策略还能工作吗?

四、Alpha 为什么会衰减:四种核心机制

这是本文的核心章节。Alpha 的衰减不是单一原因,而是四种机制共同作用的结果。

4.1 机制一:因子拥挤

当一个因子被广泛使用,它的预测能力会下降。这听起来违反直觉,但逻辑很清楚:

因子的 Alpha 本质上是一种"套利机会"——当所有人都发现了这个机会,资金涌入,价格向"正确"方向移动,套利空间消失。

用一个简化的数值例子说明:

假设:市值因子被发现能预测股票收益——小市值股票平均跑赢大市值 2% 每年。

第 1 年:少数人使用这个因子,获得 2% 的超额收益。

第 3 年:100 个量化基金使用这个因子,大量买入小市值股票。

  • 小市值股票需求增加 → 价格上升 → 预期收益下降
  • 大市值股票被抛售 → 价格下降 → 预期收益上升
  • 市值因子的预测能力从 2% 下降到 0.5%

第 5 年:因子拥挤严重,实际收益反转——部分小市值股票流动性枯竭,踩踏频发。

因子拥挤的量化指标通常包括:

  • 因子暴露度分布的集中度
  • 相同方向头寸的资产管理规模(AUM)
  • 因子相关策略的资金流入速度

拥挤度越高,衰减越快。

4.2 机制二:信息扩散

信息扩散理论(K. G. Karuppiah & S. A. W存在多种形式)表明:市场对新信息的反应速度正在加快。

  • 1970 年代:技术分析信号可能持续数周有效
  • 1990 年代:技术分析信号的有效期缩短到数天
  • 2010 年代:高频策略将信号有效期压缩到毫秒级
  • 2020 年代:AI 驱动的信息处理将分析师预测的修正速度提升一个数量级

信息扩散加速意味着:

  1. 价格发现更快:错误定价被更快地纠正
  2. 套利窗口更窄:捕捉错误定价的时间窗口从"天"变成"秒"
  3. Alpha 半衰期更短:一个策略从开发到失效的周期大幅缩短

信息扩散对不同类型策略的影响程度不同:

策略类型 Alpha 来源 信息扩散敏感性 典型半衰期
高频统计套利 微观结构 极高 数月
日间动量 短期行为偏差 1-2 年
事件驱动 信息不对称 3-5 年
价值因子 认知偏差 5-10 年
风险溢价 投资者偏好 极低 10 年以上

4.3 机制三:策略容量陷阱

每一个策略都有容量上限——超过这个规模,策略本身的交易行为会改变市场价格,吞噬 Alpha。

容量陷阱的机制

策略规模 < 容量上限 → 交易成本可控 → Alpha 为正
策略规模 > 容量上限 → 大额订单冲击成本 → Alpha 被侵蚀
策略规模 >> 容量上限 → 自身成为价格驱动者 → Alpha 归零或为负

容量陷阱的特殊之处在于:它不要求竞争对手知道你的策略。即使没有对手模仿,单靠自身规模的扩张,Alpha 也会衰减。

这解释了为什么大型量化基金(如 Two Sigma、Renaissance)必须不断分散策略、跨资产配置、全球化布局——本质上是在持续寻找新的容量空间。

4.4 机制四:市场结构演化

这是最隐蔽的衰减机制,因为它不直接影响你的策略,而是改变整个市场的"生态"。

市场结构变化的典型案例

  • 暗池崛起:2008 年后,暗池交易量从占美股的 15% 上升到 40%+,传统的价格发现机制被分割,依赖公开订单簿数据的策略面临信息不完整的挑战
  • 高频做市商竞争加剧:当 Virtu Financial 这样的公司能在 99.6% 的交易日中盈利时,散户和小型机构的"逆向选择"机会大幅减少
  • 被动投资占比提升:当超过 50% 的美股交易量来自指数基金,市场价格发现功能弱化,传统的 alpha 信号失效
  • 监管规则变化:卖空限制、仓位报告要求、交易税改革,都会改变原有的套利空间

市场结构演化是不可逆的。一个策略可能在某个市场结构下工作良好,但当市场基础设施改变,这个策略可能永久失效。


五、Alpha 的生命周期:不是"死",是"变异"

一个常见的误解是:Alpha 衰减意味着策略彻底失效,必须放弃。

更准确的描述是:Alpha 在生命周期中发生形态变化

5.1 经典的生命周期曲线

Alpha 强度
    ↑
    │        ╭─────╮
    │      ╭─╯     ╰─╮
    │    ╭─╯           ╰─────→ 时间
    │  ╭─╯       (衰减期)
    │ ╱
    │╱(探索期)
    └──────────────────────────→ 
    0    发现    拥挤    饱和    失效
  • 探索期:少数人使用,Alpha 稳定且高
  • 成长期:更多人发现并采用,Alpha 仍在上升,但增速放缓
  • 拥挤期:资金大量涌入,Alpha 开始快速衰减
  • 饱和期:策略被广泛知晓,几乎没有额外 Alpha
  • 失效期:策略可能反向——被"聪明钱"反向收割

5.2 聪明的 Alpha 策略:主动变异

顶级量化基金的秘密不是"找到一个永不失效的因子",而是建立因子更新的能力

有效的因子迭代策略包括:

迭代方式 说明 适用场景
因子正交化 对已有因子做正交处理,提取残余信号 拥挤期因子衰减
机器学习增强 用 ML 发现因子间的非线性关系 传统线性因子失效
跨资产迁移 将 A 股验证有效的因子迁移到港股 单市场容量饱和
时间分层 同一因子在不同时间粒度上的有效性不同 日内 vs 日间信号
风险溢价叠加 将 Alpha 因子与风险溢价因子组合 降低回撤,提升 Sharpe

核心思想:Alpha 不是资源,是动态能力。你的竞争优势不在于"拥有 Alpha",而在于"持续发现 Alpha"的能力。


六、从 Alpha 的本质看量化策略设计

回到开头的问题:市场是一面镜子,Alpha 是认知分歧在某个瞬间的投影。

这意味着两个相互关联的结论:

第一,Alpha 的存在前提是分歧的存在。

如果所有人都掌握相同的信息、用相同的模型、做相同的判断,市场将完全有效,Alpha 将归零。Alpha 的存在,恰恰说明市场还不够有效——而这种无效,正是你的机会所在。

第二,Alpha 的衰减是市场进化的标志。

当你发现一个 Alpha,不要期望它永远存在。正确的态度是:尽可能在 Alpha 的生命周期中获取价值,同时持续寻找下一个 Alpha。

6.1 一个实用的策略设计框架

基于以上分析,设计量化策略时应考虑:

┌─────────────────────────────────────────────────────┐
│  Alpha 生命周期评估框架                              │
├─────────────────────────────────────────────────────┤
│  1. 信息来源分析                                     │
│     - 这个 Alpha 来自信息不对称还是认知偏差?         │
│     - 信息壁垒有多稳固?竞争对手多久能复制?          │
├─────────────────────────────────────────────────────┤
│  2. 因子拥挤度评估                                   │
│     - 有多少已知资金在使用类似因子?                  │
│     - 因子容量上限是多少?                           │
├─────────────────────────────────────────────────────┤
│  3. 衰减速度预估                                     │
│     - 历史类似因子的半衰期是多少?                    │
│     - 当前市场结构是否加速信息扩散?                  │
├─────────────────────────────────────────────────────┤
│  4. 策略容量规划                                     │
│     - 策略适合多大 AUM?                             │
│     - 超出容量后如何迭代或退出?                     │
├─────────────────────────────────────────────────────┤
│  5. 退出机制设计                                     │
│     - Alpha 衰减到什么程度触发策略终止?              │
│     - 是否有备选因子可以切换?                       │
└─────────────────────────────────────────────────────┘

这个框架不能保证策略成功,但它能帮助你在策略设计阶段就看清风险——而不是等到回撤发生时才被动应对。

6.2 超越 Alpha 思维

最后,一个更宏观的思考。

过度追求 Alpha 可能陷入一种"零和陷阱"——你的目标是战胜其他市场参与者,而忘记了投资的本质是配置资源、分享经济增长

当一个市场中的 Alpha 策略占比过高,意味着:

  • 市场资源配置效率下降
  • 交易成本上升
  • 实体经济的融资成本提高

这不是道德说教,而是风险警示。当市场结构演化到某个临界点,被动投资的低费率、因子投资的透明化,可能比主动 Alpha 策略提供更好的风险调整后回报。

Alpha 仍然值得追求,但不要把它当作唯一的信仰。


结语

回到文章开头的那位基金经理。他的模型三个月回撤 23%,不是因为策略本身错了,而是因为太多人知道了同一个秘密——因子拥挤导致了快速衰减。

他后来做了一件事:关闭了那只基金,将资金分散到三个相互正交的新策略中,并建立了一套因子拥挤度监控系统。

三年后,他的基金重新站稳,年化收益恢复到 14%——虽然不如巅峰期的 18%,但波动率和回撤都大幅下降。

Alpha 的本质,是认知的竞争优势。

这种优势不是一劳永逸的护城河,而是一场永无止境的进化游戏。

理解这一点,不是让你悲观,而是让你更清醒:Alpha 从市场中来,到市场进化中去。你能做的,不是"守护" Alpha,而是持续进化自己的认知能力——这才是唯一可靠的 Alpha 来源。


风险提示:本文不构成任何投资建议。历史数据不代表未来表现,量化策略存在固有风险,请谨慎评估后决策。


如果你想深入了解

  • 量化策略中订单簿数据的处理方式,可以访问 tickdb.ai 了解专业级市场数据接口
  • 关注 TickDB 公众号,获取更多关于市场微观结构的深度拆解