Alpha 从哪来,又到哪去
"市场不是一台提款机,而是一面镜子——你看到的,是自己的认知在某个瞬间与现实的分歧。"
2015 年夏天,一位基本面量化基金经理在纽约的一场闭门会议上说出了这句话。当时他管理的基金刚经历了创立以来最惨烈的回撤——一个过去五年稳定年化 18% 的多因子模型,在三个月内亏损了 23%。
不是市场变了,是太多人知道了同一个秘密。
这不是一个关于"如何寻找 Alpha"的励志故事。这是一个关于** Alpha 为什么会死**的残酷解剖课。在深入代码和模型之前,我们需要先回答一个更根本的问题:量化策略赚的钱,本质上是从哪里来的?
一、Alpha 的数学定义:超越市场的"超额"
在金融学语境下,Alpha 至少有三种定义,它们的精确程度截然不同。
第一种定义(最常用,也最模糊):
$$
R_p = R_f + \beta \cdot (R_m - R_f) + \alpha
$$
这里的 Alpha 是截距项,代表投资组合收益率中无法被市场风险暴露解释的部分。一个年化收益 12% 的组合,如果它的 Beta 是 1.2,市场无风险利率是 4%,市场超额收益是 8%,那么:
$$
\alpha = 12% - 4% - 1.2 \times 8% = -1.6%
$$
这只基金表面上跑赢了基准,实际上在扣除市场风险后,它是一个负 Alpha 的策略——它赚的每一分钱,都是市场上涨带来的 Beta,不是真正的超额收益。
第二种定义(来自 Barra 风险模型):
$$
R_p = \sum_{k} \beta_k \cdot F_k + \sum_{j} w_j \cdot \text{Factor}_j + \epsilon
$$
这里的 Alpha 被分解为多个因子暴露(Size、BV、 Momentum 等)加上特质收益 $\epsilon$。风格因子暴露带来的收益不叫 Alpha,叫因子溢价——它是风险的补偿,不是超额能力。
第三种定义(最接近本质):
$$
\alpha = E[R_p] - E[R_{\text{所有已知策略}}]
$$
Alpha 是你的策略与"市场中已知最好策略"之间的差距。当这个差距趋近于零,你的信息优势已经消失,你的 Alpha 归零。
理解这三种定义的递进关系,是理解 Alpha 衰减的第一步。
二、Alpha 的四个真实来源
市场中存在真实的、非随机的 Alpha 来源。它们各自有不同的持续性特征,也对应着不同的衰减机制。
2.1 信息不对称:少数人知道的事
这是最直观的 Alpha 来源,也是法律灰色地带最大的。
当上市公司高管知道即将公布的财报将大幅低于预期,他们提前卖出股票——这是利用信息不对称获利。在合规框架内,类似的优势可能来自:
- 对产业链的深度调研(比分析师更早发现需求变化)
- 对供应链数据的独家追踪
- 对政策制定者意图的提前预判
信息不对称的 Alpha 本质上是信息租金——你为获取信息付出的成本,转化为相对于信息劣势方的超额收益。
关键特征:持续性取决于信息壁垒的稳固程度。当你的调研方法被复制,或者知情者越来越多,信息优势就会快速消散。
2.2 认知偏差:市场犯错的地方
行为金融学揭示了人类决策者系统性的非理性偏差:
| 偏差类型 | 表现 | Alpha 来源 |
|---|---|---|
| 锚定效应 | 投资者过度依赖买入价格作为参照 | 反转策略:超跌后买入被低估的资产 |
| 损失厌恶 | 亏损的痛苦感是同等盈利快感的两倍 | 事件驱动:利空出尽后的反弹 |
| 过度自信 | 高估自己判断的准确率 | 流动性提供:利用订单簿中的情绪波动 |
| 羊群效应 | 跟随他人决策而非独立判断 | 趋势跟踪:利用动量加速 |
这些偏差不是随机噪声,而是系统性的、可预测的偏差。它们创造 Alpha 的前提是:你的模型捕捉到了偏差,市场还没有自我修正。
关键特征:持续性取决于"错误定价被发现的速度"。当行为金融学成为量化基金的标配课程,这些偏差就像路灯下的阴影——越来越难找到。
2.3 制度性摩擦:流动性的代价
每一笔交易都有成本:佣金、印花税、买卖价差、滑点。这些摩擦对于短期交易者来说是成本,对于做市商来说是利润来源。
聪明的交易者可以利用摩擦创造 Alpha:
- 拆单算法:将大单拆分为小单,减少市场冲击成本
- 订单类型选择:在波动率高时使用限价单,在流动性好时使用市价单
- 时序选择:利用盘前盘后的低流动性环境做价差交易
更深层的制度性摩擦来自不同市场的规则差异:
- A 股的 T+1 制度与涨跌停板
- 港股的无日内回转交易
- 美股的做市商竞争与暗池
这些规则差异创造了一个稳定的 Alpha 来源:跨市场监管套利。当三个市场的规则逐渐趋同(尤其是沪港通、深港通之后),这个 Alpha 源正在萎缩。
关键特征:持续性取决于制度套利的参与者密度。参与者越多,价差越小,Alpha 越薄。
2.4 风险溢价:主动承担的代价
这可能是最"诚实"的 Alpha 来源。
低波动因子在过去 50 年持续跑赢高波动股票——不是因为市场错了,而是因为大多数人不愿意持有低波动股票,他们觉得"涨得慢"等于"没意思"。这种偏好本身就是一种风险溢价的来源。
类似的风险溢价来源包括:
- 价值因子:估值便宜的公司长期跑输,但短期波动大,愿意坚守的人获得溢价
- 质量因子:盈利稳定、资产负债表健康的公司溢价,因为"踩雷"的概率低
- 趋势因子:追涨杀跌看起来愚蠢,但在高杠杆产品中,趋势跟踪提供了宝贵的流动性
这些 Alpha 其实是风险的补偿——你承担了别人不愿意承担的风险,获得了相应的回报。
关键特征:持续性最强,但不代表不会衰减。当太多人涌入同一个风险溢价策略,拥挤交易会压缩回报,直到新的风险补偿机制出现。
三、你赚的钱,是谁亏的?
理解了 Alpha 的来源,接下来要问一个更直接的问题:这些钱从哪来?
3.1 零和博弈的精确含义
金融市场的交易并不总是零和的。股票市场整体长期上涨,是因为经济增长和企业盈利的系统性增加——这是正和博弈。
但量化策略的短期超额收益,几乎都是零和的。
考虑一个简化的例子:
某事件驱动策略利用财报前的期权异动买入跨式组合,财报公布后股价大涨 15%,策略获利 30%。
这 30% 的利润,来自三个可能的对手方:
- 在财报前卖出期权的做市商——他们定价偏低估了波动率,被套利者"捡漏"
- 基于"消息面"追高买入的散户——他们在消息落地后才冲进去,成为最后的多头
- 持有反向头寸的其他量化基金——当你的策略赚钱时,市场上一定有相反方向的押注者亏损
在一个高效市场中,每一个赚钱的策略背后,都有一个(或多个)亏钱的对手方。
3.2 对手方画像分析
| 对手方类型 | 行为特征 | 被收割的典型场景 |
|---|---|---|
| 散户投资者 | 追涨杀跌、过度交易、迷信"内幕" | 突破买入陷阱、财报后追高 |
| 杠杆产品多头 | 被动持有、止损线强制平仓 | 尾部风险事件触发的踩踏 |
| 反向量化策略 | 均值回归信仰、过早左侧布局 | 趋势加速阶段的逼空 |
| 做市商 | 被动报价、依赖价差获利 | 波动率低估时的 gamma squeeze |
| 其他 Alpha 策略 | 相似因子暴露、策略拥挤 | 流动性枯竭时的连环平仓 |
认识到你的对手方是谁,不只是道德问题,更是策略设计的核心约束。
一个有效的 Alpha 策略,必须清晰地知道:
- 我的利润来自谁的错误判断?
- 这个错误是系统性的还是随机的?
- 当对手方学习并修正错误时,我的策略还能工作吗?
四、Alpha 为什么会衰减:四种核心机制
这是本文的核心章节。Alpha 的衰减不是单一原因,而是四种机制共同作用的结果。
4.1 机制一:因子拥挤
当一个因子被广泛使用,它的预测能力会下降。这听起来违反直觉,但逻辑很清楚:
因子的 Alpha 本质上是一种"套利机会"——当所有人都发现了这个机会,资金涌入,价格向"正确"方向移动,套利空间消失。
用一个简化的数值例子说明:
假设:市值因子被发现能预测股票收益——小市值股票平均跑赢大市值 2% 每年。
第 1 年:少数人使用这个因子,获得 2% 的超额收益。
第 3 年:100 个量化基金使用这个因子,大量买入小市值股票。
- 小市值股票需求增加 → 价格上升 → 预期收益下降
- 大市值股票被抛售 → 价格下降 → 预期收益上升
- 市值因子的预测能力从 2% 下降到 0.5%
第 5 年:因子拥挤严重,实际收益反转——部分小市值股票流动性枯竭,踩踏频发。
因子拥挤的量化指标通常包括:
- 因子暴露度分布的集中度
- 相同方向头寸的资产管理规模(AUM)
- 因子相关策略的资金流入速度
拥挤度越高,衰减越快。
4.2 机制二:信息扩散
信息扩散理论(K. G. Karuppiah & S. A. W存在多种形式)表明:市场对新信息的反应速度正在加快。
- 1970 年代:技术分析信号可能持续数周有效
- 1990 年代:技术分析信号的有效期缩短到数天
- 2010 年代:高频策略将信号有效期压缩到毫秒级
- 2020 年代:AI 驱动的信息处理将分析师预测的修正速度提升一个数量级
信息扩散加速意味着:
- 价格发现更快:错误定价被更快地纠正
- 套利窗口更窄:捕捉错误定价的时间窗口从"天"变成"秒"
- Alpha 半衰期更短:一个策略从开发到失效的周期大幅缩短
信息扩散对不同类型策略的影响程度不同:
| 策略类型 | Alpha 来源 | 信息扩散敏感性 | 典型半衰期 |
|---|---|---|---|
| 高频统计套利 | 微观结构 | 极高 | 数月 |
| 日间动量 | 短期行为偏差 | 高 | 1-2 年 |
| 事件驱动 | 信息不对称 | 中 | 3-5 年 |
| 价值因子 | 认知偏差 | 低 | 5-10 年 |
| 风险溢价 | 投资者偏好 | 极低 | 10 年以上 |
4.3 机制三:策略容量陷阱
每一个策略都有容量上限——超过这个规模,策略本身的交易行为会改变市场价格,吞噬 Alpha。
容量陷阱的机制:
策略规模 < 容量上限 → 交易成本可控 → Alpha 为正
策略规模 > 容量上限 → 大额订单冲击成本 → Alpha 被侵蚀
策略规模 >> 容量上限 → 自身成为价格驱动者 → Alpha 归零或为负
容量陷阱的特殊之处在于:它不要求竞争对手知道你的策略。即使没有对手模仿,单靠自身规模的扩张,Alpha 也会衰减。
这解释了为什么大型量化基金(如 Two Sigma、Renaissance)必须不断分散策略、跨资产配置、全球化布局——本质上是在持续寻找新的容量空间。
4.4 机制四:市场结构演化
这是最隐蔽的衰减机制,因为它不直接影响你的策略,而是改变整个市场的"生态"。
市场结构变化的典型案例:
- 暗池崛起:2008 年后,暗池交易量从占美股的 15% 上升到 40%+,传统的价格发现机制被分割,依赖公开订单簿数据的策略面临信息不完整的挑战
- 高频做市商竞争加剧:当 Virtu Financial 这样的公司能在 99.6% 的交易日中盈利时,散户和小型机构的"逆向选择"机会大幅减少
- 被动投资占比提升:当超过 50% 的美股交易量来自指数基金,市场价格发现功能弱化,传统的 alpha 信号失效
- 监管规则变化:卖空限制、仓位报告要求、交易税改革,都会改变原有的套利空间
市场结构演化是不可逆的。一个策略可能在某个市场结构下工作良好,但当市场基础设施改变,这个策略可能永久失效。
五、Alpha 的生命周期:不是"死",是"变异"
一个常见的误解是:Alpha 衰减意味着策略彻底失效,必须放弃。
更准确的描述是:Alpha 在生命周期中发生形态变化。
5.1 经典的生命周期曲线
Alpha 强度
↑
│ ╭─────╮
│ ╭─╯ ╰─╮
│ ╭─╯ ╰─────→ 时间
│ ╭─╯ (衰减期)
│ ╱
│╱(探索期)
└──────────────────────────→
0 发现 拥挤 饱和 失效
- 探索期:少数人使用,Alpha 稳定且高
- 成长期:更多人发现并采用,Alpha 仍在上升,但增速放缓
- 拥挤期:资金大量涌入,Alpha 开始快速衰减
- 饱和期:策略被广泛知晓,几乎没有额外 Alpha
- 失效期:策略可能反向——被"聪明钱"反向收割
5.2 聪明的 Alpha 策略:主动变异
顶级量化基金的秘密不是"找到一个永不失效的因子",而是建立因子更新的能力。
有效的因子迭代策略包括:
| 迭代方式 | 说明 | 适用场景 |
|---|---|---|
| 因子正交化 | 对已有因子做正交处理,提取残余信号 | 拥挤期因子衰减 |
| 机器学习增强 | 用 ML 发现因子间的非线性关系 | 传统线性因子失效 |
| 跨资产迁移 | 将 A 股验证有效的因子迁移到港股 | 单市场容量饱和 |
| 时间分层 | 同一因子在不同时间粒度上的有效性不同 | 日内 vs 日间信号 |
| 风险溢价叠加 | 将 Alpha 因子与风险溢价因子组合 | 降低回撤,提升 Sharpe |
核心思想:Alpha 不是资源,是动态能力。你的竞争优势不在于"拥有 Alpha",而在于"持续发现 Alpha"的能力。
六、从 Alpha 的本质看量化策略设计
回到开头的问题:市场是一面镜子,Alpha 是认知分歧在某个瞬间的投影。
这意味着两个相互关联的结论:
第一,Alpha 的存在前提是分歧的存在。
如果所有人都掌握相同的信息、用相同的模型、做相同的判断,市场将完全有效,Alpha 将归零。Alpha 的存在,恰恰说明市场还不够有效——而这种无效,正是你的机会所在。
第二,Alpha 的衰减是市场进化的标志。
当你发现一个 Alpha,不要期望它永远存在。正确的态度是:尽可能在 Alpha 的生命周期中获取价值,同时持续寻找下一个 Alpha。
6.1 一个实用的策略设计框架
基于以上分析,设计量化策略时应考虑:
┌─────────────────────────────────────────────────────┐
│ Alpha 生命周期评估框架 │
├─────────────────────────────────────────────────────┤
│ 1. 信息来源分析 │
│ - 这个 Alpha 来自信息不对称还是认知偏差? │
│ - 信息壁垒有多稳固?竞争对手多久能复制? │
├─────────────────────────────────────────────────────┤
│ 2. 因子拥挤度评估 │
│ - 有多少已知资金在使用类似因子? │
│ - 因子容量上限是多少? │
├─────────────────────────────────────────────────────┤
│ 3. 衰减速度预估 │
│ - 历史类似因子的半衰期是多少? │
│ - 当前市场结构是否加速信息扩散? │
├─────────────────────────────────────────────────────┤
│ 4. 策略容量规划 │
│ - 策略适合多大 AUM? │
│ - 超出容量后如何迭代或退出? │
├─────────────────────────────────────────────────────┤
│ 5. 退出机制设计 │
│ - Alpha 衰减到什么程度触发策略终止? │
│ - 是否有备选因子可以切换? │
└─────────────────────────────────────────────────────┘
这个框架不能保证策略成功,但它能帮助你在策略设计阶段就看清风险——而不是等到回撤发生时才被动应对。
6.2 超越 Alpha 思维
最后,一个更宏观的思考。
过度追求 Alpha 可能陷入一种"零和陷阱"——你的目标是战胜其他市场参与者,而忘记了投资的本质是配置资源、分享经济增长。
当一个市场中的 Alpha 策略占比过高,意味着:
- 市场资源配置效率下降
- 交易成本上升
- 实体经济的融资成本提高
这不是道德说教,而是风险警示。当市场结构演化到某个临界点,被动投资的低费率、因子投资的透明化,可能比主动 Alpha 策略提供更好的风险调整后回报。
Alpha 仍然值得追求,但不要把它当作唯一的信仰。
结语
回到文章开头的那位基金经理。他的模型三个月回撤 23%,不是因为策略本身错了,而是因为太多人知道了同一个秘密——因子拥挤导致了快速衰减。
他后来做了一件事:关闭了那只基金,将资金分散到三个相互正交的新策略中,并建立了一套因子拥挤度监控系统。
三年后,他的基金重新站稳,年化收益恢复到 14%——虽然不如巅峰期的 18%,但波动率和回撤都大幅下降。
Alpha 的本质,是认知的竞争优势。
这种优势不是一劳永逸的护城河,而是一场永无止境的进化游戏。
理解这一点,不是让你悲观,而是让你更清醒:Alpha 从市场中来,到市场进化中去。你能做的,不是"守护" Alpha,而是持续进化自己的认知能力——这才是唯一可靠的 Alpha 来源。
风险提示:本文不构成任何投资建议。历史数据不代表未来表现,量化策略存在固有风险,请谨慎评估后决策。
如果你想深入了解:
- 量化策略中订单簿数据的处理方式,可以访问 tickdb.ai 了解专业级市场数据接口
- 关注 TickDB 公众号,获取更多关于市场微观结构的深度拆解