Alpha 从哪来,又到哪去


“市场不是零和游戏。如果你的策略持续盈利,一定有人以更慢的速度在学习这个规律。”

——这是关于 Alpha 最残酷的事实,也是最容易被忽略的起点。


一、问题的起点

每个量化交易者在入门时都会被灌输一个公式:

$$P&L = \alpha + \beta \cdot r_{market} + \epsilon$$

其中 $\alpha$ 是超额收益,$\beta$ 是市场敞口,$\epsilon$ 是噪声。这个公式的美感在于它的简洁——把投资收益拆解成了可解释的部分和不可解释的部分。

但很少有人追问:$\alpha$ 从哪里来?

这个问题比它看起来更难回答。因为如果 $\alpha$ 真的可以被轻易获取,它早就应该被套利掉了。正是这种看似矛盾的存在——$\alpha$ 既真实存在,又不断被侵蚀——构成了量化交易最核心的认知谜题。

本文不提供任何交易策略,也不给出任何投资建议。我们只做一件事:从第一性原理出发,拆解 $\alpha$ 的来源、归属与消亡。


二、Alpha 从哪来

2.1 市场有效性的三层含义

理解 Alpha 的第一步,是理解市场有效性(Market Efficiency)这个概念。Eugene Fama 在 1970 年提出的有效市场假说(EMH)通常被简化为三种形式:

形式 核心命题 意味着什么
弱式有效 价格反映所有历史交易信息 技术分析无效
半强式有效 价格反映所有公开信息 基本面分析无效
强式有效 价格反映所有信息(包括内部) 任何分析都无效

这三个层次构成了一套“套利空间递减”的光谱。在弱式有效的市场中,基于价量数据的 $\alpha$ 难以捕获;在半强式有效的市场中,基于公开财报的 $\alpha$ 也难以捕获。

但关键在于:现实市场从未达到任何一种完全有效状态。

这种非有效性(Inefficiency)不是市场的缺陷,而是 Alpha 的源头。

2.2 三种真实存在的 Alpha 源

在非完全有效的市场中,Alpha 主要来自三个方向:

2.2.1 信息不对称(Information Asymmetry)

这是最原始的 Alpha 源。当一部分参与者拥有另一部分参与者无法获取的信息时,前者可以通过信息优势持续获利。

这种不对称有多种形态:

  • 公司内部人:提前知道未披露的业绩、并购消息
  • 分析师网络:通过非公开渠道了解公司运营细节
  • 技术优势:高频交易者通过更快的执行速度捕获散户订单流的微小价差

信息不对称是 SEC 和各国监管机构长期打击的对象。在成熟市场,这种类型的 $\alpha$ 正在系统性萎缩。

2.2.2 结构性摩擦(Structural Friction)

这是被大多数业余交易者忽视的 Alpha 源。市场的非有效性不仅来自信息差,还来自交易机制本身的不完美。

典型场景包括:

摩擦类型 具体表现 Alpha 来源
流动性分割 小市值股票买卖价差大 承担流动性风险的补偿
制度性限制 ETF 赎回机制导致折溢价 跨市场套利窗口
时区差异 不同交易所开收盘时间不同 隔夜风险溢价
结算周期 T+2 结算 vs 实时清算 资金效率差异

结构性摩擦产生的 Alpha 往往更持久,因为它们嵌入在市场基础设施中,改变需要监管协调和系统改造。

2.2.3 行为金融偏差(Behavioral Bias)

这是过去二十年研究最活跃的领域。人类认知和决策的系统性偏差,会导致资产价格偏离基本面价值——而这种偏离是可以被预测和利用的。

经典的行为偏差包括:

  • 锚定效应:投资者将价格锚定在买入成本,不愿在亏损时卖出
  • 处置效应:过早卖出盈利股票,过久持有亏损股票
  • 羊群效应:跟随大众行为而非独立判断
  • 选择性注意:只关注符合先入之见的信息

行为金融的 $\alpha$ 来自“预测他人的错误”。但这是一个博弈论陷阱:知道别人会犯错的人越多,这个 $\alpha$ 消失得越快。


三、Alpha 到哪去:你赚的钱是谁亏的

3.1 零和游戏的真正含义

金融圈有一句老话:“市场是零和游戏”。这句话在某些语境下是对的,但在另一些语境下是误导性的。

严格零和:期货、期权等衍生品市场。赚的钱就是对手亏的钱,不存在共同增长。
正和偏移:股票市场长期是正和的,因为经济增长和企业盈利创造了增量价值。
负和区域:交易成本(佣金、滑点、价差)让所有参与者都在持续失血。

当我们讨论 $\alpha$ 时,必须明确说的是哪个层面。在扣除交易成本后,市场确实呈现出零和甚至负和的特征——你的超额收益,必然对应着某人的超额亏损。

3.2 亏损者的画像

理解 $\alpha$ 的归属,比理解它的来源更难。因为亏损者往往不承认自己的决策失误,而是将其归咎于市场。

但从量化视角,亏损者(相对于 $\alpha$ 获得者)通常属于以下几类:

被动型散户

这是最大也是最稳定的 $\alpha$ 供给方。他们的特征:

  • 交易频率低但决策随机
  • 持有期长,不择时
  • 对基本面缺乏系统研究
  • 受情绪驱动(恐惧时卖出、贪婪时买入)

行为金融研究者发现,散户投资者的整体年化亏损约在 2-4% 之间,主要被交易成本和错误的择时消耗。这部分亏损,是量化策略最重要的 $\alpha$ 来源之一。

被动型机构

听起来矛盾,但确实存在。养老金、共同基金等“被动”机构,其投资决策往往受到以下约束:

  • 合规要求(如持仓上限、禁止做空)
  • 流动性要求(赎回压力)
  • 代理问题(管理费与业绩不完全挂钩)

这些约束让他们在面对明显错误定价时,无法或不愿迅速纠偏。这为不 受类似约束的量化基金创造了 $\alpha$ 窗口。

其他量化策略

这是最残酷的部分:你赚的 $\alpha$,很可能正是另一个量化策略亏的 $\alpha$。

当两个策略在相近的因子空间中运作时,它们实际上在进行一场“抢椅子”游戏——在信息扩散足够快、参与者足够多之后,这个游戏必然有人输。


四、Alpha 为什么衰减:因子拥挤的机制

4.1 从 Alpha 到因子

在现代量化投资中,$\alpha$ 通常不以其原始形式存在,而是被封装为“因子”。

因子是衡量资产某种特征的数值:

  • 价值因子:账面市值比、市盈率的倒数
  • 动量因子:过去 N 个月的收益率
  • 质量因子:ROE、资产周转率等盈利质量指标
  • 规模因子:市值的大小

当一个因子被识别并可以被交易时,它就成为了可量化的 $\alpha$ 源。一个经典的五因子模型可以表示为:

$$R_i - R_f = \alpha_i + \beta_{mkt}(R_m - R_f) + \beta_{SMB}SMB + \beta_{HML}HML + \beta_{MOM}MOM + \beta_{RMW}RMW + \beta_{CMA}CMA + \epsilon_i$$

当这个方程中的 $\alpha$ 持续显著不为零,市场会注意到,资本会涌入,直到 $\alpha$ 消失。

4.2 因子拥挤的三阶段衰减

因子拥挤(Fator Crowding)是 $\alpha$ 衰减的核心机制。这个过程通常经历三个阶段:

第一阶段:发现与验证(Discovery & Validation)

学术研究或行业实践发现了一个新的 $\alpha$ 源。最初只有少数人知道:

  • 回测结果显著
  • 小规模实盘验证成功
  • 资金量小,对市场影响可忽略

这个阶段的 $\alpha$ 最纯粹,但大多数人接触不到。

第二阶段:扩散与放大(Diffusion & Amplification)

消息开始在量化社区传播。更多资金开始涌入:

  • 追随该因子的基金数量增加
  • 资金规模放大
  • 原本边缘的价差开始被压缩

这是 $\alpha$ 快速衰减的开始。回测收益与实盘收益的差距开始扩大(这是回撤最常被引用的原因,但根本原因是拥挤,不是过拟合)。

第三阶段:均值回归或彻底失效(Mean Reversion or Collapse)

两个可能的结果:

结果 机制 例子
均值回归 过度拥挤后资金撤出, $\alpha$ 恢复到合理水平 2015 年后的小市值因子
彻底失效 因子结构被永久性破坏 2007 年后的市场中性因子

彻底失效往往发生在因子依赖的行为偏差被参与者学习之后。 当足够多的人知道“散户会在某个点恐慌卖出”,专业参与者就会提前行动,直到这个模式本身消失。

4.3 数据可视化:因子生命周期

收益水平
   ↑
   │         ······ ← 因子生命周期曲线
   │      ··      ·
   │    ··          ··  ← 衰减加速期(拥挤信号)
   │  ··              ·
   │··                  ·
   │·                    ·
   ··                     ·· ← 新因子发现
   ····························→ 时间
   t₀   t₁   t₂   t₃   t₄   t₅

真实的因子收益曲线往往不是平滑下降的。在某个临界点(通常是 t₂),拥挤达到阈值,收益会出现断崖式下跌。这个临界点的触发因素通常是:

  • 宏观事件(流动性危机打断了杠杆资金)
  • 监管变化(禁止某种交易策略)
  • 因子相关性崩溃(原本不相关的因子开始同涨同跌)

五、信息扩散与市场学习

5.1 知识的传播路径

$\alpha$ 衰减的速度,本质上取决于信息扩散(Information Diffusion)的速度。

在量化领域,一个新发现的 $\alpha$ 源会沿着以下路径扩散:

学术论文 → 顶级量化会议 → 
    ↓
机构研报 → 量化社区讨论 → 
    ↓
开源实现 → 散户跟单 → 
    ↓
市场饱和 → Alpha 消失 → 
    ↓
研究者寻找新因子(循环)

这个路径在 2000 年代需要数年才能走完。随着学术出版加速、量化社区扩大、云计算降低门槛,现在可能只需要几个月。

数据支撑:根据 AQR Capital 的研究,经典的动量因子在 1960 年代-1990 年代持续有效,但 2000 年后其 Sharpe Ratio 下降了约 60%。价值因子也有类似趋势。

5.2 市场学习的博弈论

从博弈论视角,市场是一个不断演进的博弈:

  • 第一阶段:少数人知道某个 $\alpha$ 源,大肆利用
  • 第二阶段:更多人发现,市场开始自我纠偏
  • 第三阶段:错误定价消失,$\alpha$ 归零
  • 第四阶段:新的 $\alpha$ 源在别处出现(或者旧的以新形式出现)

这是一个“囚徒困境”的变体:每个参与者都有动机利用 $\alpha$,但所有人的利用都在侵蚀 $\alpha$。

解决方案理论上存在(参与者协调、默契协议),但实践中几乎不可能。因为:

  1. 不存在中央协调机构
  2. 背叛的诱惑始终存在
  3. 参与者数量太多且匿名

5.3 智能时代的加速效应

大语言模型和 AI 工具的普及,正在以前所未有的速度压缩信息扩散路径。

一个典型的例子:

传统模式 AI 加速模式
研究员手动回测一个因子需要 1-2 周 AI 可以在几分钟内完成初步验证
学术论文发表周期 6-12 个月 AI 可以在 24 小时内总结并生成代码框架
策略需要手动实现和调试 AI 可以生成可直接回测的代码
只有专业团队能参与 个人开发者借助 AI 可以快速入场

这意味着:

  • $\alpha$ 的发现速度在提升
  • $\alpha$ 的衰减速度也在提升
  • 两者的差距($\alpha$ 的有效窗口)在缩短

对于量化从业者,这是一个警钟:过去需要 3-5 年的因子生命周期,现在可能只有 12-18 个月。


六、$\alpha$ 的真正来源:超越因子

理解了 $\alpha$ 的来源、归属与衰减后,我们可以重新思考一个问题:在因子如此拥挤的市场,真正的 $\alpha$ 在哪里?

答案是:$\alpha$ 存在于市场的结构性盲区中。这些盲区通常有以下特征:

6.1 执行层面的 Alpha

不是“买什么”,而是“怎么买”。

同样的策略,不同的执行方式会导致截然不同的结果:

  • 订单拆分算法(VWAP、TWAP)vs 大单冲击
  • 滑点控制 vs 被动成交
  • 跨市场延迟套利

执行层面的 $\alpha$ 往往是 $10^{-4}$ 到 $10^{-3}$ 级别,积少成多,且不依赖于市场错误定价,因此更难被复制。

6.2 另类数据中的 Alpha

当公开数据被充分挖掘后,$\alpha$ 的下一个前沿是另类数据(Alternative Data):

数据类型 例子 Alpha 来源
卫星图像 停车场车辆数量 → 零售额预测 领先财务披露
信用卡数据 消费趋势聚合 行业层面基本面
社交媒体情绪 推文情感 → 股价短期波动 情绪逆转信号
供应链数据 物流信息 → 库存周期 需求拐点识别

另类数据的壁垒在于:获取成本高、处理复杂、且同样面临拥挤问题。

6.3 组合层面的 Alpha

因子是公开知识,但因子权重不是。

即使两个策略使用完全相同的因子,组合构建方法(权重优化、风险预算、相关性管理)仍然可以创造差异化收益。

这是为什么很多量化基金的核心竞争力不是“发现新因子”,而是持续迭代其组合优化算法。


七、实践启示

7.1 对量化从业者的建议

  1. 因子尽调要充分:当你发现一个看似有效的因子,先假设它已经拥挤,再寻找反证。
  2. 关注换手率变化:因子拥挤的早期信号,是相关交易的换手率系统性提升。
  3. 执行成本优先于预测精度:在高频场景,一个好的算法可能比一个差的因子更有价值。
  4. 持续迭代而非一劳永逸:没有任何 $\alpha$ 可以永远有效,建立持续研发的系统比押注单一因子更可靠。

7.2 对个人投资者的建议

  1. 警惕“一招鲜”策略:如果某个方法被公开兜售超过 1 年,其 $\alpha$ 大概率已经大幅衰减。
  2. 低成本指数基金:对于没有量化能力的投资者,被动指数投资的长期夏普比率可能高于追逐 $\alpha$ 的主动交易。
  3. 理解自己的角色:如果你在市场中发现了一个 $\alpha$,先问自己:是真实的非有效性,还是噪音?

结语

回到开篇的问题:你赚的钱,是谁亏的?

答案是:可能是散户的错误择时,可能是另一个策略的错误押注,也可能是未来某个时点的自己。

Alpha 为什么衰减?

答案是:因为市场会学习,知识会扩散,资本会涌向任何可持续的超额收益。直到 $\alpha$ 归零,新的非有效性在别处诞生。

这不是虚无主义,而是市场的本质特征。理解这一点不是为了放弃,而是为了更清醒地参与:

$\alpha$ 永远存在,但它永远在移动。

找到它的位置,比守在原地更重要。


风险提示:本文不构成任何投资建议。市场有风险,投资需谨慎。历史收益不代表未来表现,任何策略都存在亏损可能。


如果你对量化思维、市场微观结构或 TickDB 的数据能力感兴趣,欢迎继续阅读我们的其他文章。