Alpha 从哪来,又到哪去
“市场不是零和游戏。如果你的策略持续盈利,一定有人以更慢的速度在学习这个规律。”
——这是关于 Alpha 最残酷的事实,也是最容易被忽略的起点。
一、问题的起点
每个量化交易者在入门时都会被灌输一个公式:
$$P&L = \alpha + \beta \cdot r_{market} + \epsilon$$
其中 $\alpha$ 是超额收益,$\beta$ 是市场敞口,$\epsilon$ 是噪声。这个公式的美感在于它的简洁——把投资收益拆解成了可解释的部分和不可解释的部分。
但很少有人追问:$\alpha$ 从哪里来?
这个问题比它看起来更难回答。因为如果 $\alpha$ 真的可以被轻易获取,它早就应该被套利掉了。正是这种看似矛盾的存在——$\alpha$ 既真实存在,又不断被侵蚀——构成了量化交易最核心的认知谜题。
本文不提供任何交易策略,也不给出任何投资建议。我们只做一件事:从第一性原理出发,拆解 $\alpha$ 的来源、归属与消亡。
二、Alpha 从哪来
2.1 市场有效性的三层含义
理解 Alpha 的第一步,是理解市场有效性(Market Efficiency)这个概念。Eugene Fama 在 1970 年提出的有效市场假说(EMH)通常被简化为三种形式:
| 形式 | 核心命题 | 意味着什么 |
|---|---|---|
| 弱式有效 | 价格反映所有历史交易信息 | 技术分析无效 |
| 半强式有效 | 价格反映所有公开信息 | 基本面分析无效 |
| 强式有效 | 价格反映所有信息(包括内部) | 任何分析都无效 |
这三个层次构成了一套“套利空间递减”的光谱。在弱式有效的市场中,基于价量数据的 $\alpha$ 难以捕获;在半强式有效的市场中,基于公开财报的 $\alpha$ 也难以捕获。
但关键在于:现实市场从未达到任何一种完全有效状态。
这种非有效性(Inefficiency)不是市场的缺陷,而是 Alpha 的源头。
2.2 三种真实存在的 Alpha 源
在非完全有效的市场中,Alpha 主要来自三个方向:
2.2.1 信息不对称(Information Asymmetry)
这是最原始的 Alpha 源。当一部分参与者拥有另一部分参与者无法获取的信息时,前者可以通过信息优势持续获利。
这种不对称有多种形态:
- 公司内部人:提前知道未披露的业绩、并购消息
- 分析师网络:通过非公开渠道了解公司运营细节
- 技术优势:高频交易者通过更快的执行速度捕获散户订单流的微小价差
信息不对称是 SEC 和各国监管机构长期打击的对象。在成熟市场,这种类型的 $\alpha$ 正在系统性萎缩。
2.2.2 结构性摩擦(Structural Friction)
这是被大多数业余交易者忽视的 Alpha 源。市场的非有效性不仅来自信息差,还来自交易机制本身的不完美。
典型场景包括:
| 摩擦类型 | 具体表现 | Alpha 来源 |
|---|---|---|
| 流动性分割 | 小市值股票买卖价差大 | 承担流动性风险的补偿 |
| 制度性限制 | ETF 赎回机制导致折溢价 | 跨市场套利窗口 |
| 时区差异 | 不同交易所开收盘时间不同 | 隔夜风险溢价 |
| 结算周期 | T+2 结算 vs 实时清算 | 资金效率差异 |
结构性摩擦产生的 Alpha 往往更持久,因为它们嵌入在市场基础设施中,改变需要监管协调和系统改造。
2.2.3 行为金融偏差(Behavioral Bias)
这是过去二十年研究最活跃的领域。人类认知和决策的系统性偏差,会导致资产价格偏离基本面价值——而这种偏离是可以被预测和利用的。
经典的行为偏差包括:
- 锚定效应:投资者将价格锚定在买入成本,不愿在亏损时卖出
- 处置效应:过早卖出盈利股票,过久持有亏损股票
- 羊群效应:跟随大众行为而非独立判断
- 选择性注意:只关注符合先入之见的信息
行为金融的 $\alpha$ 来自“预测他人的错误”。但这是一个博弈论陷阱:知道别人会犯错的人越多,这个 $\alpha$ 消失得越快。
三、Alpha 到哪去:你赚的钱是谁亏的
3.1 零和游戏的真正含义
金融圈有一句老话:“市场是零和游戏”。这句话在某些语境下是对的,但在另一些语境下是误导性的。
严格零和:期货、期权等衍生品市场。赚的钱就是对手亏的钱,不存在共同增长。
正和偏移:股票市场长期是正和的,因为经济增长和企业盈利创造了增量价值。
负和区域:交易成本(佣金、滑点、价差)让所有参与者都在持续失血。
当我们讨论 $\alpha$ 时,必须明确说的是哪个层面。在扣除交易成本后,市场确实呈现出零和甚至负和的特征——你的超额收益,必然对应着某人的超额亏损。
3.2 亏损者的画像
理解 $\alpha$ 的归属,比理解它的来源更难。因为亏损者往往不承认自己的决策失误,而是将其归咎于市场。
但从量化视角,亏损者(相对于 $\alpha$ 获得者)通常属于以下几类:
被动型散户
这是最大也是最稳定的 $\alpha$ 供给方。他们的特征:
- 交易频率低但决策随机
- 持有期长,不择时
- 对基本面缺乏系统研究
- 受情绪驱动(恐惧时卖出、贪婪时买入)
行为金融研究者发现,散户投资者的整体年化亏损约在 2-4% 之间,主要被交易成本和错误的择时消耗。这部分亏损,是量化策略最重要的 $\alpha$ 来源之一。
被动型机构
听起来矛盾,但确实存在。养老金、共同基金等“被动”机构,其投资决策往往受到以下约束:
- 合规要求(如持仓上限、禁止做空)
- 流动性要求(赎回压力)
- 代理问题(管理费与业绩不完全挂钩)
这些约束让他们在面对明显错误定价时,无法或不愿迅速纠偏。这为不 受类似约束的量化基金创造了 $\alpha$ 窗口。
其他量化策略
这是最残酷的部分:你赚的 $\alpha$,很可能正是另一个量化策略亏的 $\alpha$。
当两个策略在相近的因子空间中运作时,它们实际上在进行一场“抢椅子”游戏——在信息扩散足够快、参与者足够多之后,这个游戏必然有人输。
四、Alpha 为什么衰减:因子拥挤的机制
4.1 从 Alpha 到因子
在现代量化投资中,$\alpha$ 通常不以其原始形式存在,而是被封装为“因子”。
因子是衡量资产某种特征的数值:
- 价值因子:账面市值比、市盈率的倒数
- 动量因子:过去 N 个月的收益率
- 质量因子:ROE、资产周转率等盈利质量指标
- 规模因子:市值的大小
当一个因子被识别并可以被交易时,它就成为了可量化的 $\alpha$ 源。一个经典的五因子模型可以表示为:
$$R_i - R_f = \alpha_i + \beta_{mkt}(R_m - R_f) + \beta_{SMB}SMB + \beta_{HML}HML + \beta_{MOM}MOM + \beta_{RMW}RMW + \beta_{CMA}CMA + \epsilon_i$$
当这个方程中的 $\alpha$ 持续显著不为零,市场会注意到,资本会涌入,直到 $\alpha$ 消失。
4.2 因子拥挤的三阶段衰减
因子拥挤(Fator Crowding)是 $\alpha$ 衰减的核心机制。这个过程通常经历三个阶段:
第一阶段:发现与验证(Discovery & Validation)
学术研究或行业实践发现了一个新的 $\alpha$ 源。最初只有少数人知道:
- 回测结果显著
- 小规模实盘验证成功
- 资金量小,对市场影响可忽略
这个阶段的 $\alpha$ 最纯粹,但大多数人接触不到。
第二阶段:扩散与放大(Diffusion & Amplification)
消息开始在量化社区传播。更多资金开始涌入:
- 追随该因子的基金数量增加
- 资金规模放大
- 原本边缘的价差开始被压缩
这是 $\alpha$ 快速衰减的开始。回测收益与实盘收益的差距开始扩大(这是回撤最常被引用的原因,但根本原因是拥挤,不是过拟合)。
第三阶段:均值回归或彻底失效(Mean Reversion or Collapse)
两个可能的结果:
| 结果 | 机制 | 例子 |
|---|---|---|
| 均值回归 | 过度拥挤后资金撤出, $\alpha$ 恢复到合理水平 | 2015 年后的小市值因子 |
| 彻底失效 | 因子结构被永久性破坏 | 2007 年后的市场中性因子 |
彻底失效往往发生在因子依赖的行为偏差被参与者学习之后。 当足够多的人知道“散户会在某个点恐慌卖出”,专业参与者就会提前行动,直到这个模式本身消失。
4.3 数据可视化:因子生命周期
收益水平
↑
│ ······ ← 因子生命周期曲线
│ ·· ·
│ ·· ·· ← 衰减加速期(拥挤信号)
│ ·· ·
│·· ·
│· ·
·· ·· ← 新因子发现
····························→ 时间
t₀ t₁ t₂ t₃ t₄ t₅
真实的因子收益曲线往往不是平滑下降的。在某个临界点(通常是 t₂),拥挤达到阈值,收益会出现断崖式下跌。这个临界点的触发因素通常是:
- 宏观事件(流动性危机打断了杠杆资金)
- 监管变化(禁止某种交易策略)
- 因子相关性崩溃(原本不相关的因子开始同涨同跌)
五、信息扩散与市场学习
5.1 知识的传播路径
$\alpha$ 衰减的速度,本质上取决于信息扩散(Information Diffusion)的速度。
在量化领域,一个新发现的 $\alpha$ 源会沿着以下路径扩散:
学术论文 → 顶级量化会议 →
↓
机构研报 → 量化社区讨论 →
↓
开源实现 → 散户跟单 →
↓
市场饱和 → Alpha 消失 →
↓
研究者寻找新因子(循环)
这个路径在 2000 年代需要数年才能走完。随着学术出版加速、量化社区扩大、云计算降低门槛,现在可能只需要几个月。
数据支撑:根据 AQR Capital 的研究,经典的动量因子在 1960 年代-1990 年代持续有效,但 2000 年后其 Sharpe Ratio 下降了约 60%。价值因子也有类似趋势。
5.2 市场学习的博弈论
从博弈论视角,市场是一个不断演进的博弈:
- 第一阶段:少数人知道某个 $\alpha$ 源,大肆利用
- 第二阶段:更多人发现,市场开始自我纠偏
- 第三阶段:错误定价消失,$\alpha$ 归零
- 第四阶段:新的 $\alpha$ 源在别处出现(或者旧的以新形式出现)
这是一个“囚徒困境”的变体:每个参与者都有动机利用 $\alpha$,但所有人的利用都在侵蚀 $\alpha$。
解决方案理论上存在(参与者协调、默契协议),但实践中几乎不可能。因为:
- 不存在中央协调机构
- 背叛的诱惑始终存在
- 参与者数量太多且匿名
5.3 智能时代的加速效应
大语言模型和 AI 工具的普及,正在以前所未有的速度压缩信息扩散路径。
一个典型的例子:
| 传统模式 | AI 加速模式 |
|---|---|
| 研究员手动回测一个因子需要 1-2 周 | AI 可以在几分钟内完成初步验证 |
| 学术论文发表周期 6-12 个月 | AI 可以在 24 小时内总结并生成代码框架 |
| 策略需要手动实现和调试 | AI 可以生成可直接回测的代码 |
| 只有专业团队能参与 | 个人开发者借助 AI 可以快速入场 |
这意味着:
- $\alpha$ 的发现速度在提升
- $\alpha$ 的衰减速度也在提升
- 两者的差距($\alpha$ 的有效窗口)在缩短
对于量化从业者,这是一个警钟:过去需要 3-5 年的因子生命周期,现在可能只有 12-18 个月。
六、$\alpha$ 的真正来源:超越因子
理解了 $\alpha$ 的来源、归属与衰减后,我们可以重新思考一个问题:在因子如此拥挤的市场,真正的 $\alpha$ 在哪里?
答案是:$\alpha$ 存在于市场的结构性盲区中。这些盲区通常有以下特征:
6.1 执行层面的 Alpha
不是“买什么”,而是“怎么买”。
同样的策略,不同的执行方式会导致截然不同的结果:
- 订单拆分算法(VWAP、TWAP)vs 大单冲击
- 滑点控制 vs 被动成交
- 跨市场延迟套利
执行层面的 $\alpha$ 往往是 $10^{-4}$ 到 $10^{-3}$ 级别,积少成多,且不依赖于市场错误定价,因此更难被复制。
6.2 另类数据中的 Alpha
当公开数据被充分挖掘后,$\alpha$ 的下一个前沿是另类数据(Alternative Data):
| 数据类型 | 例子 | Alpha 来源 |
|---|---|---|
| 卫星图像 | 停车场车辆数量 → 零售额预测 | 领先财务披露 |
| 信用卡数据 | 消费趋势聚合 | 行业层面基本面 |
| 社交媒体情绪 | 推文情感 → 股价短期波动 | 情绪逆转信号 |
| 供应链数据 | 物流信息 → 库存周期 | 需求拐点识别 |
另类数据的壁垒在于:获取成本高、处理复杂、且同样面临拥挤问题。
6.3 组合层面的 Alpha
因子是公开知识,但因子权重不是。
即使两个策略使用完全相同的因子,组合构建方法(权重优化、风险预算、相关性管理)仍然可以创造差异化收益。
这是为什么很多量化基金的核心竞争力不是“发现新因子”,而是持续迭代其组合优化算法。
七、实践启示
7.1 对量化从业者的建议
- 因子尽调要充分:当你发现一个看似有效的因子,先假设它已经拥挤,再寻找反证。
- 关注换手率变化:因子拥挤的早期信号,是相关交易的换手率系统性提升。
- 执行成本优先于预测精度:在高频场景,一个好的算法可能比一个差的因子更有价值。
- 持续迭代而非一劳永逸:没有任何 $\alpha$ 可以永远有效,建立持续研发的系统比押注单一因子更可靠。
7.2 对个人投资者的建议
- 警惕“一招鲜”策略:如果某个方法被公开兜售超过 1 年,其 $\alpha$ 大概率已经大幅衰减。
- 低成本指数基金:对于没有量化能力的投资者,被动指数投资的长期夏普比率可能高于追逐 $\alpha$ 的主动交易。
- 理解自己的角色:如果你在市场中发现了一个 $\alpha$,先问自己:是真实的非有效性,还是噪音?
结语
回到开篇的问题:你赚的钱,是谁亏的?
答案是:可能是散户的错误择时,可能是另一个策略的错误押注,也可能是未来某个时点的自己。
而 Alpha 为什么衰减?
答案是:因为市场会学习,知识会扩散,资本会涌向任何可持续的超额收益。直到 $\alpha$ 归零,新的非有效性在别处诞生。
这不是虚无主义,而是市场的本质特征。理解这一点不是为了放弃,而是为了更清醒地参与:
$\alpha$ 永远存在,但它永远在移动。
找到它的位置,比守在原地更重要。
风险提示:本文不构成任何投资建议。市场有风险,投资需谨慎。历史收益不代表未来表现,任何策略都存在亏损可能。
如果你对量化思维、市场微观结构或 TickDB 的数据能力感兴趣,欢迎继续阅读我们的其他文章。