Alpha 从哪来，又到哪去

“市场不是零和游戏。如果你的策略持续盈利，一定有人以更慢的速度在学习这个规律。”

——这是关于 Alpha 最残酷的事实，也是最容易被忽略的起点。

一、问题的起点

每个量化交易者在入门时都会被灌输一个公式：

$$P&L = \alpha + \beta \cdot r_{market} + \epsilon$$

其中 $\alpha$ 是超额收益，$\beta$ 是市场敞口，$\epsilon$ 是噪声。这个公式的美感在于它的简洁——把投资收益拆解成了可解释的部分和不可解释的部分。

但很少有人追问：$\alpha$ 从哪里来？

这个问题比它看起来更难回答。因为如果 $\alpha$ 真的可以被轻易获取，它早就应该被套利掉了。正是这种看似矛盾的存在——$\alpha$ 既真实存在，又不断被侵蚀——构成了量化交易最核心的认知谜题。

本文不提供任何交易策略，也不给出任何投资建议。我们只做一件事：从第一性原理出发，拆解 $\alpha$ 的来源、归属与消亡。

二、Alpha 从哪来

2.1 市场有效性的三层含义

理解 Alpha 的第一步，是理解市场有效性（Market Efficiency）这个概念。Eugene Fama 在 1970 年提出的有效市场假说（EMH）通常被简化为三种形式：

形式	核心命题	意味着什么
弱式有效	价格反映所有历史交易信息	技术分析无效
半强式有效	价格反映所有公开信息	基本面分析无效
强式有效	价格反映所有信息（包括内部）	任何分析都无效

这三个层次构成了一套“套利空间递减”的光谱。在弱式有效的市场中，基于价量数据的 $\alpha$ 难以捕获；在半强式有效的市场中，基于公开财报的 $\alpha$ 也难以捕获。

但关键在于：现实市场从未达到任何一种完全有效状态。

这种非有效性（Inefficiency）不是市场的缺陷，而是 Alpha 的源头。

2.2 三种真实存在的 Alpha 源

在非完全有效的市场中，Alpha 主要来自三个方向：

2.2.1 信息不对称（Information Asymmetry）

这是最原始的 Alpha 源。当一部分参与者拥有另一部分参与者无法获取的信息时，前者可以通过信息优势持续获利。

这种不对称有多种形态：

公司内部人：提前知道未披露的业绩、并购消息
分析师网络：通过非公开渠道了解公司运营细节
技术优势：高频交易者通过更快的执行速度捕获散户订单流的微小价差

信息不对称是 SEC 和各国监管机构长期打击的对象。在成熟市场，这种类型的 $\alpha$ 正在系统性萎缩。

2.2.2 结构性摩擦（Structural Friction）

这是被大多数业余交易者忽视的 Alpha 源。市场的非有效性不仅来自信息差，还来自交易机制本身的不完美。

典型场景包括：

摩擦类型	具体表现	Alpha 来源
流动性分割	小市值股票买卖价差大	承担流动性风险的补偿
制度性限制	ETF 赎回机制导致折溢价	跨市场套利窗口
时区差异	不同交易所开收盘时间不同	隔夜风险溢价
结算周期	T+2 结算 vs 实时清算	资金效率差异

结构性摩擦产生的 Alpha 往往更持久，因为它们嵌入在市场基础设施中，改变需要监管协调和系统改造。

2.2.3 行为金融偏差（Behavioral Bias）

这是过去二十年研究最活跃的领域。人类认知和决策的系统性偏差，会导致资产价格偏离基本面价值——而这种偏离是可以被预测和利用的。

经典的行为偏差包括：

锚定效应：投资者将价格锚定在买入成本，不愿在亏损时卖出
处置效应：过早卖出盈利股票，过久持有亏损股票
羊群效应：跟随大众行为而非独立判断
选择性注意：只关注符合先入之见的信息

行为金融的 $\alpha$ 来自“预测他人的错误”。但这是一个博弈论陷阱：知道别人会犯错的人越多，这个 $\alpha$ 消失得越快。

三、Alpha 到哪去：你赚的钱是谁亏的

3.1 零和游戏的真正含义

金融圈有一句老话：“市场是零和游戏”。这句话在某些语境下是对的，但在另一些语境下是误导性的。

严格零和：期货、期权等衍生品市场。赚的钱就是对手亏的钱，不存在共同增长。
正和偏移：股票市场长期是正和的，因为经济增长和企业盈利创造了增量价值。
负和区域：交易成本（佣金、滑点、价差）让所有参与者都在持续失血。

当我们讨论 $\alpha$ 时，必须明确说的是哪个层面。在扣除交易成本后，市场确实呈现出零和甚至负和的特征——你的超额收益，必然对应着某人的超额亏损。

3.2 亏损者的画像

理解 $\alpha$ 的归属，比理解它的来源更难。因为亏损者往往不承认自己的决策失误，而是将其归咎于市场。

但从量化视角，亏损者（相对于 $\alpha$ 获得者）通常属于以下几类：

被动型散户

这是最大也是最稳定的 $\alpha$ 供给方。他们的特征：

交易频率低但决策随机
持有期长，不择时
对基本面缺乏系统研究
受情绪驱动（恐惧时卖出、贪婪时买入）

行为金融研究者发现，散户投资者的整体年化亏损约在 2-4% 之间，主要被交易成本和错误的择时消耗。这部分亏损，是量化策略最重要的 $\alpha$ 来源之一。

被动型机构

听起来矛盾，但确实存在。养老金、共同基金等“被动”机构，其投资决策往往受到以下约束：

合规要求（如持仓上限、禁止做空）
流动性要求（赎回压力）
代理问题（管理费与业绩不完全挂钩）

这些约束让他们在面对明显错误定价时，无法或不愿迅速纠偏。这为不受类似约束的量化基金创造了 $\alpha$ 窗口。

其他量化策略

这是最残酷的部分：你赚的 $\alpha$，很可能正是另一个量化策略亏的 $\alpha$。

当两个策略在相近的因子空间中运作时，它们实际上在进行一场“抢椅子”游戏——在信息扩散足够快、参与者足够多之后，这个游戏必然有人输。

四、Alpha 为什么衰减：因子拥挤的机制

4.1 从 Alpha 到因子

在现代量化投资中，$\alpha$ 通常不以其原始形式存在，而是被封装为“因子”。

因子是衡量资产某种特征的数值：

价值因子：账面市值比、市盈率的倒数
动量因子：过去 N 个月的收益率
质量因子：ROE、资产周转率等盈利质量指标
规模因子：市值的大小

当一个因子被识别并可以被交易时，它就成为了可量化的 $\alpha$ 源。一个经典的五因子模型可以表示为：

$$R_i - R_f = \alpha_i + \beta_{mkt}(R_m - R_f) + \beta_{SMB}SMB + \beta_{HML}HML + \beta_{MOM}MOM + \beta_{RMW}RMW + \beta_{CMA}CMA + \epsilon_i$$

当这个方程中的 $\alpha$ 持续显著不为零，市场会注意到，资本会涌入，直到 $\alpha$ 消失。

4.2 因子拥挤的三阶段衰减

因子拥挤（Fator Crowding）是 $\alpha$ 衰减的核心机制。这个过程通常经历三个阶段：

第一阶段：发现与验证（Discovery & Validation）

学术研究或行业实践发现了一个新的 $\alpha$ 源。最初只有少数人知道：

回测结果显著
小规模实盘验证成功
资金量小，对市场影响可忽略

这个阶段的 $\alpha$ 最纯粹，但大多数人接触不到。

第二阶段：扩散与放大（Diffusion & Amplification）

消息开始在量化社区传播。更多资金开始涌入：

追随该因子的基金数量增加
资金规模放大
原本边缘的价差开始被压缩

这是 $\alpha$ 快速衰减的开始。回测收益与实盘收益的差距开始扩大（这是回撤最常被引用的原因，但根本原因是拥挤，不是过拟合）。

第三阶段：均值回归或彻底失效（Mean Reversion or Collapse）

两个可能的结果：

结果	机制	例子
均值回归	过度拥挤后资金撤出， $\alpha$ 恢复到合理水平	2015 年后的小市值因子
彻底失效	因子结构被永久性破坏	2007 年后的市场中性因子

彻底失效往往发生在因子依赖的行为偏差被参与者学习之后。 当足够多的人知道“散户会在某个点恐慌卖出”，专业参与者就会提前行动，直到这个模式本身消失。

4.3 数据可视化：因子生命周期

收益水平
   ↑
   │         ······ ← 因子生命周期曲线
   │      ··      ·
   │    ··          ··  ← 衰减加速期（拥挤信号）
   │  ··              ·
   │··                  ·
   │·                    ·
   ··                     ·· ← 新因子发现
   ····························→ 时间
   t₀   t₁   t₂   t₃   t₄   t₅

真实的因子收益曲线往往不是平滑下降的。在某个临界点（通常是 t₂），拥挤达到阈值，收益会出现断崖式下跌。这个临界点的触发因素通常是：

宏观事件（流动性危机打断了杠杆资金）
监管变化（禁止某种交易策略）
因子相关性崩溃（原本不相关的因子开始同涨同跌）

五、信息扩散与市场学习

5.1 知识的传播路径

$\alpha$ 衰减的速度，本质上取决于信息扩散（Information Diffusion）的速度。

在量化领域，一个新发现的 $\alpha$ 源会沿着以下路径扩散：

学术论文 → 顶级量化会议 → 
    ↓
机构研报 → 量化社区讨论 → 
    ↓
开源实现 → 散户跟单 → 
    ↓
市场饱和 → Alpha 消失 → 
    ↓
研究者寻找新因子（循环）

这个路径在 2000 年代需要数年才能走完。随着学术出版加速、量化社区扩大、云计算降低门槛，现在可能只需要几个月。

数据支撑：根据 AQR Capital 的研究，经典的动量因子在 1960 年代-1990 年代持续有效，但 2000 年后其 Sharpe Ratio 下降了约 60%。价值因子也有类似趋势。

5.2 市场学习的博弈论

从博弈论视角，市场是一个不断演进的博弈：

第一阶段：少数人知道某个 $\alpha$ 源，大肆利用
第二阶段：更多人发现，市场开始自我纠偏
第三阶段：错误定价消失，$\alpha$ 归零
第四阶段：新的 $\alpha$ 源在别处出现（或者旧的以新形式出现）

这是一个“囚徒困境”的变体：每个参与者都有动机利用 $\alpha$，但所有人的利用都在侵蚀 $\alpha$。

解决方案理论上存在（参与者协调、默契协议），但实践中几乎不可能。因为：

不存在中央协调机构
背叛的诱惑始终存在
参与者数量太多且匿名

5.3 智能时代的加速效应

大语言模型和 AI 工具的普及，正在以前所未有的速度压缩信息扩散路径。

一个典型的例子：

传统模式	AI 加速模式
研究员手动回测一个因子需要 1-2 周	AI 可以在几分钟内完成初步验证
学术论文发表周期 6-12 个月	AI 可以在 24 小时内总结并生成代码框架
策略需要手动实现和调试	AI 可以生成可直接回测的代码
只有专业团队能参与	个人开发者借助 AI 可以快速入场

这意味着：

$\alpha$ 的发现速度在提升
$\alpha$ 的衰减速度也在提升
两者的差距（$\alpha$ 的有效窗口）在缩短

对于量化从业者，这是一个警钟：过去需要 3-5 年的因子生命周期，现在可能只有 12-18 个月。

六、$\alpha$ 的真正来源：超越因子

理解了 $\alpha$ 的来源、归属与衰减后，我们可以重新思考一个问题：在因子如此拥挤的市场，真正的 $\alpha$ 在哪里？

答案是：$\alpha$ 存在于市场的结构性盲区中。这些盲区通常有以下特征：

6.1 执行层面的 Alpha

不是“买什么”，而是“怎么买”。

同样的策略，不同的执行方式会导致截然不同的结果：

订单拆分算法（VWAP、TWAP）vs 大单冲击
滑点控制 vs 被动成交
跨市场延迟套利

执行层面的 $\alpha$ 往往是 $10^{-4}$ 到 $10^{-3}$ 级别，积少成多，且不依赖于市场错误定价，因此更难被复制。

6.2 另类数据中的 Alpha

当公开数据被充分挖掘后，$\alpha$ 的下一个前沿是另类数据（Alternative Data）：

数据类型	例子	Alpha 来源
卫星图像	停车场车辆数量 → 零售额预测	领先财务披露
信用卡数据	消费趋势聚合	行业层面基本面
社交媒体情绪	推文情感 → 股价短期波动	情绪逆转信号
供应链数据	物流信息 → 库存周期	需求拐点识别

另类数据的壁垒在于：获取成本高、处理复杂、且同样面临拥挤问题。

6.3 组合层面的 Alpha

因子是公开知识，但因子权重不是。

即使两个策略使用完全相同的因子，组合构建方法（权重优化、风险预算、相关性管理）仍然可以创造差异化收益。

这是为什么很多量化基金的核心竞争力不是“发现新因子”，而是持续迭代其组合优化算法。

七、实践启示

7.1 对量化从业者的建议

因子尽调要充分：当你发现一个看似有效的因子，先假设它已经拥挤，再寻找反证。
关注换手率变化：因子拥挤的早期信号，是相关交易的换手率系统性提升。
执行成本优先于预测精度：在高频场景，一个好的算法可能比一个差的因子更有价值。
持续迭代而非一劳永逸：没有任何 $\alpha$ 可以永远有效，建立持续研发的系统比押注单一因子更可靠。

7.2 对个人投资者的建议

警惕“一招鲜”策略：如果某个方法被公开兜售超过 1 年，其 $\alpha$ 大概率已经大幅衰减。
低成本指数基金：对于没有量化能力的投资者，被动指数投资的长期夏普比率可能高于追逐 $\alpha$ 的主动交易。
理解自己的角色：如果你在市场中发现了一个 $\alpha$，先问自己：是真实的非有效性，还是噪音？

结语

回到开篇的问题：你赚的钱，是谁亏的？

答案是：可能是散户的错误择时，可能是另一个策略的错误押注，也可能是未来某个时点的自己。

而 Alpha 为什么衰减？

答案是：因为市场会学习，知识会扩散，资本会涌向任何可持续的超额收益。直到 $\alpha$ 归零，新的非有效性在别处诞生。

这不是虚无主义，而是市场的本质特征。理解这一点不是为了放弃，而是为了更清醒地参与：

$\alpha$ 永远存在，但它永远在移动。

找到它的位置，比守在原地更重要。

风险提示：本文不构成任何投资建议。市场有风险，投资需谨慎。历史收益不代表未来表现，任何策略都存在亏损可能。

如果你对量化思维、市场微观结构或 TickDB 的数据能力感兴趣，欢迎继续阅读我们的其他文章。