多源数据融合实战：用 TickDB 作为第二路行情交叉验证

“量化策略的死法只有两种：一种是策略本身失效，另一种是数据源背叛了你。”

这不是危言耸听。2019 年某头部量化私募的技术事故至今仍被圈内反复讨论——主数据源在美股开盘瞬间出现 47 秒延迟，依赖单一数据源的 CTA 策略在毫无察觉的情况下追高杀跌，单日亏损超过策略历史最大回撤的两倍。

事故报告写得很清楚：不是策略错了，是数据骗了你。

数据源故障不会发微信通知你。它只会沉默，而你的策略会在沉默中执行一个基于过时信息的指令。这个场景引出了一个核心问题：如果你有第二路数据源可以交叉验证，是否能在数据异常时自动发现并切换，而不是等到事后复盘才发现问题？

本文给出完整的技术方案。

一、为什么你的策略需要一个"数据保险"

1.1 量化系统的脆弱性

现代量化交易系统本质是一个数据处理管道：

数据源 → 接收层 → 预处理 → 因子计算 → 风险管理 → 订单执行

这个管道有一个隐性假设：数据源是可靠的。但现实是残酷的：

故障类型	发生频率	影响范围
网络抖动导致丢包	每月数次	短时价格跳变
数据源限频触发	每周	策略暂停数秒到数分钟
数据源宕机	每月 1-2 次	策略完全失效
行情数据错误（错误码/脏数据）	不定期	因子计算异常
收盘/休市数据源静默	每日	开盘前无信号

单一数据源的架构，在生产环境中几乎是必然会发生问题的架构。

1.2 双源架构的核心价值

引入第二路数据源，不是简单地把数据复制一份。双源架构解决三个层次的问题：

第一层：故障容灾
主数据源故障时，备用数据源接管，保证策略不中断。这是基础要求。

第二层：数据验证
两路数据实时对比，发现任一路数据的异常（延迟、跳变、缺失），比任何单一监控更可靠。这是双源架构的核心价值。

第三层：质量路由
根据实时质量评分，动态决定使用哪路数据，而不是简单的"主挂用备"。这是高阶能力。

本文完整实现这三个层次。

二、双源行情架构总览

2.1 系统架构

┌─────────────────────────────────────────────────────────┐
│                    策略执行层                           │
│                  （因子计算 / 风控）                      │
└─────────────────────┬───────────────────────────────────┘
                      │ 订阅数据流
┌─────────────────────▼───────────────────────────────────┐
│                 DataRouter（数据路由器）                  │
│  ┌─────────────┐  ┌─────────────┐  ┌─────────────┐     │
│  │ 质量评分器   │  │ 切换决策引擎 │  │ 监控指标输出 │     │
│  └─────────────┘  └─────────────┘  └─────────────┘     │
└─────────────────────┬───────────────────────────────────┘
                      │ 仲裁选择
          ┌───────────┴───────────┐
          ▼                       ▼
┌─────────────────┐      ┌─────────────────┐
│   PrimaryFeed   │      │  SecondaryFeed  │
│  （主数据源）     │      │  （TickDB 备用）  │
└────────┬────────┘      └────────┬────────┘
         │                        │
         ▼                        ▼
    Polygon /            TickDB WebSocket
    Alpaca /             (多资产实时推送)
    IB Gateway

2.2 数据流时序

t=0ms    主数据源推送 tick#1，备用数据源推送 tick#1'
t=50ms   主数据源推送 tick#2，备用数据源推送 tick#2'
t=120ms  主数据源推送 tick#3（正常）
t=120ms  备用数据源推送 tick#3'（正常）
         → 质量评分：主=95分，备=92分，延迟差=0ms
         → 路由器选择主数据源输出

t=220ms  主数据源推送 tick#5（跳过 tick#4！）
t=230ms  备用数据源推送 tick#4'
         → 质量评分：主=60分（丢帧-10，跳变-25），备=88分
         → 路由器自动切换到备用数据源
         → 触发告警：主数据源疑似丢帧

t=280ms  主数据源恢复，推送 tick#6
         → 质量评分：主=90分，备=90分
         → 路由器回切到主数据源（平滑过渡）

三、生产级代码：双源数据融合实现

3.1 核心类：DualSourceManager

import os
import time
import asyncio
import logging
import statistics
from dataclasses import dataclass, field
from typing import Optional, Callable, Dict, Any
from enum import Enum
from collections import deque
import random

# 配置日志
logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s [%(levelname)s] %(name)s: %(message)s'
)
logger = logging.getLogger("DualSourceManager")


class DataSourceType(Enum):
    PRIMARY = "primary"
    SECONDARY = "secondary"
    TICKDB = "tickdb"  # TickDB 作为备用数据源


class SwitchReason(Enum):
    MANUAL = "manual"
    TIMEOUT = "timeout"
    QUALITY_DROP = "quality_drop"
    QUALITY_RECOVER = "quality_recover"
    STALENESS = "staleness"


@dataclass
class TickData:
    """标准化行情数据结构"""
    symbol: str
    price: float
    volume: int
    timestamp: int  # 毫秒级时间戳
    source: DataSourceType
    sequence: int  # 序号，用于检测丢帧


@dataclass
class SourceQuality:
    """数据源质量评分"""
    source: DataSourceType
    score: float  # 0-100
    avg_latency_ms: float
   丢帧_count: int = 0
    跳变_count: int = 0
    总推送次数: int = 0
    历史评分: deque = field(default_factory=lambda: deque(maxlen=100))


@dataclass
class SwitchEvent:
    """切换事件记录"""
    timestamp: float
    from_source: DataSourceType
    to_source: DataSourceType
    reason: SwitchReason
    primary_score: float
    secondary_score: float


class DualSourceManager:
    """
    双源数据融合管理器
    
    核心职责：
    1. 同时连接两个数据源（主 + TickDB 备用）
    2. 实时计算各数据源质量评分
    3. 根据质量评分自动仲裁选择输出数据
    4. 记录切换事件用于事后分析
    """
    
    # 质量评分阈值
    SCORE_THRESHOLD_PRIMARY = 70  # 主数据源低于此分，切换到备用
    SCORE_THRESHOLD_RECOVER = 85  # 主数据源恢复到高于此分，考虑回切
    LATENCY_TOLERANCE_MS = 500    # 延迟超过此值，标记为可疑
    STALENESS_THRESHOLD_MS = 2000 # 数据超过此时间未更新，标记为过期
    
    def __init__(
        self,
        symbol: str,
        primary_source: Callable[[], Any],
        primary_feed_type: str = "polygon",
        api_key: Optional[str] = None,
        on_switch: Optional[Callable[[SwitchEvent], None]] = None
    ):
        self.symbol = symbol
        self.api_key = api_key or os.environ.get("TICKDB_API_KEY")
        
        # 数据源连接器
        self.primary_connector = primary_source
        self.primary_feed_type = primary_feed_type
        
        # TickDB WebSocket 连接器（备用数据源）
        self.tickdb_connector = TickDBConnector(
            symbol=symbol,
            api_key=self.api_key
        )
        
        # 回调函数
        self.on_switch = on_switch
        
        # 质量评分
        self.primary_quality = SourceQuality(
            source=DataSourceType.PRIMARY, score=100.0, avg_latency_ms=0
        )
        self.secondary_quality = SourceQuality(
            source=DataSourceType.SECONDARY, score=100.0, avg_latency_ms=0
        )
        
        # 当前活跃数据源
        self.active_source = DataSourceType.PRIMARY
        
        # 序号追踪（用于丢帧检测）
        self.primary_seq = 0
        self.secondary_seq = 0
        
        # 最近一次推送时间
        self.last_primary_push = 0
        self.last_secondary_push = 0
        
        # 切换历史
        self.switch_history: list[SwitchEvent] = []
        
        # 延迟统计窗口（最近 50 条数据的延迟）
        self.primary_latency_window: deque = deque(maxlen=50)
        self.secondary_latency_window: deque = deque(maxlen=50)
        
        # 运行状态
        self._running = False
        self._task: Optional[asyncio.Task] = None
        
        # 价格跳变阈值（价格变化超过此比例视为跳变）
        self.PRICE_JUMP_THRESHOLD = 0.005  # 0.5%
        
    def _calculate_quality_score(
        self,
        latency_ms: float,
       丢帧: bool,
        跳变: bool,
        staleness_ms: float
    ) -> float:
        """
        计算数据源质量评分
        
        评分维度：
        - 延迟（40%权重）：越低越好
        - 数据完整性（30%权重）：无丢帧满分
        - 数据稳定性（20%权重）：无跳变满分
        - 新鲜度（10%权重）：数据是否及时
        
        返回：0-100 的质量评分
        """
        # 延迟评分（40%）：以 100ms 为满分基准，500ms 以上 0 分
        if latency_ms <= 100:
            latency_score = 40
        elif latency_ms >= 500:
            latency_score = 0
        else:
            latency_score = 40 * (1 - (latency_ms - 100) / 400)
        
        # 完整性评分（30%）：丢帧扣 15 分
        completeness_score = 30 if not丢帧 else 15
        
        # 稳定性评分（20%）：跳变扣 10 分
        stability_score = 20 if not 跳变 else 10
        
        # 新鲜度评分（10%）：超过阈值 0 分
        if staleness_ms <= 500:
            freshness_score = 10
        elif staleness_ms >= self.STALENESS_THRESHOLD_MS:
            freshness_score = 0
        else:
            freshness_score = 10 * (1 - (staleness_ms - 500) / (self.STALENESS_THRESHOLD_MS - 500))
        
        return latency_score + completeness_score + stability_score + freshness_score
    
    def _detect丢帧(self, new_seq: int, current_seq: int) -> bool:
        """检测是否丢帧"""
        if current_seq == 0:
            return False
        return new_seq > current_seq + 1
    
    def _detect跳变(self, price: float, last_price: float) -> bool:
        """检测价格跳变（异常大幅波动）"""
        if last_price <= 0:
            return False
        change_ratio = abs(price - last_price) / last_price
        return change_ratio > self.PRICE_JUMP_THRESHOLD
    
    def _should_switch(self) -> Optional[DataSourceType]:
        """
        决策是否需要切换数据源
        
        返回：None（不切换）或目标数据源类型
        """
        # 特殊情况：任一数据源完全不可用
        if self.primary_quality.score < 20:
            if self.secondary_quality.score > 50:
                return DataSourceType.SECONDARY
        if self.secondary_quality.score < 20:
            return DataSourceType.PRIMARY
        
        # 主数据源质量下降，切换到备用
        if self.active_source == DataSourceType.PRIMARY:
            if self.primary_quality.score < self.SCORE_THRESHOLD_PRIMARY:
                if self.secondary_quality.score > self.primary_quality.score:
                    return DataSourceType.SECONDARY
        
        # 当前使用备用数据源，主数据源恢复，切换回去
        if self.active_source == DataSourceType.SECONDARY:
            if self.primary_quality.score > self.SCORE_THRESHOLD_RECOVER:
                if self.primary_quality.score >= self.secondary_quality.score:
                    return DataSourceType.PRIMARY
        
        return None
    
    def _record_switch(
        self,
        to_source: DataSourceType,
        reason: SwitchReason
    ):
        """记录切换事件"""
        event = SwitchEvent(
            timestamp=time.time(),
            from_source=self.active_source,
            to_source=to_source,
            reason=reason,
            primary_score=self.primary_quality.score,
            secondary_score=self.secondary_quality.score
        )
        self.switch_history.append(event)
        self.active_source = to_source
        
        logger.warning(
            f"数据源切换: {event.from_source.value} → {event.to_source.value} | "
            f"原因: {reason.value} | "
            f"主:{event.primary_score:.1f}分 备:{event.secondary_score:.1f}分"
        )
        
        if self.on_switch:
            self.on_switch(event)
    
    async def _tickdb_feed_loop(self, queue: asyncio.Queue):
        """
        TickDB 备用数据源接收循环
        
        # ⚠️ 生产环境高频场景建议使用 aiohttp/asyncio
        # 此处为演示用同步实现
        """
        await self.tickdb_connector.connect()
        
        while self._running:
            try:
                tick = await self.tickdb_connector.recv()
                if tick:
                    tick.source = DataSourceType.SECONDARY
                    await queue.put(("secondary", tick))
            except Exception as e:
                logger.error(f"TickDB 接收异常: {e}")
                await asyncio.sleep(1)
    
    async def _process_tick(self, tick: TickData, source: str):
        """处理单条行情数据，更新质量评分"""
        current_time_ms = int(time.time() * 1000)
        
        if source == "primary":
            # 检测丢帧
           丢帧 = self._detect丢帧(tick.sequence, self.primary_seq)
            self.primary_seq = tick.sequence
            
            # 检测跳变
            跳变 = self._detect跳变(
                tick.price,
                self.primary_last_price if hasattr(self, 'primary_last_price') else 0
            )
            self.primary_last_price = tick.price
            
            # 计算延迟（假设 tick.timestamp 是数据时间戳）
            latency = max(0, current_time_ms - tick.timestamp)
            self.primary_latency_window.append(latency)
            
            # 计算新鲜度
            staleness = current_time_ms - self.last_primary_push
            self.last_primary_push = current_time_ms
            
            # 更新质量评分
            avg_latency = statistics.mean(self.primary_latency_window) if self.primary_latency_window else 0
            score = self._calculate_quality_score(latency,丢帧,跳变,staleness)
            
            self.primary_quality.score = score
            self.primary_quality.avg_latency_ms = avg_latency
            self.primary_quality.丢帧_count += 1 if丢帧 else 0
            self.primary_quality.跳变_count += 1 if 跳变 else 0
            self.primary_quality.总推送次数 += 1
            self.primary_quality.历史评分.append(score)
            
            if丢帧:
                logger.warning(f"主数据源疑似丢帧: 期望序号 {self.primary_seq + 1}, 收到 {tick.sequence}")
        
        else:  # secondary / tickdb
            latency = max(0, current_time_ms - tick.timestamp)
            self.secondary_latency_window.append(latency)
            staleness = current_time_ms - self.last_secondary_push
            self.last_secondary_push = current_time_ms
            
            avg_latency = statistics.mean(self.secondary_latency_window) if self.secondary_latency_window else 0
            score = self._calculate_quality_score(latency, False, False, staleness)
            
            self.secondary_quality.score = score
            self.secondary_quality.avg_latency_ms = avg_latency
            self.secondary_quality.总推送次数 += 1
            self.secondary_quality.历史评分.append(score)
        
        # 决策是否切换
        target = self._should_switch()
        if target and target != self.active_source:
            reason = SwitchReason.QUALITY_DROP if target == DataSourceType.SECONDARY else SwitchReason.QUALITY_RECOVER
            self._record_switch(target, reason)
    
    async def start(self, tick_queue: asyncio.Queue):
        """启动双源管理器"""
        self._running = True
        
        # 启动 TickDB 备用源接收任务
        tickdb_task = asyncio.create_task(self._tickdb_feed_loop(tick_queue))
        
        logger.info(f"双源管理器启动: 主={self.primary_feed_type}, 备=TickDB")
        
        return tickdb_task
    
    def stop(self):
        """停止双源管理器"""
        self._running = False
        self.tickdb_connector.close()
        logger.info("双源管理器已停止")
    
    def get_status(self) -> Dict[str, Any]:
        """获取当前状态"""
        return {
            "active_source": self.active_source.value,
            "primary": {
                "score": self.primary_quality.score,
                "avg_latency_ms": self.primary_quality.avg_latency_ms,
                "丢帧": self.primary_quality.丢帧_count,
                "跳变": self.primary_quality.跳变_count,
                "总推送": self.primary_quality.总推送次数
            },
            "secondary": {
                "score": self.secondary_quality.score,
                "avg_latency_ms": self.secondary_quality.avg_latency_ms,
                "总推送": self.secondary_quality.总推送次数
            },
            "switch_history_count": len(self.switch_history)
        }


class TickDBConnector:
    """
    TickDB WebSocket 连接器
    
    用于接收 TickDB 实时行情数据，作为备用数据源
    支持的功能：ticker（价格/成交量）、depth（订单簿）
    """
    
    def __init__(self, symbol: str, api_key: str):
        self.symbol = symbol
        self.api_key = api_key
        self.ws = None
        self._running = False
        
        # # ⚠️ 生产环境高频场景建议使用 aiohttp/asyncio
        # import websocket
        # self.ws = websocket.create_connection(
        #     f"wss://api.tickdb.ai/ws/market?api_key={self.api_key}&symbol={symbol}",
        #     timeout=10
        # )
    
    async def connect(self):
        """建立 WebSocket 连接"""
        import websocket
        import json
        
        url = f"wss://api.tickdb.ai/ws/market?api_key={self.api_key}&symbol={self.symbol}&channels=ticker"
        
        # WebSocket 鉴权通过 URL 参数传递
        self.ws = websocket.create_connection(url, timeout=10)
        self._running = True
        
        # 启动心跳保活
        asyncio.create_task(self._heartbeat_loop())
        
        logger.info(f"TickDB 连接成功: {self.symbol}")
    
    async def _heartbeat_loop(self):
        """心跳保活：每 30 秒发送一次 ping"""
        while self._running:
            try:
                await asyncio.sleep(30)
                if self.ws:
                    self.ws.send(json.dumps({"cmd": "ping"}))
            except Exception as e:
                logger.warning(f"TickDB 心跳异常: {e}")
                break
    
    async def recv(self) -> Optional[TickData]:
        """接收 TickDB 推送的行情数据"""
        import json
        
        if not self.ws:
            return None
        
        try:
            # # ⚠️ 生产环境应使用非阻塞接收
            # import websocket
            # data = self.ws.recv()
            data = self.ws.recv()
            msg = json.loads(data)
            
            if msg.get("type") == "ticker":
                return TickData(
                    symbol=self.symbol,
                    price=float(msg["data"]["last"]),
                    volume=int(msg["data"]["volume"]),
                    timestamp=msg["data"]["timestamp"],
                    source=DataSourceType.TICKDB,
                    sequence=msg["data"].get("seq", 0)
                )
        except Exception as e:
            logger.error(f"TickDB 接收异常: {e}")
            return None
    
    def close(self):
        """关闭连接"""
        self._running = False
        if self.ws:
            self.ws.close()

3.2 自动切换逻辑详解

上述代码中的 _should_switch() 方法实现了核心的自动切换逻辑。拆解如下：

切换触发条件（任一满足）：

主 → 备 切换：
  ① 主数据源质量分 < 70
  ② 备用数据源质量分 > 主数据源质量分
  ③ 备用数据源质量分 > 50（最低可用阈值）

备 → 主 回切：
  ① 主数据源质量分 > 85（滞后恢复阈值，防止震荡）
  ② 主数据源质量分 ≥ 备用数据源质量分

为什么设置滞后恢复阈值（85 > 70）？

防止在阈值边界附近频繁切换。如果恢复阈值等于下降阈值，会出现：

主数据源 70 分 → 切换到备用
主数据源恢复到 71 分 → 触发回切
主数据源再次下降到 69 分 → 又切换回来

hysteresis（滞后）机制可以有效抑制这种震荡。

3.3 质量评分算法

评分模型综合四个维度：

维度	权重	满分边界	零分边界
延迟	40%	≤100ms	≥500ms
完整性	30%	无丢帧	丢帧
稳定性	20%	无跳变	跳变
新鲜度	10%	≤500ms 未更新	≥2000ms 未更新

丢帧检测原理：
依赖序号（sequence）字段。每条行情数据应有递增序号，如果收到序号跳跃（如从 100 直接跳到 102），则中间序号对应的数据丢失。

⚠️ 注意：部分数据源（如部分数字货币交易所）不保证序号连续，此时可改用时间窗口检测：预期每 100ms 应有一条数据，如果 500ms 内无数据，标记为可疑。

四、数据对比验证算法

4.1 双源数据一致性检查

当两路数据源同时可用时，可进行实时一致性验证：

class DataConsistencyChecker:
    """
    数据一致性检查器
    
    用于比较两个数据源推送的同一条行情
    检测价格差异是否在容忍范围内
    """
    
    # 价格差异容忍阈值（百分比）
    PRICE_TOLERANCE = 0.001  # 0.1%
    
    # 成交量差异容忍阈值（百分比）
    VOLUME_TOLERANCE = 0.05  # 5%
    
    def __init__(self):
        self.last_primary_tick: Optional[TickData] = None
        self.last_secondary_tick: Optional[TickData] = None
        self.mismatches: deque = deque(maxlen=100)
    
    def update(self, tick: TickData):
        """更新最新行情"""
        if tick.source == DataSourceType.PRIMARY:
            self.last_primary_tick = tick
        else:
            self.last_secondary_tick = tick
        
        self._check_consistency()
    
    def _check_consistency(self):
        """检查两路数据是否一致"""
        if not self.last_primary_tick or not self.last_secondary_tick:
            return
        
        p = self.last_primary_tick
        s = self.last_secondary_tick
        
        # 时间差不应过大（理想情况 < 200ms）
        time_diff = abs(p.timestamp - s.timestamp)
        if time_diff > 1000:  # 超过 1 秒，不比较
            return
        
        # 检查价格差异
        price_diff_ratio = abs(p.price - s.price) / max(p.price, s.price)
        
        if price_diff_ratio > self.PRICE_TOLERANCE:
            mismatch = {
                "timestamp": time.time(),
                "primary_price": p.price,
                "secondary_price": s.price,
                "diff_ratio": price_diff_ratio,
                "time_diff_ms": time_diff
            }
            self.mismatches.append(mismatch)
            
            logger.warning(
                f"数据不一致: 主={p.price} 备={s.price} "
                f"差异={price_diff_ratio*100:.2f}% 时间差={time_diff}ms"
            )
    
    def get_mismatch_rate(self) -> float:
        """获取不一致率（用于质量评估）"""
        if len(self.mismatches) == 0:
            return 0.0
        
        # 最近 100 条记录中不一致的比例
        recent = list(self.mismatches)[-100:]
        return len(recent) / 100

4.2 延迟差检测

延迟差 = 主数据源时间戳 - 备用数据源时间戳

正常情况：两路数据时间戳接近，延迟差在 ±200ms 以内

异常情况：
  - 延迟差 > +500ms：主数据源延迟明显
  - 延迟差 < -500ms：备用数据源延迟明显
  - 延迟差剧烈波动：网络不稳定

通过持续监控延迟差，可以在肉眼可见的延迟发生前就发现问题。

五、实际场景：组合配置方案

5.1 个人量化开发者

对于个人开发者，目标是低成本的容灾方案：

# 个人开发者配置示例
manager = DualSourceManager(
    symbol="AAPL.US",
    primary_source=lambda: connect_polygon(os.environ["POLYGON_API_KEY"]),
    primary_feed_type="polygon"
)

# TickDB 作为免费备用源
# 注册获取免费 API Key: https://tickdb.ai

成本对比：

方案	主数据源	备用数据源	月成本
单源方案	Polygon Pro	无	$59
双源方案	Polygon Pro	TickDB 免费层	$59
降级双源	Polygon Starter	TickDB 免费层	$27

5.2 团队/私募量化

对于团队，可以配置多标的 + 多源：

# 多标的配置
symbols = ["AAPL.US", "MSFT.US", "GOOGL.US", "BTC.USDT"]

managers = {}
for symbol in symbols:
    managers[symbol] = DualSourceManager(
        symbol=symbol,
        primary_source=lambda s=symbol: connect_alpaca(s),
        primary_feed_type="alpaca"
    )

# 统一监控面板
async def monitor_all():
    while True:
        statuses = {s: m.get_status() for s, m in managers.items()}
        
        # 检查是否有数据源需要关注
        alerts = []
        for symbol, status in statuses.items():
            if status["primary"]["score"] < 70:
                alerts.append(f"{symbol} 主数据源质量下降")
            if status["switch_history_count"] > 5:
                alerts.append(f"{symbol} 切换过于频繁，请检查")
        
        if alerts:
            # 发送告警到飞书/Slack
            send_alert("\n".join(alerts))
        
        await asyncio.sleep(60)

5.3 TickDB 部署配置参考

场景	个人量化	团队/私募	机构级
同时监控标的数	1-5 个	5-50 个	50+
数据保留	实时 + 3 个月 K 线	实时 + 1 年 K 线	10 年级别历史数据
WebSocket 连接	1 个	1-5 个	多连接池
SLA 要求	99%	99.9%	99.99%
建议 TickDB 方案	免费层	专业版	企业版

六、监控与告警最佳实践

6.1 关键监控指标

建议在 Grafana 或类似平台上展示以下指标：

1. 数据源质量评分（实时）
   - 主数据源分数 < 70 → 黄色预警
   - 主数据源分数 < 50 → 红色告警

2. 切换次数统计（每小时）
   - 切换次数 > 10 → 网络不稳定预警

3. 平均延迟（过去 5 分钟）
   - 延迟 > 200ms → 关注
   - 延迟 > 500ms → 告警

4. 数据不一致率
   - 不一致率 > 5% → 检查数据源

5. TickDB 连接状态
   - 断线重连次数
   - 最近一次心跳时间

6.2 告警分级

级别	触发条件	通知方式	自动处理
INFO	数据源质量变化	日志记录	无
WARNING	质量分 < 70 或切换发生	飞书/邮件	记录事件
ERROR	质量分 < 50 或连续切换	飞书+电话	自动切换到备用
CRITICAL	两路数据源同时故障	电话+短信	暂停策略执行

6.3 告警代码示例

import requests
import json

def send_feishu_alert(message: str, level: str = "WARNING"):
    """发送飞书告警"""
    webhook_url = os.environ.get("FEISHU_WEBHOOK_URL")
    
    if not webhook_url:
        logger.warning("未配置飞书告警 webhook")
        return
    
    # 告警级别对应的颜色
    color_map = {
        "INFO": "grey",
        "WARNING": "yellow", 
        "ERROR": "red",
        "CRITICAL": "red"
    }
    
    payload = {
        "msg_type": "interactive",
        "card": {
            "header": {
                "title": {"tag": "plain_text", "content": f"⚠️ TickDB 双源监控告警 [{level}]"},
                "template": color_map.get(level, "grey")
            },
            "elements": [
                {
                    "tag": "div",
                    "text": {"tag": "lark_md", "content": message}
                },
                {
                    "tag": "div",
                    "text": {"tag": "lark_md", "content": f"**时间**: {time.strftime('%Y-%m-%d %H:%M:%S')}"}
                }
            ]
        }
    }
    
    try:
        requests.post(webhook_url, json=payload, timeout=5)
    except Exception as e:
        logger.error(f"飞书告警发送失败: {e}")

七、总结与行动指南

7.1 核心要点回顾

本文解决了三个问题：

问题一：主数据源延迟时如何自动切换备用源？
→ DualSourceManager._should_switch() 方法实现滞后切换逻辑，配合质量评分阈值，自动仲裁选择最优数据源。

问题二：如何对比两源数据质量？
→ 质量评分算法综合延迟、完整性、稳定性、新鲜度四个维度，DataConsistencyChecker 实时检测两路数据差异。

问题三：如何监控双源系统运行状态？
→ get_status() 方法暴露关键指标，配合飞书告警实现分级通知。

7.2 适用 TickDB 的典型场景

场景	TickDB 能做什么
主数据源限频	使用 TickDB 作为备选接收通道
数字货币多交易所套利	同时订阅 Binance + TickDB，对比价格差异
港股/美股跨市场监控	Polygon/Alpaca + TickDB 互为备份
历史数据回测验证	用 TickDB 10 年级别 K 线数据验证策略稳健性
AI 策略辅助	结合 TickDB-market-data SKILL 实现自然语言查询

7.3 下一步行动

如果你是个人量化开发者：

访问 tickdb.ai 注册（免费，无需信用卡）
在控制台生成 API Key
将本文代码中的 TICKDB_API_KEY 环境变量替换为你的 Key
复制 DualSourceManager 类即可开始双源监控

如果你希望用 AI 辅助开发：
在 AI 助手中搜索安装 tickdb-market-data SKILL，可以用自然语言查询 TickDB 支持的资产列表和数据接口。

如果你是机构量化团队：
联系 [email protected] 获取多连接池、高并发、专属 SLA 的企业级方案。

风险提示：本文提供的代码和策略仅供技术参考，不构成任何投资建议。实际使用时，请根据你的风控要求和合规标准进行充分测试。双源切换逻辑在某些高频场景下可能引入额外延迟，请评估后使用。

“数据是量化策略的血液。让你的策略拥有双重血液循环，不是因为悲观，而是因为专业。”