削峰填谷：生产者-消费者模式下的行情分发架构

凌晨 3:47，美股期货夜盘开盘。

前一秒订单簿还波澜不惊，下一秒——英伟达盘后财报超预期，机构算法在 200 毫秒内完成了从「数据接收到订单成交」的全流程。你的策略刚刚收到第一条推送，队列里已经堆了 1,247 条待处理的行情消息。

这不是技术故障，这是速度战争中的结构性劣势。

行情数据的到达速率从来不是恒定的。财报发布、央行决议、流动性收紧——任何事件驱动场景下，数据流都会呈现「脉冲式爆发」的特征。而策略处理的耗时是相对稳定的（网络 I/O、计算、信号判断）。当 produce_rate >> consume_rate 时，系统只有两条路：要么丢弃数据，要么被淹没。

这篇文章拆解一个经过实盘验证的解决方案：生产者-消费者模式下的异步队列架构。我们将用 asyncio.Queue 作为核心组件，实现背压控制和多 worker 协作，让系统在流量洪峰中依然保持稳定。

一、问题的本质：速度不匹配的三层影响

在进入架构设计之前，我们需要精确理解「行情数据到达速度 > 策略处理速度」会造成什么后果。

1.1 数据积压

每条行情消息都需要被处理，但如果处理速度跟不上，数据会堆积在内存中。典型的内存增长曲线：

时间 (秒)     待处理队列长度     内存占用
0            0                  12 MB
5            3,200               48 MB
15           18,500              210 MB
30           47,000              890 MB

在高频事件驱动场景下，队列积压会以指数级速度增长。一台 8GB 内存的服务器，在 30 秒内就可能接近 OOM 阈值。

1.2 延迟累积

数据积压的直接后果是处理延迟不断累积。队列中的第 10,000 条消息可能在队列中等待超过 2 秒才被处理——对于需要捕捉瞬间价差的策略，这个延迟意味着信号失效。

# 延迟累积示意（非真实代码）
def process_message(msg, queue_position):
    # 假设每条消息平均处理耗时 5ms
    estimated_delay = queue_position * 0.005  # 秒
    
    # 当队列积压 2000 条时，最旧的消息已有 10 秒延迟
    # 而价差机会的生命周期往往只有几百毫秒
    return estimated_delay

1.3 系统崩溃

当积压超过系统容量临界点，可能触发两种失效模式：

OOM 崩溃：内存耗尽触发 OOM Killer
调度崩溃：Python GIL + 大量等待任务导致事件循环阻塞

二、解决方案：生产者-消费者模式

2.1 核心思想

生产者-消费者模式将数据流解耦为两个独立阶段：

Producer (数据源) → [Queue] → Consumer (处理者)

生产者负责快速接收数据并放入队列，不关心下游处理速度
消费者从队列中拉取任务，按自己的节奏处理
队列作为缓冲区，在流量高峰时蓄水，在流量低谷时放水

这个模式解决了三个核心问题：

问题	解决方案
速度不匹配	队列作为缓冲，生产者和消费者解耦
系统过载	队列容量限制 + 背压控制
扩展性	多消费者并行处理

2.2 为什么选择 asyncio.Queue

Python 生态中，实现生产者-消费者模式有多种选择：

方案	适用场景	与 TickDB 的兼容性
`multiprocessing.Queue`	CPU 密集型任务	需要跨进程通信，复杂
`threading.Queue`	CPU 密集型 + GIL 释放点	线程开销大，高并发场景不推荐
`asyncio.Queue`	I/O 密集型任务（网络请求、API 调用）	最佳选择，与异步事件循环天然契合
`celery` + RabbitMQ	分布式任务队列	过度工程化，单机场景冗余

asyncio.Queue 的优势在于：

零拷贝上下文切换：在同一个事件循环中，无需加锁或进程间通信
协程级调度：可以暂停等待而不阻塞整个线程
原生支持有界队列：可以设置 maxsize，实现背压控制
与异步 HTTP 客户端（aiohttp）无缝集成

三、asyncio.Queue 核心机制

3.1 基础 API

import asyncio

# 创建有界队列，maxsize=1000 意味着队列最多存储 1000 条消息
# 当队列满时，put() 操作会阻塞（这正是背压控制的基础）
queue = asyncio.Queue(maxsize=1000)

# 生产者：放入数据
async def producer():
    while True:
        data = await fetch_market_data()  # 异步获取数据
        await queue.put(data)  # 队列满时会阻塞直到有空间

# 消费者：从队列取数据
async def consumer():
    while True:
        data = await queue.get()  # 队列空时会阻塞直到有数据
        await process_strategy(data)
        queue.task_done()  # 标记任务完成

3.2 关键参数：maxsize

maxsize 是实现背压控制的核心参数。

# 无界队列：危险
queue = asyncio.Queue()  # 无限膨胀，内存风险

# 有界队列：安全
queue = asyncio.Queue(maxsize=5000)  # 队列满时 put() 阻塞

背压机制的工作原理：

生产速率 > 消费速率
    ↓
队列逐渐填满
    ↓
队列达到 maxsize
    ↓
put() 阻塞（生产者暂停）
    ↓
消费继续进行
    ↓
队列有空位
    ↓
put() 恢复

这意味着数据源会被迫降低接收速度，与下游处理能力匹配。系统不会崩溃，只是以更慢的速率处理新数据。

3.3 等待模式：get vs get_nowait

# 标准方式：队列空时自动等待
data = await queue.get()

# 非阻塞方式：队列空时立即抛出 QueueEmpty
try:
    data = queue.get_nowait()
except asyncio.QueueEmpty:
    # 立即处理其他事务，而不是阻塞等待
    pass

在生产级代码中，通常组合使用：

await queue.get() 在主循环中等待新数据
get_nowait() 在事件处理间隙做轮询检查

四、背压控制：从理论到实现

4.1 背压的三层设计

一个健壮的行情分发系统需要在三个层面实施背压控制：

层级	控制对象	实现方式
队列层	消息积压量	`asyncio.Queue(maxsize)`
生产者层	数据源拉取速度	协程暂停 + 重试策略
消费者层	并行处理能力	worker 数量动态调整

4.2 生产者侧背压

当 TickDB 的 WebSocket 推送速度超过本地处理能力时，单纯的队列缓冲只是将问题延迟。我们需要在数据源侧实现主动降速：

class BackpressureProducer:
    def __init__(self, queue: asyncio.Queue, max_retry: int = 3):
        self.queue = queue
        self.max_retry = max_retry
        self.consecutive_blocks = 0
        
    async def put_with_backpressure(self, data):
        """
        带背压感知的消息推送
        
        机制：
        1. 尝试放入队列
        2. 如果队列满（触发 Full 异常），记录阻塞次数
        3. 根据阻塞次数动态调整等待时间
        """
        retry_count = 0
        while retry_count < self.max_retry:
            try:
                # 非阻塞放入，队列满时立即抛出 Full
                self.queue.put_nowait(data)
                self.consecutive_blocks = 0  # 成功后重置计数
                return True
                
            except asyncio.QueueFull:
                retry_count += 1
                self.consecutive_blocks += 1
                
                # 指数退避策略：阻塞次数越多，等待时间越长
                # 避免在临界状态下疯狂重试
                backoff = min(0.1 * (2 ** self.consecutive_blocks), 5.0)
                await asyncio.sleep(backoff)
                
        # 超过最大重试次数，记录告警日志
        logger.warning(
            f"Queue backpressure: failed to put after {self.max_retry} retries. "
            f"Consecutive blocks: {self.consecutive_blocks}"
        )
        return False

4.3 监控指标

背压系统的有效性需要可观测性支撑。以下是关键监控指标：

class BackpressureMonitor:
    """背压监控器，暴露关键指标供监控告警使用"""
    
    def __init__(self):
        self.blocked_puts = 0
        self.total_puts = 0
        self.avg_queue_size = 0
        self.samples = 0
        
    def record_put(self, blocked: bool, queue_size: int):
        self.total_puts += 1
        if blocked:
            self.blocked_puts += 1
        self.samples += 1
        # 移动平均计算队列大小
        self.avg_queue_size = (
            (self.avg_queue_size * (self.samples - 1) + queue_size) / self.samples
        )
    
    @property
    def block_rate(self) -> float:
        """阻塞率：衡量系统压力"""
        if self.total_puts == 0:
            return 0.0
        return self.blocked_puts / self.total_puts
    
    @property
    def pressure_level(self) -> str:
        """压力等级：用于告警阈值判断"""
        if self.block_rate < 0.01:
            return "NORMAL"
        elif self.block_rate < 0.1:
            return "ELEVATED"
        elif self.block_rate < 0.3:
            return "WARNING"
        else:
            return "CRITICAL"

五、多 Worker 架构

5.1 为什么需要多个消费者

单个消费者的处理能力有上限：

async def single_consumer(queue):
    while True:
        data = await queue.get()
        result = await process_strategy(data)  # 假设耗时 10ms
        queue.task_done()
        # 理论最大吞吐量：100 条/秒

当单 worker 吞吐量不足时，我们需要横向扩展消费者数量：

async def multi_workers_demo():
    queue = asyncio.Queue(maxsize=5000)
    
    # 启动 4 个 worker 并发处理
    workers = [
        asyncio.create_task(consumer_worker(queue, worker_id=i))
        for i in range(4)
    ]
    
    # 理论上最大吞吐量：400 条/秒
    await asyncio.gather(*workers)

5.2 Worker 池模式

在实际生产环境中，worker 数量需要根据系统负载动态调整。设计一个自适应的 Worker 池：

import asyncio
from dataclasses import dataclass, field
from typing import Optional
import logging

logger = logging.getLogger(__name__)


@dataclass
class WorkerPool:
    """
    自适应 Worker 池
    
    根据队列积压情况动态调整 worker 数量
    - 队列积压 > 70% maxsize：增加 worker
    - 队列积压 < 20% maxsize：减少 worker
    - 始终保持 min_workers 个 worker 运行
    """
    queue: asyncio.Queue
    min_workers: int = 2
    max_workers: int = 8
    scale_up_threshold: float = 0.7  # 积压超过 70% 时扩容
    scale_down_threshold: float = 0.2  # 积压低于 20% 时缩容
    check_interval: float = 5.0  # 每 5 秒检查一次
    
    _workers: set = field(default_factory=set)
    _lock: asyncio.Lock = field(default_factory=asyncio.Lock)
    _running: bool = False
    
    async def start(self):
        """启动 worker 池管理循环"""
        self._running = True
        
        # 初始启动最小数量
        for i in range(self.min_workers):
            await self._spawn_worker(i)
        
        # 启动自适应调度循环
        asyncio.create_task(self._autoscale_loop())
    
    async def stop(self):
        """优雅关闭所有 worker"""
        self._running = False
        
        # 取消所有 worker 任务
        for worker in self._workers:
            worker.cancel()
        
        if self._workers:
            await asyncio.gather(*self._workers, return_exceptions=True)
        self._workers.clear()
    
    async def _spawn_worker(self, worker_id: int):
        """启动一个新的 worker"""
        worker = asyncio.create_task(
            self._worker_loop(worker_id),
            name=f"market-data-worker-{worker_id}"
        )
        self._workers.add(worker)
        logger.info(f"Spawned worker {worker_id}, pool size: {len(self._workers)}")
        return worker
    
    async def _worker_loop(self, worker_id: int):
        """Worker 主循环"""
        logger.info(f"Worker {worker_id} started")
        
        try:
            while self._running:
                try:
                    # 从队列获取数据，超时处理避免永久阻塞
                    data = await asyncio.wait_for(
                        self.queue.get(),
                        timeout=1.0
                    )
                    
                    # ⚠️ 生产环境：实际策略处理逻辑
                    await self._process_message(data, worker_id)
                    self.queue.task_done()
                    
                except asyncio.TimeoutError:
                    # 队列超时，继续循环检查 _running 状态
                    continue
                    
        except asyncio.CancelledError:
            logger.info(f"Worker {worker_id} cancelled")
            raise
        finally:
            self._workers.discard(asyncio.current_task())
            logger.info(f"Worker {worker_id} stopped, remaining: {len(self._workers)}")
    
    async def _process_message(self, data, worker_id: int):
        """处理单条消息 - 实际场景中替换为真实策略"""
        # 示例：模拟策略处理耗时
        await asyncio.sleep(0.01)  # 10ms 模拟计算延迟
        
    async def _autoscale_loop(self):
        """自动扩缩容循环"""
        while self._running:
            await asyncio.sleep(self.check_interval)
            
            queue_utilization = self.queue.qsize() / self.queue.maxsize
            
            async with self._lock:
                current_size = len(self._workers)
                
                # 扩容逻辑
                if queue_utilization > self.scale_up_threshold:
                    if current_size < self.max_workers:
                        await self._spawn_worker(current_size)
                        logger.warning(
                            f"Scaling up: queue utilization {queue_utilization:.1%}, "
                            f"workers {current_size} -> {current_size + 1}"
                        )
                
                # 缩容逻辑
                elif queue_utilization < self.scale_down_threshold:
                    if current_size > self.min_workers:
                        # 取消一个 worker
                        worker = list(self._workers)[0]
                        worker.cancel()
                        logger.info(
                            f"Scaling down: queue utilization {queue_utilization:.1%}, "
                            f"workers {current_size} -> {current_size - 1}"
                        )

5.3 Worker 间的负载均衡

默认的 asyncio.Queue 使用**先进先出（FIFO）**策略。对于行情数据，我们可能需要更精细的优先级控制：

class PriorityQueue(asyncio.Queue):
    """
    优先级队列
    
    高优先级数据（如财报发布、价格异动）会被优先处理
    """
    
    async def put(self, item: tuple):
        """
        放入数据
        
        Args:
            item: (priority, data) 元组
                  priority 越小，优先级越高
        """
        priority, data = item
        await super().put(item)
    
    async def get(self) -> tuple:
        """获取最高优先级的数据"""
        return await super().get()

使用方式：

# 普通行情：优先级 1
await queue.put((1, tick_data))

# 紧急行情（如价格异动）：优先级 0
await queue.put((0, alert_data))

六、生产级完整实现

6.1 架构总览

┌─────────────────────────────────────────────────────────────────┐
│                         TickDB WebSocket                         │
│                     (depth 频道 + 实时报价)                       │
└─────────────────────────────────────────────────────────────────┘
                                │
                                ▼
┌─────────────────────────────────────────────────────────────────┐
│                      BackpressureProducer                        │
│  ┌─────────────────┐  ┌─────────────────┐  ┌─────────────────┐ │
│  │ 消息去重/归一化  │  │  背压监控指标   │  │  优先级标记    │ │
│  └─────────────────┘  └─────────────────┘  └─────────────────┘ │
└─────────────────────────────────────────────────────────────────┘
                                │
                                ▼
┌─────────────────────────────────────────────────────────────────┐
│                    asyncio.Queue (maxsize=5000)                  │
│                                                                 │
│   ┌─────┐ ┌─────┐ ┌─────┐ ┌─────┐ ┌─────┐ ┌─────┐ ┌─────┐      │
│   │ M1  │ │ M2  │ │ M3  │ │ M4  │ │ M5  │ │ ... │ │ M5000│     │
│   └─────┘ └─────┘ └─────┘ └─────┘ └─────┘ └─────┘ └─────┘      │
│                                                                 │
│                      [背压阈值监控]                              │
└─────────────────────────────────────────────────────────────────┘
                    │                       │
        ┌───────────┘                       └───────────┐
        ▼                                               ▼
┌───────────────────┐                       ┌───────────────────┐
│   Worker Pool 1   │                       │   Worker Pool 2   │
│ ┌─────┬─────┬─────┐│                       │ ┌─────┬─────┬─────┐│
│ │ W1  │ W2  │ W3  ││                       │ │ W4  │ W5  │ W6  ││
│ └──┬──┴──┬──┴──┬──┘│                       │ └──┬──┴──┬──┴──┬──┘│
│    │     │     │    │                       │    │     │     │    │
│    ▼     ▼     ▼    │                       │    ▼     ▼     ▼    │
│ 趋势策略 套利  风控   │                       │ 波动率 事件 流动性  │
└───────────────────┘                       └───────────────────┘

6.2 TickDB 数据源集成

以下是连接 TickDB WebSocket 并将数据注入队列的完整代码：

import asyncio
import json
import os
import logging
from typing import Optional
from dataclasses import dataclass
import aiohttp
import random

logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s | %(levelname)s | %(name)s | %(message)s'
)
logger = logging.getLogger(__name__)


@dataclass
class MarketDataMessage:
    """行情数据消息结构"""
    symbol: str
    price: float
    volume: int
    timestamp: float
    source: str = "tickdb"
    
    @classmethod
    def from_tickdb(cls, data: dict) -> "MarketDataMessage":
        return cls(
            symbol=data.get("symbol", ""),
            price=float(data.get("price", 0)),
            volume=int(data.get("volume", 0)),
            timestamp=data.get("ts", 0) / 1000  # 毫秒转秒
        )


class TickDBWebSocketProducer:
    """
    TickDB WebSocket 生产者
    
    功能：
    1. 建立 WebSocket 连接并保持心跳
    2. 订阅行情频道（depth/ticker/trades）
    3. 将数据注入 asyncio.Queue，触发背压控制
    4. 指数退避重连 + 抖动
    
    环境变量：
    - TICKDB_API_KEY: API 密钥
    - TICKDB_WS_URL: WebSocket 端点（默认 wss://api.tickdb.ai/ws/v1/market）
    """
    
    # 重连配置
    MAX_RETRY = 10
    BASE_RETRY_DELAY = 1.0
    MAX_RETRY_DELAY = 60.0
    
    def __init__(
        self,
        queue: asyncio.Queue,
        api_key: Optional[str] = None,
        ws_url: str = "wss://api.tickdb.ai/ws/v1/market"
    ):
        self.queue = queue
        self.api_key = api_key or os.environ.get("TICKDB_API_KEY")
        
        if not self.api_key:
            raise ValueError(
                "API Key 未设置。请设置环境变量 TICKDB_API_KEY "
                "或通过参数传入。"
            )
        
        self.ws_url = f"{ws_url}?api_key={self.api_key}"
        self._ws: Optional[aiohttp.ClientWebSocketResponse] = None
        self._session: Optional[aiohttp.ClientSession] = None
        self._running = False
        self._retry_count = 0
        
        # 背压监控
        self.put_count = 0
        self.blocked_count = 0
        
    async def connect(self):
        """建立 WebSocket 连接"""
        self._session = aiohttp.ClientSession()
        
        try:
            self._ws = await self._session.ws_connect(
                self.ws_url,
                timeout=aiohttp.ClientTimeout(total=30)
            )
            self._retry_count = 0
            logger.info("WebSocket 连接建立成功")
            
        except aiohttp.ClientError as e:
            logger.error(f"WebSocket 连接失败: {e}")
            await self._handle_disconnect()
            raise
    
    async def subscribe(self, channels: list[str]):
        """
        订阅行情频道
        
        Args:
            channels: 频道列表，格式 ["depth:AAPL.US", "trades:BTC.USDT"]
        """
        if not self._ws:
            raise RuntimeError("WebSocket 未连接")
        
        subscribe_msg = {
            "cmd": "subscribe",
            "params": {"channels": channels}
        }
        await self._ws.send_json(subscribe_msg)
        logger.info(f"已订阅频道: {channels}")
    
    async def run(self, channels: list[str]):
        """
        启动生产循环
        
        Args:
            channels: 订阅的频道列表
        """
        self._running = True
        
        while self._running:
            try:
                if not self._ws or self._ws.closed:
                    await self.connect()
                    await self.subscribe(channels)
                
                async for msg in self._ws:
                    if msg.type == aiohttp.WSMsgType.PING:
                        await self._ws.pong()
                        continue
                    
                    if msg.type == aiohttp.WSMsgType.TEXT:
                        await self._process_message(msg.data)
                    
                    elif msg.type == aiohttp.WSMsgType.CLOSED:
                        logger.warning("WebSocket 连接关闭")
                        break
                        
                    elif msg.type == aiohttp.WSMsgType.ERROR:
                        logger.error(f"WebSocket 错误: {msg.data}")
                        break
            
            except asyncio.CancelledError:
                logger.info("生产者任务取消")
                break
                
            except Exception as e:
                logger.error(f"生产循环异常: {e}")
                await self._handle_disconnect()
    
    async def _process_message(self, raw_data: str):
        """处理接收到的消息，注入队列"""
        try:
            data = json.loads(raw_data)
            
            # 解析 TickDB 响应格式
            # depth 频道格式：{"channel": "depth:AAPL.US", "data": {...}}
            channel = data.get("channel", "")
            payload = data.get("data", {})
            
            if not payload:
                return
            
            # 构造标准消息格式
            message = MarketDataMessage.from_tickdb(payload)
            
            # 注入队列，触发背压控制
            success = await self._put_with_backpressure(message)
            
            if success:
                self.put_count += 1
            else:
                # 队列满导致放入失败
                self.blocked_count += 1
                logger.warning(
                    f"消息放入失败 (背压): blocked={self.blocked_count}, "
                    f"success={self.put_count}"
                )
                
        except json.JSONDecodeError:
            logger.debug(f"非 JSON 消息: {raw_data[:100]}")
        except Exception as e:
            logger.error(f"消息处理异常: {e}")
    
    async def _put_with_backpressure(self, message: MarketDataMessage) -> bool:
        """
        带背压感知的消息推送
        
        使用 asyncio.wait_for 实现超时控制
        超时后放弃放入，避免永久阻塞
        """
        try:
            # 等待队列有空位，最多等待 100ms
            # 注意：这里不能用 put_nowait + 循环，因为会消耗 CPU
            # 使用 put 但设置超时，让出事件循环控制权
            await asyncio.wait_for(
                self.queue.put(message),
                timeout=0.1
            )
            return True
            
        except asyncio.TimeoutError:
            # 队列满，超时放弃
            return False
    
    async def _handle_disconnect(self):
        """处理连接断开，启动重连"""
        if not self._running:
            return
        
        self._retry_count += 1
        
        if self._retry_count > self.MAX_RETRY:
            logger.critical(
                f"达到最大重试次数 ({self.MAX_RETRY})，"
                f"生产者停止运行"
            )
            self._running = False
            return
        
        # 指数退避 + 抖动
        delay = min(
            self.BASE_RETRY_DELAY * (2 ** (self._retry_count - 1)),
            self.MAX_RETRY_DELAY
        )
        jitter = random.uniform(0, delay * 0.1)
        
        logger.warning(
            f"重连中... ({self._retry_count}/{self.MAX_RETRY})，"
            f"等待 {delay + jitter:.1f}s"
        )
        
        await asyncio.sleep(delay + jitter)
    
    async def stop(self):
        """停止生产者"""
        self._running = False
        
        if self._ws and not self._ws.closed:
            await self._ws.close()
        
        if self._session:
            await self._session.close()
        
        logger.info("生产者已停止")
    
    @property
    def backpressure_ratio(self) -> float:
        """背压比率"""
        total = self.put_count + self.blocked_count
        if total == 0:
            return 0.0
        return self.blocked_count / total

6.3 策略消费者实现

class StrategyConsumer:
    """
    策略消费者示例
    
    ⚠️ 生产环境：替换为真实策略逻辑
    """
    
    def __init__(self, queue: asyncio.Queue, strategy_name: str):
        self.queue = queue
        self.strategy_name = strategy_name
        self.processed_count = 0
        self.error_count = 0
        
    async def run(self):
        """消费循环"""
        logger.info(f"策略 {self.strategy_name} 消费者启动")
        
        while True:
            try:
                # 获取消息（带超时，防止永久阻塞）
                message = await asyncio.wait_for(
                    self.queue.get(),
                    timeout=5.0
                )
                
                # ⚠️ 生产环境：执行实际策略逻辑
                await self._execute_strategy(message)
                
                self.queue.task_done()
                self.processed_count += 1
                
            except asyncio.TimeoutError:
                # 超时，继续循环检查
                continue
            except asyncio.CancelledError:
                logger.info(f"策略 {self.strategy_name} 消费者取消")
                raise
    
    async def _execute_strategy(self, message: MarketDataMessage):
        """
        执行策略逻辑
        
        ⚠️ 示例代码，请根据实际策略替换
        """
        # 示例：简单的价格异常检测
        if message.price <= 0:
            self.error_count += 1
            logger.warning(f"无效价格数据: {message}")
            return
        
        # 模拟策略计算
        await asyncio.sleep(0.005)  # 5ms 模拟计算延迟

6.4 整合运行

async def main():
    """
    完整的生产者-消费者系统
    
    运行方式：
    python market_data_pipeline.py
    
    环境变量：
    - TICKDB_API_KEY: 你的 API Key
    """
    
    # 1. 初始化有界队列
    # maxsize=5000 实现了队列层的背压控制
    queue = asyncio.Queue(maxsize=5000)
    
    # 2. 初始化监控器
    monitor = BackpressureMonitor()
    
    # 3. 初始化生产者和消费者
    producer = TickDBWebSocketProducer(queue)
    
    # 多个策略消费者
    consumers = [
        StrategyConsumer(queue, "trend-strategy"),
        StrategyConsumer(queue, "arbitrage-strategy"),
        StrategyConsumer(queue, "risk-control"),
    ]
    
    # 4. 启动 worker 池（可选，根据负载情况启用）
    # worker_pool = WorkerPool(queue, min_workers=2, max_workers=6)
    
    try:
        # 5. 并发运行所有组件
        tasks = [
            asyncio.create_task(producer.run(channels=["depth:AAPL.US"])),
            asyncio.create_task(consumers[0].run()),
            asyncio.create_task(consumers[1].run()),
            asyncio.create_task(consumers[2].run()),
        ]
        
        await asyncio.gather(*tasks)
        
    except KeyboardInterrupt:
        logger.info("接收到中断信号，优雅关闭...")
    finally:
        await producer.stop()
        for consumer in consumers:
            consumer.cancel()
        
        if producer.backpressure_ratio > 0.1:
            logger.warning(
                f"背压比率较高 ({producer.backpressure_ratio:.1%})，"
                f"建议增加消费者或调整队列大小"
            )


if __name__ == "__main__":
    asyncio.run(main())

七、性能调优指南

7.1 队列大小选择

maxsize 的选择需要权衡缓冲能力和内存占用：

队列大小	适用场景	内存预估（单条消息 200 bytes）
1,000	低延迟需求，内存敏感	~200 MB
5,000	平衡模式（推荐）	~1 GB
10,000	高并发场景	~2 GB
无界	❌ 不推荐	无限

7.2 Worker 数量计算

def calculate_optimal_workers(
    avg_processing_time_ms: float,
    target_latency_ms: float = 100,
    target_throughput: float = 1000  # 条/秒
) -> int:
    """
    计算最优 worker 数量
    
    公式：
    worker_count = ceil(target_throughput * avg_processing_time / 1000)
    
    同时需要满足：单条处理延迟 < 目标延迟
    worker_count = ceil(target_throughput / (1000 / avg_processing_time_ms))
    """
    workers_for_throughput = ceil(
        target_throughput * avg_processing_time_ms / 1000
    )
    
    workers_for_latency = ceil(1000 / avg_processing_time_ms)
    
    return max(workers_for_throughput, workers_for_latency)

7.3 瓶颈定位

使用以下命令查看系统瓶颈：

# 查看队列积压情况
print(f"队列积压: {queue.qsize()} / {queue.maxsize}")
print(f"积压率: {queue.qsize() / queue.maxsize:.1%}")

# 查看各 worker 处理量
for consumer in consumers:
    print(f"{consumer.strategy_name}: {consumer.processed_count} 条")

# 查看背压情况
print(f"背压比率: {producer.backpressure_ratio:.2%}")

八、TickDB 集成说明

以上代码展示了完整的生产者-消费者架构，而 TickDB 在其中扮演数据源的角色。

TickDB 的 WebSocket 接口支持多种频道：

频道	数据内容	适用场景
`depth`	订单簿深度数据（最多 50 档）	流动性分析、订单流策略
`trades`	逐笔成交（港股、数字货币）	高频套利、成交量异常检测
`ticker`	实时行情快照	通用行情监控
`kline`	K 线数据	指标计算、趋势跟踪

对于本文的架构设计，TickDB 的价值在于：

统一的低延迟接入：单一数据源，覆盖多资产类别
depth 频道实时推送：无需轮询，直接获得订单簿变化
历史数据回测支持：/v1/market/kline 接口支持 10 年级别数据验证策略逻辑

下一步行动

如果你正在处理高频行情数据：

访问 tickdb.ai 注册获取免费 API Key
在控制台查看 WebSocket 接入文档
参考本文代码，搭建你的生产者-消费者架构

如果你需要历史数据验证策略：

联系 [email protected] 获取专业版数据方案
支持 10 年级别美股历史 K 线数据，用于回测验证

如果你想快速验证概念：

在 AI 助手中搜索并安装 tickdb-market-data SKILL
通过自然语言交互快速获取行情数据

风险提示：本文不构成任何投资建议。生产者-消费者架构解决了数据处理的技术问题，但策略的实际盈利能力取决于策略本身的逻辑设计和市场条件。市场有风险，投资需谨慎。

生产者-消费者模式在行情分发中的应用