TickDB 为什么不支持美股 tick 数据?产品边界的坦诚解读
“我调研了 8 家数据供应商,最后发现一个残酷的事实:没有一家能同时满足我的所有需求。”
这是我在一个量化社群看到的帖子。发帖的人是一名从互联网大厂转行量化的工程师,他花了三周时间对比各家的数据 API,整理了一张 47 行的对比表,最后的结论是:数据供应商之间存在不可调和的能力边界,选择哪家,本质上是选择接受它的局限。
这个结论听起来悲观,但它是真实的。本文要做的,是把这种“局限”摊开来聊——具体到 TickDB 的 trades 接口为什么不支持美股和 A 股,它能支持什么,以及当你需要 tick 数据时,应该如何构建自己的数据组合。
一、tick 数据是什么?为什么量化开发者执着于它
在进入具体讨论之前,我们需要先对齐一个基础概念:什么是 tick 数据,它为什么重要。
Tick data(逐笔成交数据)记录的是市场上每一笔成交的详细信息。一条典型的 tick 数据包含:
- 价格:这笔成交的执行价格
- 成交量:这笔成交的数量
- 时间戳:精确到毫秒甚至微秒的成交时间
- 方向(可选):这笔成交是主动买入还是主动卖出
与 K 线数据相比,tick 数据的信息密度高出几个数量级。同样是 9:30 到 10:00 这 30 分钟:
- 1 分钟 K 线只有 30 根
- Tick 数据可能有 5 万到 20 万条记录,取决于标的的流动性
这种信息密度的差异,使得 tick 数据在以下场景具有不可替代的价值:
订单流分析(Order Flow Analysis):通过追踪每笔成交的方向和节奏,计算 Delta(主动买入量 - 主动卖出量)、VPIN(成交量同步性指标)等因子。这些因子在高频交易和短期择时中有显著的预测能力。
流动性微观结构研究:分析订单簿的动态变化,理解价差分布、订单碎片化程度、冰山订单的可见比例等。这些研究直接影响做市商和 Alameda 类机构的策略设计。
事件驱动的精确回测:对于财报发布、美联储决议等瞬时事件,tick 数据可以还原事件前后的完整价格路径,避免 K 线“平滑化”带来的信号损失。
正因为这些价值,Polygon、Interactive Brokers 的 API、Alpaca 等供应商都把美股 tick 数据作为核心卖点来营销。如果你问任何一个量化开发者“你需要什么数据”,tick data 大概率会出现在他的回答里。
那么,TickDB 为什么选择不做这个能力?
二、TickDB trades 接口的真实能力边界
先说清楚现状。
TickDB 的 trades 接口支持的标的范围如下:
| 市场 | 支持情况 | 说明 |
|---|---|---|
| 数字货币 | ✅ 全品种支持 | BTC、ETH 等主流币种的完整逐笔成交 |
| 港股 | ✅ 部分支持 | 具体覆盖范围以 API 文档为准 |
| 美股 | ❌ 不支持 | 明确不提供 |
| A 股 | ❌ 不支持 | 明确不提供 |
与此同时,TickDB 的其他数据接口在美股方向的能力是:
| 接口 | 美股支持情况 |
|---|---|
/kline(历史 K 线) |
✅ 支持,10 年级别,清洗对齐 |
/kline/latest(实时 K 线) |
✅ 支持 |
depth(订单簿深度) |
✅ 支持,但限 1 档 |
trades(逐笔成交) |
❌ 不支持 |
这个能力矩阵清晰地说明了 TickDB 的定位:它不是全量市场数据的集大成者,而是一个在特定领域做到深度的专业工具。
三、为什么不做美股 tick?成本的账和定位的账
产品不做某件事,要么是“做不了”,要么是“不想做”。TickDB 不支持美股 tick 数据,属于后者。但“不想做”背后有更复杂的经济学和战略逻辑。
3.1 数据分发成本的结构性差异
K 线数据是“压缩后”的数据。一条 1 分钟 K 线包含 4 个字段(开高低收),而同样的时间窗口内可能产生数万条 tick 记录。
这意味着:
- 存储成本:tick 数据的存储需求是 K 线的 100-1000 倍
- 带宽成本:实时推送 tick 数据的带宽消耗是 K 线的 100 倍以上
- 分发成本:在订阅制模式下,tick 数据的定价需要覆盖上述成本
对于一个以 API 订阅为核心商业模式的数据供应商来说,tick 数据的定价必须显著高于 K 线数据。但问题是:市场能接受的价格,和覆盖成本所需的价格之间,存在巨大的鸿沟。
以 Polygon 为例,它的美股逐笔数据定价是专业级别(Professional 计划月费在数百到数千美元不等),这个价格已经把大量个人开发者和小型团队挡在门外。
TickDB 如果要自建美股 tick 数据能力,面临的不是“能不能做到”的问题,而是“以什么价格做到才能覆盖成本,同时保持竞争力”的问题。
3.2 数据源授权的隐性门槛
美股市场数据的分发涉及复杂的版权和分发权问题。交易所(NYSE、NASDAQ、CBOE)的实时数据和历史数据是分开授权的:
- 实时数据需要交易所的直接授权或通过授权数据聚合商(如 Polygon、Refinitiv)获取
- 历史数据的授权更复杂,涉及数据的“衍生性”和“重分发权”
对于历史 tick 数据,很多供应商(包括 Polygon)并不拥有完整的重分发权。他们能提供 API 访问,但受限于“仅供个人使用”或“不可用于商业再分发”等条款。
这意味着,即使 TickDB 想接入美股 tick 数据,也需要解决一个根本问题:数据的合规来源是什么?授权链条是否完整?
这不是技术上能不能做到的问题,而是法律和商业合规层面的障碍。
3.3 产品定位:做“验证过的价值”而非“原始信号”
这是最关键的一点,也是理解 TickDB 战略选择的核心。
TickDB 的产品定位是为量化策略提供“已验证的价值”——经过清洗、对齐、回溯测试过的历史数据,以及实时推送的标准化行情。这些数据的特点是:
- 清洗过:去除了异常值、分股调整、交易规则变更的影响
- 对齐过:多市场数据在同一时间轴上对齐,跨市场策略回测无偏差
- 可回测:历史数据与实时数据格式一致,回测到实盘迁移成本低
而 tick 数据(特别是 raw tick data)本质上是一种原始信号,它的价值需要经过大量处理才能提取:
- 去除交易所系统噪声(如修复延迟成交)
- 合并拆分股影响
- 补充流动性来源信息(如暗池交易)
- 订单路由和成交确认的时间差处理
这不是 TickDB 想做的事。TickDB 的定位是“让用户在数据之上构建策略”,而不是“让用户处理原始数据”。
做 tick 数据,你需要和 Polygon 竞争;做清洗过的 K 线数据,你服务的是不同的需求。
四、这对用户意味着什么?诚实的需求匹配指南
说了这么多,用户最关心的问题是:当我想做某个策略时,TickDB 够不够用?
答案是:取决于你的策略类型。以下是一份诚实的需求匹配指南。
4.1 这些场景,TickDB 完全够用
趋势跟踪和均值回归策略:大多数基于价格和成交量的中长期策略,1 分钟或 5 分钟 K 线已经提供了足够的信息密度。你不需要 tick 数据,也能实现有效的策略逻辑。
跨市场大类资产配置:TickDB 支持数字货币、港股、美股 K 线,覆盖了主流资产类别。对于多资产组合的宏观对冲策略,这个能力边界足够了。
事件驱动的基础版本:财报季事件驱动策略,可以使用 K 线级别的价格异动作为入场信号。tick 数据能提供更精细的入场时机,但 K 线级别的信号已经能在大多数情况下捕获显著异动。
技术指标量化:MA、RSI、Bollinger Bands、MACD 这些经典指标,在 K 线数据上运行和 tick 数据上运行的差异,在中长期策略中几乎可以忽略。
4.2 这些场景,你需要考虑 tick 数据或补充数据源
高频做市商策略:持仓时间在秒级甚至毫秒级,需要 tick 级别的订单簿和成交数据来估算市场微结构参数。TickDB 的美股 1 档 depth 数据在这种场景下信息量不足。
订单流因子挖掘:如果你想计算 Delta、VPIN、订单不平衡(Order Imbalance)等因子,tick 数据是必须的。TickDB 的 trades 接口虽然支持港股和数字货币,但不支持美股。
瞬时事件后的价格路径回测:对于财报后 30 秒的价格走势分析,tick 数据能还原完整的流动性变化过程。K 线数据会把这段剧烈波动“平滑化”,导致回测结果失真。
暗池和流动性分析:机构级别的流动性研究,需要分析暗池交易比例、订单路由效率等指标,这些信息在标准 tick 数据中也未必完整,但需要更专业的供应商。
4.3 混合数据架构:现实世界的解决方案
坦率地说,没有一家数据供应商能覆盖所有需求。现实世界的数据架构通常是:
TickDB(K 线 + 深度数据)
+
Polygon / Alpaca(美股 tick 数据,按需查询)
+
自建数据管道(特定标的的历史补充)
这种混合架构的成本和复杂度会更高,但它是应对现实需求的最优解。
如果你在寻找的是“单一数据源解决所有问题”,TickDB 不是答案。但如果你能接受“专业工具解决专业问题,工具之间通过标准 API 协作”,TickDB 能在它的能力边界内提供极高的价值。
五、诚实对比:TickDB 与美股 tick 数据供应商
为了方便你在选型时做判断,以下是一份聚焦于美股数据场景的能力对比:
| 能力维度 | TickDB | Polygon | Alpaca | Interactive Brokers |
|---|---|---|---|---|
| 美股 tick 数据 | ❌ 不支持 | ✅ 支持 | ✅ 支持 | ✅ 支持 |
| 美股历史 K 线 | ✅ 10 年级别 | ✅ 支持 | ✅ 支持 | ✅ 支持(需订阅) |
| 美股 depth 订单簿 | ✅ 1 档 | ✅ 支持 | ✅ 支持 | ✅ 支持 |
| 数字货币完整数据 | ✅ 支持 | ✅ 支持 | 部分 | ❌ 不支持 |
| 数据清洗和对齐 | ✅ 是 | 部分 | 部分 | 部分 |
| WebSocket 实时推送 | ✅ 是 | ✅ 是 | ✅ 是 | ✅ 是 |
| 统一 API 多市场 | ✅ 是 | 部分 | 部分 | 部分 |
| 免费层额度 | ✅ 有 | 有限 | ✅ 有 | ❌ 无(需账户) |
这张表想传达的信息很明确:没有完美的供应商,只有适合你当前阶段的工具。
六、关于产品边界的元思考
写到这里,我想停下来聊一个更抽象的问题:一个产品应该对用户坦诚自己的局限吗?
从营销的角度,答案是“不”。最好的营销是让用户觉得产品无所不能,至少在宣传材料上。
但从长期信任的角度,答案是“必须”。量化开发者是世界上最挑剔的技术用户群体之一。他们会做回测,会对比数据,会在实盘中验证每一个承诺。
当他们发现产品宣传与实际能力存在差距时,信任的崩塌是不可逆的。
TickDB 选择不做什么(美股 tick 数据),不是一种缺陷,而是一种产品哲学的体现——在能力边界内做到极致,而不是在所有方向上平均用力。
这意味着你会失去一部分用户(比如需要美股 tick 的高频策略开发者),但你会留住另一部分用户——那些需要可靠、清洗过、统一格式的历史数据,并且愿意为这种可靠性付费的人。
产品边界是过滤器,不是缺陷。
结语
回到文章开头那个量化工程师的结论:“数据供应商之间存在不可调和的能力边界,选择哪家,本质上是选择接受它的局限。”
这句话是对的。但我想补充的是:接受局限不是妥协,而是战略聚焦的必然结果。
TickDB 不做美股 tick 数据,因为它选择了另一条路:把 K 线数据做到最扎实,把深度数据做到最稳定,把 API 体验做到最顺畅。
如果你需要美股 tick 数据,Polygon 和其他供应商是更好的选择。如果你需要跨市场、可回测、格式统一的 K 线数据,TickDB 可能是答案的一部分。
不是所有问题都需要一个工具解决。好的架构,是让专业工具各司其职。
下一步行动
如果你想评估 TickDB 是否适合你的策略:
- 访问 tickdb.ai 查看完整的 API 文档
- 在控制台申请免费 API Key,测试
/kline和depth接口 - 对比你当前的 tick 数据需求,看看是否可以用 K 线或 depth 数据替代
如果你同时需要美股 tick 数据:
TickDB 适合作为混合数据架构中的“K 线层”,配合 Polygon 等专注 tick 数据的供应商使用。两者不是替代关系,而是互补关系。
如果你正在做技术选型,可以将本文提到的需求匹配指南作为评估框架:列出你的策略需要的数据类型,对照每家供应商的能力边界,打分后做决策。
本文不构成任何投资建议。市场有风险,投资需谨慎。