程序员转量化:你的工程能力如何转化为策略优势
你写的 HTTP 客户端,正在杀死你的策略 凌晨三点,策略盘口突然静默。 你从床上弹起来,远程连上服务器,日志里全是堆叠的超时错误。市场正在剧烈波动,你的策略却因为数据获取层的脆弱设计,在最关键的时刻失去了眼睛。 这不是策略模型的失败。 这是工程能力的欠账。 --- 我是码农小K,干了八年后端,写过交易系统外围,做过数据管道,现在全职做量化策略。这条路我走了三年,踩过的坑比喝过的咖啡多。今天这篇不
TickDB API 开发教程、WebSocket 接入和 SDK 示例
你写的 HTTP 客户端,正在杀死你的策略 凌晨三点,策略盘口突然静默。 你从床上弹起来,远程连上服务器,日志里全是堆叠的超时错误。市场正在剧烈波动,你的策略却因为数据获取层的脆弱设计,在最关键的时刻失去了眼睛。 这不是策略模型的失败。 这是工程能力的欠账。 --- 我是码农小K,干了八年后端,写过交易系统外围,做过数据管道,现在全职做量化策略。这条路我走了三年,踩过的坑比喝过的咖啡多。今天这篇不
连接池设计:如何优雅地管理 100+ 标的的实时订阅 > "你那台服务器挂了两天了,知道吗?" > > 凌晨三点,Slack 上弹出一条消息。事情很简单:策略同学的 Python 脚本跑了两天,内存从 200MB 涨到 1.8GB,然后 OOM kill。他写的 WebSocket 订阅逻辑没有做连接复用、没有做消息消费限流、没有做任何退避重连——就是 100 个 一起跑,收到消息就往一个队列里
财报季来了,你还在用 5 秒刷新的数据源做日内策略吗? 2024 年 10 月,某头部百亿私募的 CTA 团队在复盘中发现一个致命问题:他们的 A 股日内策略回测年化 42%,实盘却亏损 18%。根因令人啼笑皆非——回测用的是 Tushare 的日频复权数据,实盘用的是券商接口的低频快照,中间的数据断层高达 3-8 秒。 这不是孤例。在 A 股量化社区,Tushare 是绕不开的名字。它用免费午餐
机构量化系统的数据治理:合规、灾备与 SLA > "量化策略的盈亏在收盘后停止,但数据的战斗永不停歇。" 凌晨 2:47,某百亿量化私募的风控系统弹出一条红色告警:数据供应商 A 的行情延迟从常规的 50ms 飙升至 1.8 秒。这意味着当日的全部交易信号都建立在错误的价格数据之上——一个小时后,该私募的 IT 总监和合规负责人坐在会议室里面面相觑:他们的审计日志只记录了"数据获取成功",却无法回
格兰杰因果检验:美股与加密货币谁领先谁? > "相关系数是表象,领先滞后才是本质。" 2020 年 3 月 12 日,加密市场迎来"黑色星期四"。BTC 在 24 小时内跌幅超过 40%,多交易所出现技术故障。清算所 Margin Call 的连锁反应让传统市场参与者第一次认真看待加密资产的"领先性"。但问题是:这是统计上显著的领先,还是仅仅是巧合? 四年后的今天,机构量化团队在配置加密资产时面临
凌晨 3 点,你被一条告警叫醒。 告警信息只有一行:。你盯着屏幕,快速翻了翻项目文档——没有。你又搜了一圈 API 文档——没有。你叹了口气,试探性地加了个 ,跑了一下,过去了。三个月后,你忘了这件事,直到另一个类似的告警出现。 这不是某个程序员的黑历史。这是 API 错误处理领域的集体困境:HTTP 状态码能告诉你的,永远不够用。 --- 当 HTTP 状态码不够用时 是一个有效的 HTTP
当你的策略从 3 个变成 30 个:小型量化团队如何建立可持续的研发秩序 "我们的策略回测年化收益 45%,实盘运行三个月后夏普比率掉到了 0.3。" 这句话几乎可以列为量化行业出现频率最高的死亡flag。问题往往不在策略本身,而在于团队没有一套从 idea 到上线的流程规范——策略越多,混乱程度指数级上升,最终连策略库都变成一笔糊涂账。 本文面向 3-10 人规模的小型量化团队,系统性拆解策略研
历史数据批量拉取:如何高效获取 10 年分钟级美股数据 当 100 万根 K 线等待被装进你的硬盘 凌晨两点,你盯着屏幕上的进度条——3%。已经跑了 14 个小时。 这不是虚构场景。任何一个认真做过美股分钟级回测的量化开发者,都大概率经历过这个时刻:选定一个 10 年回测窗口,跑一个 Python 脚本满怀期待地点下回车,然后发现数据在以一种令人绝望的速度缓缓流入。 100 万根 K 线。这是苹果
TickDB 的历史数据清洗对齐到底做了什么?对比原始数据的 5 个维度 > "你的策略在过去三年回测中年化收益 42%,夏普比率 2.1。但实盘跑了三个月,亏损 18%。" > > 这不是策略失效。这很可能是数据问题。 > > 量化社区有句老话:垃圾进,垃圾出。但少有人意识到,即使数据"看起来正确",未经清洗对齐的历史数据也可能让你的回测结果与实盘产生根本性偏差。本文深入拆解 TickDB 的数
从亏损一个跌停板开始:一个后端程序员的量化启蒙 2019 年双十一,我用人生第一笔股票账户里的 5 万块钱,体验了一把"量化"。 买入逻辑很简单:同事说特斯拉要起飞了。然后我看着那个数字从 +2% 变成 -8%,全程无能为力——没有报警,没有止损条件,甚至不知道该什么时候看盘。 三个月后亏了 18%,我卸载了 App。但那个问题一直留在脑子里:程序能不能替我管住手? 答案是肯定的。但"量化"这个词
统计套利配对筛选:协整检验与卡尔曼滤波实战 > “两只股票的短期背离终将收敛——这是统计套利的公理。但公理不告诉你在哪个时间窗口收敛、收敛的概率有多大、以及用什么方法捕捉这个概率。” 2019 年,Two Sigma 的一份研究论文披露了其早期配对交易策略的核心参数:当 SPY 与 IWM 的 20 日滚动相关性跌破 -0.6 时,75% 的价差在 5 个交易日内回归均值。这个数字不是猜测,而是
TickDB vs Tushare:A 股数据源的跨市场能力对决 > "数据是量化交易的氧气,但获取数据的姿势决定了你能飞多高。" 凌晨三点,某私募的因子挖掘工程师小林盯着屏幕上的报错信息发呆——Tushare Pro 的日调用额度又触达上限了,而他的动量因子正在历史数据回测的关键节点。这是他本周第三次因为接口限频被迫中断工作。 与此同时,另一位个人投资者老张刚用 TickDB 的 WebSock
凌晨 3 点,你被 Slack 告警吵醒。策略宕机了——不是模型错,不是数据源断,是连接数打满后 Goroutine 泄漏,内存一路飙到 100%。 你熟练地打开 Prometheus,翻到 GC 日志,定位到那个没加 context 超时的 goroutine,修了个 one-liner,上线。 第二天,策略正常跑,净值曲线往上走。 这不是 quant 的故事——这是工程师的故事。 量化行业有个
写给被数据 API 折磨过的工程师:如何优雅地拉取 10 年美股分钟级数据 凌晨两点,你的回测脚本跑着跑着断了。 不是代码 bug,是 API 返回了 500 错误。或者更恶心一点——返回了 200,但数据只有 800 条,而不是你预期的 1000 条。 你抬头看了眼进度条:2%。 这就是大数据量拉取的日常。我们今天把这个事情聊透,给出一套可以在生产环境跑三年的方案。 --- 一、为什么你拿数据总
为什么 API Key 放 Header 而不是 URL?鉴权方式的安全性解读 "你的 API Key 在日志里裸奔了。" 这不是危言耸听。2021 年,GitHub 的一份内部报告显示,因日志泄露导致的凭证暴露事件占所有安全漏洞的 13%。而这些泄露中,URL 参数中的 API Key 是重灾区——它们在服务器日志、CDN 日志、浏览器历史、代理日志中留下了清晰的脚印,任何有日志访问权限的人都能
asyncio 异步编程实战:让你的 Python 量化系统快 10 倍 开篇 凌晨 3:47,你的策略因为 WebSocket 断连没有及时接收到行情,错过了黄金的波段启动点。 这不是运气不好。这是同步编程范式在高频场景下的原罪。 我们用 Python 写量化系统,习惯了 阻塞等响应、 干等行情数据、 循环一个一个处理订单——这些操作在日常脚本里无可厚非,但一旦进入毫秒级战场,每一行同步代码都
凌晨三点,你的回测正在悄悄亏损 2019 年 11 月 3 日,凌晨 2:47 分。一个量化团队的核心策略在他们毫不知情的情况下,触发了 147 笔异常交易。这些交易并非来自信号失准,而是来自一个被所有人忽视的技术细节——美国结束了夏令时,而他们的回测系统没有切换时区。 美国东部时间在每年 11 月的第一个周日从 EDT 切换回 EST,时间从 02:00 跳到 01:00。那一刻,一个简单地调用
TickDB vs Polygon:从架构到体验的深度对比 "数据不是资产的低买高卖,是市场微观结构的实时切片。" 每个量化开发者都经历过这个场景:凌晨两点,你精心构建的策略在美股财报季的极端波动中崩溃——不是因为策略逻辑有问题,而是因为数据源在关键时刻断了线,或者订单簿深度在你最需要它的时候返回了一个 null。你的策略像是一个精准的手术刀,却被告知手术室只提供了一把生锈的菜刀。 这不是个例。P
中小资金量化的数据源性价比选择:每月 100 美元怎么花 > "最贵的不是数据,是那些因为数据不够好而不得不重做的周末。" 这是我在 Discord 量化频道里见过最扎心的一句话。说这话的人刚把三个月的趋势策略回测推倒重来——原因不是策略逻辑错了,而是他用的数据源 tick 合并逻辑和实盘撮合规则不一致,偏差累积在 1.5% 左右,三个月下来刚好踩中了一轮暴涨暴跌,亏损方向完美复制了他的回测曲线。
异常值检测与修正:价格跳空、成交量突增的自动化处理 > "The market is always telling you something. The question is whether you're hearing the signal or the noise." > > 2010 年 5 月 6 日,道琼斯工业平均指数在几分钟内暴跌近 1000 点,随后迅速反弹。这次"闪电崩盘"让无数