程序员转量化:你的工程能力如何转化为策略优势
你写的 HTTP 客户端,正在杀死你的策略 凌晨三点,策略盘口突然静默。 你从床上弹起来,远程连上服务器,日志里全是堆叠的超时错误。市场正在剧烈波动,你的策略却因为数据获取层的脆弱设计,在最关键的时刻失去了眼睛。 这不是策略模型的失败。 这是工程能力的欠账。 --- 我是码农小K,干了八年后端,写过交易系统外围,做过数据管道,现在全职做量化策略。这条路我走了三年,踩过的坑比喝过的咖啡多。今天这篇不
一个热爱数据的金融博主,用量化视角解读外汇、加密货币、美股、港股、A股及大宗商品市场。
夏普比率的陷阱:为什么 2.0 的策略可能不如 1.0 > “数字是最容易被操纵的真相——尤其是在你想相信它的时候。” 2019 年,有一只量化基金在私募业绩排行榜上亮瞎了全行业的眼睛:夏普比率 3.2,最大回撤不到 2%。一时间,机构投资者排队进场,管理规模从 2 亿飙升到 50 亿。2020 年 3 月,这只基金单月亏损 34%。净值从 1.23 跌到 0.81。 这不是什么“百年一遇”的黑天
你写的 HTTP 客户端,正在杀死你的策略 凌晨三点,策略盘口突然静默。 你从床上弹起来,远程连上服务器,日志里全是堆叠的超时错误。市场正在剧烈波动,你的策略却因为数据获取层的脆弱设计,在最关键的时刻失去了眼睛。 这不是策略模型的失败。 这是工程能力的欠账。 --- 我是码农小K,干了八年后端,写过交易系统外围,做过数据管道,现在全职做量化策略。这条路我走了三年,踩过的坑比喝过的咖啡多。今天这篇不
连接池设计:如何优雅地管理 100+ 标的的实时订阅 > "你那台服务器挂了两天了,知道吗?" > > 凌晨三点,Slack 上弹出一条消息。事情很简单:策略同学的 Python 脚本跑了两天,内存从 200MB 涨到 1.8GB,然后 OOM kill。他写的 WebSocket 订阅逻辑没有做连接复用、没有做消息消费限流、没有做任何退避重连——就是 100 个 一起跑,收到消息就往一个队列里
拆股前后的价格序列对齐:前复权与后复权的选择陷阱 2020 年 8 月,苹果(AAPL)以 1:4 的比例拆股。当日收盘价从约 440 美元跳空至约 110 美元,K 线图上留下一道深深的缺口。 如果你的回测系统从 2015 年开始计算移动平均线,那条从 100 美元附近开始的均线,在 2020 年 8 月之后会突然"跳升"到 400 美元——这显然不是真实的趋势变化,而是数据处理方式造成的假象。
毫秒级响应:实时行情到策略信号的全链路架构设计 数据来了,然后呢? 这是大多数量化系统最容易被忽视的一环。 你能拿到实时行情——盘口变化、成交推送、K线合成——这些都不难。但数据到了之后,如何让策略在毫秒级别做出反应、如何避免信号抖动导致的频繁开平仓、如何在整个链路中保持稳定性和可观测性,才是真正区分“回测能跑”和“实盘能用”的分水岭。 本文不聊策略本身。我们只讨论一件事:从 TickDB 推送过
财报季来了,你还在用 5 秒刷新的数据源做日内策略吗? 2024 年 10 月,某头部百亿私募的 CTA 团队在复盘中发现一个致命问题:他们的 A 股日内策略回测年化 42%,实盘却亏损 18%。根因令人啼笑皆非——回测用的是 Tushare 的日频复权数据,实盘用的是券商接口的低频快照,中间的数据断层高达 3-8 秒。 这不是孤例。在 A 股量化社区,Tushare 是绕不开的名字。它用免费午餐
算法没有情绪,但写算法的人有:量化交易者的心理陷阱 --- > "我知道不该动它,但我就是忍不住。" 说这句话的人,不是第一次入市的散户,而是一位有六年量化经验的老兵。他的趋势策略年化收益 23%,最大回撤控制在 12% 以内——直到他在 2024 年 8 月的某个深夜,手动平掉了三个盈利中的头寸。 理由是"感觉行情要反转"。 三天后,行情确实反转了。但这不重要。重要的是,他的系统在那一刻失效了。
机构量化系统的数据治理:合规、灾备与 SLA > "量化策略的盈亏在收盘后停止,但数据的战斗永不停歇。" 凌晨 2:47,某百亿量化私募的风控系统弹出一条红色告警:数据供应商 A 的行情延迟从常规的 50ms 飙升至 1.8 秒。这意味着当日的全部交易信号都建立在错误的价格数据之上——一个小时后,该私募的 IT 总监和合规负责人坐在会议室里面面相觑:他们的审计日志只记录了"数据获取成功",却无法回
格兰杰因果检验:美股与加密货币谁领先谁? > "相关系数是表象,领先滞后才是本质。" 2020 年 3 月 12 日,加密市场迎来"黑色星期四"。BTC 在 24 小时内跌幅超过 40%,多交易所出现技术故障。清算所 Margin Call 的连锁反应让传统市场参与者第一次认真看待加密资产的"领先性"。但问题是:这是统计上显著的领先,还是仅仅是巧合? 四年后的今天,机构量化团队在配置加密资产时面临
回测第一步:如何高效获取 10 年分钟级美股历史数据 > "回测失败的案例中,80% 不是策略本身的问题,而是数据质量的问题。" > > 这句话在量化社区流传甚广,但多数人只记住了后半句——拼命优化策略,却忽略了一个更前置的问题:你手里的数据是怎么来的? 2019 年,一位开发者花了整整两周时间下载标普 500 成分股的分钟级数据。结果回测时发现,某些股票的历史数据从 2015 年才完整,早期的数
凌晨 3 点,你被一条告警叫醒。 告警信息只有一行:。你盯着屏幕,快速翻了翻项目文档——没有。你又搜了一圈 API 文档——没有。你叹了口气,试探性地加了个 ,跑了一下,过去了。三个月后,你忘了这件事,直到另一个类似的告警出现。 这不是某个程序员的黑历史。这是 API 错误处理领域的集体困境:HTTP 状态码能告诉你的,永远不够用。 --- 当 HTTP 状态码不够用时 是一个有效的 HTTP
策略是系统,不是圣杯 > “在量化交易的漫长职业生涯中,你最大的敌人不是市场,而是你自己构建的那个'完美策略'。” 这是一个几乎每个量化交易者都会经历的心路历程:花费数月研究一个策略,在历史数据上跑出漂亮的夏普比率,上线实盘后却迅速失效。有人怪罪于市场风格的急剧切换,有人归咎于滑点和佣金的吞噬,更多人陷入无尽的自证循环——不断优化参数,不断过拟合,直到彻底失去对策略的信任。 这篇文章不提供“永不失
当你的策略从 3 个变成 30 个:小型量化团队如何建立可持续的研发秩序 "我们的策略回测年化收益 45%,实盘运行三个月后夏普比率掉到了 0.3。" 这句话几乎可以列为量化行业出现频率最高的死亡flag。问题往往不在策略本身,而在于团队没有一套从 idea 到上线的流程规范——策略越多,混乱程度指数级上升,最终连策略库都变成一笔糊涂账。 本文面向 3-10 人规模的小型量化团队,系统性拆解策略研
历史数据批量拉取:如何高效获取 10 年分钟级美股数据 当 100 万根 K 线等待被装进你的硬盘 凌晨两点,你盯着屏幕上的进度条——3%。已经跑了 14 个小时。 这不是虚构场景。任何一个认真做过美股分钟级回测的量化开发者,都大概率经历过这个时刻:选定一个 10 年回测窗口,跑一个 Python 脚本满怀期待地点下回车,然后发现数据在以一种令人绝望的速度缓缓流入。 100 万根 K 线。这是苹果
凌晨 3 点的告警:一位量化开发者的午休噩梦 凌晨 3 点,睡眼惺忪的你被手机震醒——监控系统发来告警:“数据流中断”。你条件反射地打开终端,手指悬在重启键上方。但定睛一看,时间戳显示 12:47。港股的午休时段。 这不是数据问题,是系统设计缺陷。 当监控系统不具备“市场时段感知”能力,正常的交易间隔会被误判为连接故障。随之而来的,可能是过度重连导致的 API 限频、凌晨无意义的告警通知,以及工程
价格是结果,相关性才是原因 2018 年 2 月 5 日,道琼斯指数在盘中一度暴跌 1593 点,创下当时史上最大单日点数跌幅。量化交易员陈舟盯着屏幕上跳动的 SPY 行情,条件反射地把手搭在了 TLT(美国 20 年期国债 ETF)的平仓键上——教科书告诉他,股市崩盘时,资金会涌向债券,这是"股债跷跷板"最经典的避险场景。 但那天收盘后他发现,自己亏钱了。 不是亏在股市上,而是亏在债市上。那一天
TickDB 的历史数据清洗对齐到底做了什么?对比原始数据的 5 个维度 > "你的策略在过去三年回测中年化收益 42%,夏普比率 2.1。但实盘跑了三个月,亏损 18%。" > > 这不是策略失效。这很可能是数据问题。 > > 量化社区有句老话:垃圾进,垃圾出。但少有人意识到,即使数据"看起来正确",未经清洗对齐的历史数据也可能让你的回测结果与实盘产生根本性偏差。本文深入拆解 TickDB 的数
回测的 7 个致命偏差:你中招了几个 > 「我用 5 年数据、20 个因子、15 种机器学习模型,跑出了一个年化 87% 的策略。」 > > 然后,实盘亏光了。 这不是段子。这是无数量化新手真实走过的路。回测时觉得自己找到了圣杯,实盘时发现圣杯是纸糊的。大多数情况下,问题不在策略本身,而在回测过程——那些看起来合理、实则隐蔽的偏差,像白蚁一样从内部瓦解你的策略。 本文系统拆解回测中最常见的 7 种
从亏损一个跌停板开始:一个后端程序员的量化启蒙 2019 年双十一,我用人生第一笔股票账户里的 5 万块钱,体验了一把"量化"。 买入逻辑很简单:同事说特斯拉要起飞了。然后我看着那个数字从 +2% 变成 -8%,全程无能为力——没有报警,没有止损条件,甚至不知道该什么时候看盘。 三个月后亏了 18%,我卸载了 App。但那个问题一直留在脑子里:程序能不能替我管住手? 答案是肯定的。但"量化"这个词
统计套利配对筛选:协整检验与卡尔曼滤波实战 > “两只股票的短期背离终将收敛——这是统计套利的公理。但公理不告诉你在哪个时间窗口收敛、收敛的概率有多大、以及用什么方法捕捉这个概率。” 2019 年,Two Sigma 的一份研究论文披露了其早期配对交易策略的核心参数:当 SPY 与 IWM 的 20 日滚动相关性跌破 -0.6 时,75% 的价差在 5 个交易日内回归均值。这个数字不是猜测,而是