历史数据完整性校验:如何发现数据源的“静默缺失”
"你的策略在过去三年赚了 47%,夏普比率 1.8,最大回撤 8%。你信心满满把它部署到实盘——第一周亏掉了 12%。" 这不是策略失效,是数据在说谎。 回测与实盘之间的鸿沟,往往不在模型,而在数据管道中的静默缺失:数据源没有报错,没有告警,只是悄悄地少给了几天数据。缺失的数据让回测低估风险、高估收益。等你发现问题,对账单已经红了。 数据缺失不会发出声音。必须主动去听。 本文系统拆解历史数据的完整
TickDB API 开发教程、WebSocket 接入和 SDK 示例
"你的策略在过去三年赚了 47%,夏普比率 1.8,最大回撤 8%。你信心满满把它部署到实盘——第一周亏掉了 12%。" 这不是策略失效,是数据在说谎。 回测与实盘之间的鸿沟,往往不在模型,而在数据管道中的静默缺失:数据源没有报错,没有告警,只是悄悄地少给了几天数据。缺失的数据让回测低估风险、高估收益。等你发现问题,对账单已经红了。 数据缺失不会发出声音。必须主动去听。 本文系统拆解历史数据的完整
六家美股数据源 WebSocket 实现质量横评:谁最稳定? 凌晨 3:47,我的 Slack 被一条告警炸醒: > 这不是回测环境,是实盘。策略正在捕捉期权波动率的均值回归机会,而数据源在这最不该断的时候断了。等我手动重启服务、重新订阅、补全数据,15 分钟的流动性窗口已经关闭。 那天早上我亏了 800 美元。但比钱更让我痛苦的是:这个问题本可以避免——如果我选的数据源 WebSocket 实
从回测到实盘:填平那 5 道鸿沟 --- > "回测收益率 47%,实盘第一周亏损 12%。" 这不是你的策略出了问题,而是你的认知模型从一开始就是残缺的。回测和实盘之间隔着五道真实的工程鸿沟:每一个都有人在上面摔死,每一个也都有可工程化的解决方案。 本文不喂鸡汤。我们逐道鸿沟拆解——先说机制,再说代码,最后给出可操作的填平方案。 --- 一、为什么回测永远是"乐观的" 回测系统是一个事后诸葛亮式
成交价与信号价的距离,比你想象的更致命 你盯着屏幕上那条完美的回测曲线,年化收益率 47%,夏普比率 3.2。实盘跑了三个月,收益率变成了 12%。你把因子调了又调,把数据对齐方式改了又改,回测曲线依然漂亮,实盘曲线依然惨淡。 问题往往不在策略本身,而在执行层。 回测引擎用收盘价模拟成交,每笔交易都被假设为"立即以信号价完成"。但真实市场中,买一价在变,经纪商路由在排队,你的订单滑过报价,成交在更
"你的 API Key 还有效,但今日配额用完了" 凌晨两点,你刚写完一套财报事件驱动策略的回测脚本。回测结果漂亮得不像话——年化 34%,夏普 2.1,最大回撤 8%。你信心满满地点下"部署",然后收到了一条报错: 你盯着 愣了三秒,心想:这玩意儿到底限到什么程度? 本文用实测告诉你:TickDB 免费层能做什么、不能做什么,以及配额耗尽后代码应该如何优雅地应对。 --- 免费层到底给了多少?
开头不要重复标题,用场景钩子 --- 你以为写代码是量化最难的环节。 直到你第一次跑回测,发现一只股票的价格在某个时间点突然从 150 元变成了 90 元——不是分红,不是拆股,只是“前复权”还是“不复权”的区别。 然后你研究期权数据,发现希腊字母字母表都认识,但 delta、gamma 混在一起分不清到底该用哪个。 你开始怀疑人生:当年学编译原理、操作系统、分布式系统都没这么费劲,怎么几个金融概
> "The way a CEO answers an analyst's question tells you more than the earnings report itself." 在二级市场,财报电话会议(Earnings Call)是机构投资者获取管理层情绪信号的核心渠道。语调是防御还是进攻?语速加快还是迟疑?被追问时是否换话题?这些信息不会出现在任何 PDF 里,但它们藏在音频里。
策略连续亏损自动熔断:用状态机保护你的账户 凌晨三点,Slack 发出刺耳的告警。 你从床上弹起来,手机屏幕上显示着策略组的监控面板——实盘账户的回撤曲线已经击穿了预设的警戒线。你揉了揉眼睛,确认自己没有看错:过去 72 小时,策略连续亏损 23 笔,累计回撤 8.7%,而你的熔断阈值设定在 5%。 问题在于,你的熔断逻辑是人工判断的——阈值在那里,但没有人半夜三点盯着屏幕。策略还在跑,还在开仓,
> 编辑备注:本文为产品类-竞品对比维度文章,涉及外部数据源对比,按照手册第十八章规定,必须触发外部审核流程。建议配合复盘报告中的 Gemini 审核指令 V2.1 进行事实核查后再发布。 --- 当你的实盘策略因为 WebSocket 断连损失了 8000 美元 美东时间 2024 年 8 月 5 日,"黑色星期一"。日经指数暴跌 12%,VIX 一度触及 65。这一天,全球量化团队的告警系统响
实盘交易的心理陷阱:算法没有情绪,但写算法的人有 > "我最得意的策略,在回测里跑了三年没亏过。结果实盘三个月,我的干预把它毁了三遍。" > > 这是 Reddit quant 版一个老哥的发帖。他的策略没有问题——问题在于他管不住自己的手。 --- 一、为什么我们忍不住干预策略 量化交易的底层逻辑很简单:把情绪从决策链里剔除干净,让数学和概率接管一切。但很少有人告诉新手的是:这套逻辑有一个致命漏
K 线缺失值:你的回测,可能是一场精心策划的自我欺骗 "你的回测跑了一年,夏普比率 3.2,最大回撤 4%,收益曲线漂亮得像教科书。然后实盘第一天,净值直接跌了 8%。" 这不是策略失效,不是市场变了,是数据在骗你。 停牌、午休、断连——K 线里的"洞"比你想象的多。你以为补上了,实际上填法不同,结果天差地别。更可怕的是,这种偏差不会报错,你的回测引擎会一脸无辜地给你一张完美的成绩单。 本文拆解三
用自然语言查行情:TickDB SKILL + AI Agent 实战集成 > "你不需要记住 API 文档,你只需要像问同事一样问 AI。" 凌晨 2:47,你被手机震醒。英伟达盘后发布财报,股价在盘后交易中剧烈波动。你想知道现在的盘口结构——买盘还是卖盘更厚?成交量有没有异常放大? 传统方案:打开终端 → 翻出 API 文档 → 写 Python 脚本 → 调试鉴权 → 等脚本跑完。数十分钟过
> "当 SEC 的调查人员要求你提供三年前某笔交易的数据时,你能在 24 小时内交付吗?" 这不是假设场景,而是 2015 年某匿名对冲基金真实面临的问题。该基金因交易策略亏损遭遇投资人问责,SEC 随即介入审查。调查人员要求调取 2012 年某日的完整交易记录——包括订单簿快照、下单时序、以及对应的 tick 级数据存档。该基金的 IT 系统记录显示"数据已归档",但实际发现归档磁带存在物理损
让行情数据成为业务的延伸:TickDB SKILL 自定义开发完全指南 > “最好的系统不是功能最多的,而是最容易被扩展的。” 这句话在量化交易领域尤为真实。当你的团队需要在 TickDB 标准接口之上构建专属的行情处理逻辑时,你面临的选择是:要么在业务层写一堆胶水代码,要么让数据层本身学会“理解”你的业务规则。 SKILL 协议给了你第二种选择。本文深入解析 TickDB SKILL 的开发规范
量化求职技能图谱:2026 年量化研究员需要会什么 > “面试了 200 个求职者,我发现一个规律:能把简历上的项目讲清楚的人,通常入职后三个月能独立跑策略;连自己代码逻辑都说不圆的人,两周就会开始问蠢问题。” 这不是哪个量化私募 HR 的酒后吐槽,而是我在过去两年里访谈了 12 位量化团队负责人后,最常听到的一句话。 行业在变。2020 年之前,一个会用 NumPy 做均线策略的应届生,简历关通
回测骗了你多少年? 2019 年到 2021 年,有一只量化基金在美股市场频繁交易。他们有完整的因子库、严谨的风控体系、回测系统跑出了年化 42% 的夏普比率。实盘上线三个月,净值从 1.0 跌到 0.73。 事后复盘,原因很简单:他们的回测引擎完全没有模拟滑点。每一次买入,都假设能以报价价格成交。而实盘里,当他们试图建仓 200 万美元的仓位时,股价已经在毫秒内跳升了 0.3%。 这不是个例。根
从"消失的股票"到"完整的时间线" 2019 年 3 月,一家中型量化基金的风控报告里出现了一个诡异的现象:某个均值回归因子在过去两年的回测中表现优异——年化收益率 18.7%,夏普比率 2.3,最大回撤仅 8%。团队对这个因子寄予厚望,上线实盘。 六个月后,因子亏损了 34%,被强制清盘。 复盘时发现,罪魁祸首不是策略本身,而是一个看似无害的数据处理缺陷:他们的回测框架在计算历史某日的沪深 30
低代码量化:用 AI Agent + TickDB SKILL 实现自然语言行情查询 --- > “你脑海中有一个精妙的交易想法,但当它需要变成代码时,那堵墙高得让人绝望。” 这是许多量化爱好者的真实困境。他们理解市场,理解策略逻辑,知道什么时候该买、什么时候该观望——但他们不是程序员。在传统量化开发范式中,从“想法”到“回测系统”之间,隔着环境配置、API 调用、数据清洗、指标计算等一整套技术栈
滑点与冲击成本模拟:让回测更接近实盘 > "回测时我是天才,实盘时我是韭菜。" 这句话在量化圈流传甚广,不是因为交易者谦虚,而是因为回测与实盘之间存在一道隐蔽却致命的鸿沟——滑点与冲击成本。你的策略在历史数据上每一次"假设成交",都隐含着一个不真实的假设:你的订单总能以你想要的价格立即成交。 这是一个危险的假设。 当资金量超过一定规模,当市场流动性出现波动,这个假设会像纸牌屋一样坍塌。本文拆解滑点
凌晨三点,你的策略在干什么 2019年8月5日,一个普通的交易日。A股市场在特朗普宣布加征关税后大幅低开,沪指跌幅超过1.5%。某量化私募的CTA策略在开盘后的15分钟内连续触发止损,亏损迅速扩大。风控人员接到电话时,策略已经亏损了当月预算的40%。 这不是极端行情的偶发事故。这是一个风控系统失效的经典场景:策略在快速下跌中不断入场、止损、再入场,形成了一种被后来者称为"舔血陷阱"的恶性循环。直到