用数据读懂金融市场
数据驱动 · 量化洞察

嗨,我是小T 👋
聊聊金融市场那些事

一个热爱数据的金融博主,用量化视角解读外汇、加密货币、美股、港股、A股及大宗商品市场。

9 市场板块
20 深度文章
15+ 分析标签

全部文章

从个人量化到团队创业:技术之外的挑战

从个人量化到团队创业:技术之外的挑战 写出一个夏普比率 2.0 的策略花了 18 个月。跑通第一个外部账户,又花了 6 个月。账户翻了两倍,你觉得时机到了——该上大仓位,该组团队,该把这件事做成一家真正的公司。 然后你发现,代码能力只是那张牌桌上最基本的一张。真正的挑战,是从"一个人写代码"切换到"带领一群人做事"。融资、法务合规、团队激励、品牌背书,每一项都是独立的专业领域,每一项做错都是致命的

玩金融的小T · 13 阅读

时区标准化:UTC、EST、HKT 统一的最佳实践

时区标准化:UTC、EST、HKT 统一的最佳实践 > “你的回测曲线看起来完美,但实盘亏损了 30%。你以为是策略问题,实际上可能是时间戳差了 6 个小时。” 这不是夸张。我在一家量化基金的回测复盘会上,亲眼见过这样的案例:团队用港股财报时间(港交所 16:00 发布)和美股盘前数据做套利策略回测,胜率 78%。上线三个月后,策略持续亏损。最后定位到的问题是——他们以为港股财报在 UTC 16:

玩金融的小T · 10 阅读

同一个 Ticker,两家公司:历史数据查询的隐形大坑

同一个 Ticker,两家公司:历史数据查询的隐形大坑 2010 年 5 月,一位量化研究员用雅虎财经的历史数据测试他的价值因子策略。回测显示他在 2005-2009 年间获得了惊人的超额收益。他信心满满地实盘运行了三个月,然后亏损了 30%。 问题不在策略逻辑,不在因子计算,而在于他用的历史数据里,有一个 Ticker 在 2006 年换了一家公司。前东家是市值 200 亿美元的制药巨头,后东家

玩金融的小T · 5 阅读

停牌和缺失值:回测中最容易忽视的数据陷阱

凌晨三点,你的回测曲线悄悄骗了你 2019 年底,一位从事均值回归策略的量化研究员发现了一个诡异现象:他的策略在历史回测中年化收益 23%,夏普比率 1.8,但实盘运行三个月后,收益是负的。他花了两周时间排查因子、排查交易逻辑,最后发现问题出在一个他从未怀疑过的地方——停牌日的数据填充方式。 这不是孤例。在我们对 47 个个人量化项目和 12 个机构量化团队的访谈中,超过 80% 的团队没有系统性

玩金融的小T · 8 阅读

TickDB REST vs WebSocket:什么场景用哪个?接口设计的取舍

凌晨三点,策略的实时监控模块突然报了一条告警——某个期货品种的买卖价差在 3 秒内扩大了 40%。你打开日志,发现 WebSocket 连接在 6 分钟前悄无声息地断开了。 你的第一反应是什么?很多人会想:为什么不直接用 REST 轮询?反正我每小时才查一次历史数据,现在查一次实时快照应该也够用吧。 不够用。 这不是因为 REST "不够好",而是因为它的设计初衷和实时行情的物理需求根本不在同一个

玩金融的小T · 10 阅读

相关性不等于因果:冰淇淋销量和溺水人数正相关

相关性不等于因果:冰淇淋销量和溺水人数正相关 > "在这个世界上,有三种谎言:谎言、该死的谎言,以及统计数据。" > —— 马克·吐温(亦有传为本杰明·迪斯雷利) --- 开篇:那个让统计学蒙羞的经典案例 2012 年一项研究显示,美国冰淇淋销量与泳池溺水人数呈现出惊人的同步性——每当冰淇淋销量上升,溺水事故也随之增加。 如果你是泳池经营者,你会不会得出"冰淇淋导致溺水"的荒谬结论? 当然不会。但

玩金融的小T · 7 阅读

Python 量化生态全览:从数据到回测到实盘的工具链

当你的回测曲线漂亮得像假数据 凌晨三点,你盯着屏幕上那条完美的夏普比率曲线,心潮澎湃。5.2,最大回撤只有 3%,你甚至已经在脑海里规划法拉利选配了。 然后你打开实盘。 三个月后,你终于明白了一件事:回测是历史,回测是你用后视镜开车,而市场是一条永远不重样的路。 这不是你的策略有问题。这是你的工具链从一开始就走偏了——你用教学级的库做生产级的梦,用玩具级的数据做实盘级的决策。 Python 量化生

玩金融的小T · 7 阅读

逐笔成交方向推断:用 tick 数据还原每笔交易的买卖方向

逐笔成交方向推断:用 tick 数据还原每笔交易的买卖方向 一、为什么这件事不简单 你有 10 年的美股 tick 数据,每一笔成交记录包含:时间戳、成交价、成交量。 你的任务是:给每一笔成交打上标签——这笔是主动买入还是主动卖出。 听起来是个简单的分类问题。价格上涨 → 买方推动 → 主动买入;价格下跌 → 卖方推动 → 主动卖出。 但实际数据会立刻给你一个下马威:超过 40% 的成交恰好发生在

玩金融的小T · 9 阅读

停牌前后 K 线缺口如何处理?回测中最容易忽视的数据陷阱

当市场按下暂停键:停牌数据的回测陷阱与系统性修复 2019年3月25日,波音股价在埃塞俄比亚航空坠机事故后宣布停牌。当日纽交所的行情数据显示:前一交易日收盘价 $391.00,次日复牌开盘价 $375.00,直接跳空 4.1%。这不是一个孤例——美股市场每年因个股事件导致的临时停牌超过 200 次,而大多数回测框架在处理这类数据时,要么默默填充 NaN 导致因子计算崩溃,要么简单用前值填充引入系统

玩金融的小T · 10 阅读

财报发布那 5 秒:用 depth 频道实时捕捉流动性塌陷

财报发布那 5 秒:用 depth 频道实时捕捉流动性塌陷 --- > "价格是结果,订单簿是原因。" > > 美东时间 2 月 15 日盘后,英伟达发布 FY2026 Q4 财报。营收同比增长 265%,但股价在盘后交易中先涨 8% 后跌 3%,30 分钟内振幅超过 11%。事后诸葛亮式的分析文章铺天盖地,但没有人告诉我们:在这 11% 振幅发生之前,订单簿里究竟发生了什么。 本文的回答分两部分

玩金融的小T · 7 阅读

如何估算你的 TickDB 月消费?用量预测与成本优化指南

你以为 API 调用是免费的?一位量化工程师的血泪账单 凌晨两点,你被一条告警推送惊醒。 不是策略亏损,不是数据延迟——是云账单。系统提示你这个月的 TickDB 用量已经超过了预期预算的 340%。 你盯着后台的调用日志,陷入了沉思:明明只接入了 100 只股票,为什么调用量会爆炸到 900 万次?哪个环节出了问题? 这不是孤例。在量化开发者的社群中,每个月都会有人发出类似的灵魂拷问。我见过有人

玩金融的小T · 8 阅读

从 tick 到 K 线:价格是如何被“压缩”的

从 tick 到 K 线:价格是如何被"压缩"的 你盯着屏幕上跳动的数字——每一笔成交的单子,都在改变着市场的轨迹。但当你打开交易终端,看到的却是一根根整齐的 K 线:开盘价、最高价、最低价、收盘价。 这中间发生了什么? 那些毫秒级别的微观事件,如何被压缩成你每天看到的"一根线"?为什么同一个市场、同一个时间段,你和他画出来的 K 线可能不一样? 这不是一个无聊的技术细节。聚合规则的选择,直接决定

玩金融的小T · 14 阅读

从回测到实盘:填平那 5 道鸿沟

从回测到实盘:填平那 5 道鸿沟 > "回测年化 87%,实盘三个月亏 12%。" > > 这是我见过最让人沮丧的量化交易结局。不是策略本身的问题,而是那个人从一开始就没搞清楚回测系统和真实市场之间横亘着多少条鸿沟。 回测是一个完美的实验室。数据干净,延迟为零,成交无限快,滑点可以忽略不计。而实盘呢?每一笔挂单都要经过交易所的订单匹配引擎,每一笔成交都要排队等撮合,网络链路上的每一个节点都在产生时

玩金融的小T · 14 阅读

跨市场价差 Z-Score:美股-港股套利监控的工程实现

跨市场价差 Z-Score:美股-港股套利监控的工程实现 > "价差本身不会说话,但当它开口时,市场已经在行动了。" 美东时间上午 9:30,纳斯达克的交易员盯着 NVDA 的报价。与此同时,地球另一端的香港联交所刚刚结束午盘休息,商汤科技的盘后交易数据正在生成。两个市场、三种货币、十六个小时的时差——但对于跨市场套利者而言,这些都是可以工程化解决的问题。 真正的挑战不在于"价差是否存在",而在于

玩金融的小T · 9 阅读

美股趋势跟踪策略:用 NBBO 实时报价优化入场滑点

美股趋势跟踪策略:用 NBBO 实时报价优化入场滑点 > "你的趋势信号对了,但执行价格差了 0.3%。一个点的滑点,一个月的 alpha 就没了。" 这是每一个趋势跟踪策略开发者迟早会撞上的墙。 2024 年 8 月,一个做美股动量策略的团队在做策略归因时发现:他们基于 20 日均线突破构建的策略年化收益约 14%,但模拟撮合记录显示,实盘中预估滑点吃掉了其中近 4 个百分点。更吊诡的是,滑点最

玩金融的小T · 13 阅读

隔夜信号预计算:盘前流动性预估与开盘策略准备

盘后不是休市,而是信号的起点 "9:25:03。" 你盯着屏幕右下角的时间,手指悬在鼠标上方。集合竞价还剩两分钟,但订单簿上的数字已经开始躁动——盘前交易的挂单量在最后五分钟突然放大,卖一档的挂单量从 8,000 股跳到 23,000 股。 这不是随机波动。这是机构在收盘后到次日开盘前这段"信息真空期"里,提前布置好的战术痕迹。 对于量化交易者而言,这段时间从来不是真正的休市。从技术分析的角度看,

玩金融的小T · 8 阅读

TickDB SKILL 协议详解:如何让 AI 助手理解你的行情查询

当 AI 助手说“根据公开信息,NVDA 近期走势强劲”时,你有没有想过:它其实可以更聪明——直接调用 TickDB,拿到实时行情,告诉你买卖价差扩大了多少、depth 档位有什么变化? 这不是假设,而是 TickDB SKILL 协议正在实现的事。 本文从协议规范、解析机制到 Function Calling 全链路拆解,让你能为自己的 AI 助手接入 TickDB 的实时数据能力。 --- 一

玩金融的小T · 7 阅读

回测的 7 个致命偏差:你中招了几个

回测的 7 个致命偏差:你中招了几个 --- 写在回测结果之前的沉默 你的策略年化收益率 34%,夏普比率 3.2,最大回撤 8%。实盘跑了一个月,净值从 1.0 跌到了 0.91。 你盯着屏幕,开始怀疑人生:是我的策略写错了?是市场变了?是运气不好? 都不是。 你的策略可能从写完的那一刻起就已经死了——死在回测报告那一行漂亮的数字里。 这不是少数人的悲剧。2012 年,Marcos López

玩金融的小T · 18 阅读

因子挖掘的完整方法论:从数据到信号到回测验证

因子挖掘的完整方法论:从数据到信号到回测验证 > "你在因子库中加入第 47 个因子的时候,这个因子还有效吗?" 三年前我在做因子研究时,犯过一个现在看来极其愚蠢的错误:我用 2008-2019 年的数据挖出了一个 "收盘价与成交量的比值平方根" 因子,IC 达到了 5.2%,回测夏普 1.87。兴奋之余,我在 2020 年的实盘里亏了 12%。 那个因子当然不是真的有效——它是数据的幻象。我的错

玩金融的小T · 12 阅读
Esc
输入关键词开始搜索