不是赚多少的问题,是下多大注。

胜率高不等于赚钱,看对方向不等于仓位对。一位交易员胜率 60%、盈亏比 1:1,重仓过头会在连续 5 次负中一次性爆仓;轻仓过头则 10 年也没什么收益。“该下多大注”是比”下什么方向”更本质的问题。凯利公式(Kelly Criterion)是这个问题的数学答案——由贝尔实验室 John Kelly 1956 年为香农(Claude Shannon)的通信理论推导,后被 Ed Thorp 用到 21 点和权证套利,最终成为专业投资者仓位管理的基石。这份指南把凯利公式和期望值、破产风险、夏普比率、波动率目标、均值方差、风险平价、CPPI 等相关仓位公式一次性整理成可反复翻阅的入门 primer。

§01 · 框架 — why sizing dominates

Red Casino-Style Die · 赌场用红色骰子 — 赌场骰子 — Kelly 公式起源于 Bell Labs 的 John Kelly 在赌博与赔率信号上的思考。本文把 12 个仓位管理公式(Kelly / Half / Quarter Kelly · Sharpe · Sortino · 波动率目标 · 风险平价 · CPPI / Optimal F)整理成可操作 primer。
图片:Wikimedia Commons / CC BY-SA 3.0。

假想一个游戏:扔硬币,正面你赢 2 倍,反面你输本金。理论上长期期望值 = +50%,怎么下都赚钱?错。如果你每次全押,只要一次反面就归零——期望值再正,long-run 概率 1 的破产。

这就是 John Kelly 1956 年在论文 A New Interpretation of Information Rate 里要解决的问题:长期资金指数增长最大化的下注比例。他的答案就是凯利公式。

胜率 × 盈亏比 ≠ 赚钱。 60% 胜率、1:1 盈亏比 → 期望值正,但单笔 100% 仓位 6 把后概率归零。下注大小改变”算术期望”变成”几何期望”——这是复利机制核心。
算术平均 ≠ 几何平均。 连续两年 +50%、-50%:算术平均 0%,但几何平均 = √(1.5×0.5) - 1 = -13.4%。复利世界只看几何平均,这是为什么大回撤比大收益更重要。
仓位 = 风险管理的主要工具。 同一个策略,不同仓位可以让 Sharpe 0.8 的策略变成 Sharpe 3 的”灾难”(过满)或者 Sharpe 0.2 的”平稳”(过轻)。Sharpe 比率不变,但长期复合收益率完全不同。
“我应该下多大”的四种答案。 ① 凯利(几何最优,但假设已知真实概率);② 波动率目标(锁定组合波动);③ 均值方差(给定收益目标下最小波动);④ 风险平价(每个资产贡献等量风险)。四种方法回答的是不同问题。

Bottom Line · 选对方向只给你期望值,选对仓位才给你复利。

专业投资者把 70% 精力放在风险预算,30% 在方向。散户恰好反过来。Ed Thorp、Jim Simons、Paul Tudor Jones 都公开表示过:“The key to wealth is not being wrong, it’s not being wrong big.”

§02 · 期望值 — Expected Value

凯利公式之前,先要搞清期望值(Expected Value)。没有正 EV 再完美的仓位公式也挽救不了亏损策略。

EV · 期望值。 EV = p × W − (1−p) × L。p = 胜率;W = 每次赢多少;L = 每次输多少。EV > 0 是”可下注”的最低门槛,但不代表可以任意下注。例:p=60%, W=$100, L=$100 → EV = $60 − $40 = +$20/局。
b · 赔率 / 盈亏比。 b = W / L。每输 1 美元,赢 b 美元。经典凯利公式参数。股票交易里相当于”止盈空间 / 止损空间”。
Edge · 优势。 Edge = EV / 下注额 = p × b − (1−p)。“每下 $1 平均赚几毛”。Edge > 0 才值得下注。专业赌场玩家长期 Edge 通常是 1–2%。
Win Rate · 胜率。 盈利交易次数 / 总交易次数。不等于盈利能力——趋势跟踪常 35% 胜率但盈亏比 3:1 仍赚钱。
Payoff Ratio · 盈亏比。 PR = 平均盈利 / 平均亏损。赚的那几笔平均赚多少 / 亏的那几笔平均亏多少。PR × Win Rate > 1 − Win Rate 是正期望条件。
Breakeven Win Rate · 盈亏平衡胜率。 BEWR = 1 / (1 + PR)。给定盈亏比,多大胜率才能不亏?PR=1 → 50%;PR=2 → 33%;PR=3 → 25%。
Profit Factor · 盈利因子。 PF = 总盈利 / 总亏损。回测最常用的指标之一。PF > 1.5 可接受,PF > 2 优秀,PF > 3 警惕过拟合。
Expectancy · 单笔期望。 E = (Win% × AvgWin) − (Loss% × AvgLoss)。每笔交易平均能赚多少钱。Expectancy × 年度交易数 ≈ 年化收益(忽略复利)。

建议 · 先确认 EV 正,再谈仓位。

很多新手拿凯利公式去套明显负期望的策略(比如”每天买开盘 / 卖收盘”),结果是”更快爆仓”。凯利对正期望策略给出最优 sizing,对负期望策略给出”最快亏光”的 sizing——它只是放大器,不是魔法棒。

§03 · 凯利公式 — the Kelly Criterion

凯利公式有三种常用形式,分别对应:二元下注(赌博)、多元独立下注(组合)、连续分布(金融资产)。先从最简单的入手。

Kelly(离散)· 经典二元下注版本。 f* = (bp − q) / b = p − q/b,其中 p = 胜率,q = 1 − p,b = 赔率(每 $1 赢 $b)。f* = 每次应该下注的资金比例。例:p = 60%、b = 1(赢 1 赔 1),f* = 0.6 − 0.4/1 = 20%。每局用 20% 资金,长期几何增长率最大。
Kelly(连续)· 金融资产版本。 f* = (μ − r) / σ²,其中 μ = 资产预期超额收益,r = 无风险利率,σ² = 资产方差。Merton 1969 推导。对持续分布的资产 / 策略,最优仓位 = 超额 Sharpe 的直接反映。Sharpe² = 2 × Kelly 的几何增长率,这是凯利和 Sharpe 的深层联系。
Kelly(多资产)· Generalized Kelly。 f* = Σ⁻¹ × (μ − r·1),其中 Σ = 协方差矩阵,μ = 收益向量。多个相关资产时,不能对每个独立用 Kelly——需要考虑协方差。这个公式本质就是 Markowitz 切点组合 × 一个风险偏好参数。

凯利的三个数学性质: ① 长期几何增长率最大化(log-optimal);② 达到任何财富目标时间最短;③ 永不破产(假设连续可调整仓位)。

但有三个前提: ① 概率 + 赔率”准确已知”;② 可以无限分割仓位;③ 只关心长期 log-wealth。

Kelly 在不同场景的实例

场景	胜率 p	盈亏比 b	凯利 f*	含义
Thorp 21 点	51%	1:1	2%	每手下 2% bankroll
趋势跟踪 CTA	40%	3:1	20%	单品种 20% 仓位
日内动量	55%	1:1	10%	胜率稍高,盈亏持平
Merger Arb	90%	1:15	3.3%	高胜率 + 极低赔率
事件驱动	50%	2:1	25%	赔率好补偿中等胜率
SP500(连续)	—	μ=6%, σ=16%	234%	理论全仓 + 135% 杠杆(不现实)

⚠ 关键 · 凯利公式输出的是”已知真实概率下”的理论最优。

现实里概率和赔率都是估计的——你以为的 60% 可能是真实 52%。这种”参数不确定性”导致真实世界应该用分数凯利(见 §04),而不是全凯利。专业投资者实际下注通常是半凯利或四分之一凯利。

§04 · 分数凯利 — why practitioners under-bet

学术 Kelly 在”参数完全已知”的假设下是最优的。现实中参数永远有误差,所以专业投资者”打折”使用——这就是 Fractional Kelly(分数凯利)。

Half Kelly · 半凯利。 f = 0.5 × f*。最常用的”稳健版”。几何增长率只损失 25%(0.75 × Full Kelly),但回撤大幅减小。Ed Thorp 自己管基金时就用 Half Kelly。
Quarter Kelly · 四分之一凯利。 f = 0.25 × f*。更保守版本。生存优先,增长其次。很多 CTA 基金实际运行在 0.2–0.3 倍凯利附近。
Full Kelly 回撤 · 全凯利的代价。 全凯利理论回撤概率 50%+,期望最大回撤 ~50%。心理承受极限远低于数学最优——即使你懂数学,客户 / 股东也不懂。
Kelly Leverage · 凯利杠杆。 Kelly 公式常常给出 > 100% 的 f*(需要杠杆)。SPX 理论凯利 ~234% = 2.34 倍杠杆——几乎没人真的这样做。
Overbet · 超额下注。 f > f*。几何增长率急剧下降——1.5× 凯利增长为 0,2× 凯利 = 长期期望回报为负。
Underbet · 不足下注。 f < f*。安全,但增长慢。“Kelly 以下始终正期望”,所以保守几乎没有数学代价,只有机会成本。

几何增长率 vs 凯利倍数

下注倍数(vs 凯利)	几何增长率(相对)	最大回撤(样本)	评价
0.25×(Quarter Kelly)	44%	~15%	极稳健
0.5×(Half Kelly)	75%	~25%	黄金区间
0.75×	94%	~40%	偏激进
1.0×(Full Kelly)	100%	~50%+	数学最优
1.5×	75%	~75%+	超额下注(负面)
2.0×	0%	极大	零增长
> 2.0×	负值	接近 100%	长期必破产

§05 · 破产风险 — Risk of Ruin

破产风险(Risk of Ruin)是赌博理论的核心概念。对于有限样本 + 凹效用函数的玩家,Sharpe 比率、EV、凯利都可能骗你——但”账户归零的概率”永远骗不了人。

Risk of Ruin · 破产概率。 ROR = ((1−A)/(1+A))^C,其中 A = 优势(per bet),C = 资金单位数。有限样本破产公式。Edge 越小、资金单位越少,ROR 越高。凯利的”永不破产”只在无限时间 + 可连续调仓下成立。
Gambler’s Ruin · 赌徒破产问题。 经典概率问题:每局 50/50 输赢 $1,带着 $N 来,$M 就走。破产概率 = M/(M+N)。所以想赚小钱容易,想翻倍难。
Max Drawdown · 最大回撤。 从历史最高净值到某一低点的跌幅。MDD 50% 后需要翻倍才能回本,心理比数学更难。专业资金管理者 MDD 红线多在 15–20%。
Calmar Ratio · 卡尔玛比率。 Calmar = 年化收益 / |MDD|。“每单位最大回撤换了多少年化”。Calmar > 0.5 合格,> 1 优秀,> 2 杰出。比 Sharpe 更能反映”体验”。
Ulcer Index · 溃疡指数。 UI = √(Σ DD_t²/T)。回撤的均方根。Peter Martin 提出,比 MDD 更平滑。用来惩罚”长期小回撤”和”短期大回撤”综合心理负担。
Time to Recovery · 回本时间。 从 MDD 低点回到前高需要多久。高波动策略即使 Sharpe 好,回本期也可能很长。2008 金融危机后 S&P 5 年才回本。
Stop-Loss · 止损阈值。 预设”账户回撤到 X% 就停下”。不是防止亏损,是防止情绪失控。机构常用 15% 月度停、20–25% 年度停机制。
VaR · CVaR · 风险价值 / 条件风险价值。 VaR_95 = 5% 分位数损失;CVaR = 超过 VaR 的平均损失。“95% 概率,一天不会亏超过 X”。CVaR(ES / Expected Shortfall)比 VaR 更能反映尾部风险,2008 后取代 VaR 成为监管主流。

§06 · 夏普 · 索提诺 — the performance ratios

Sharpe / Sortino / Calmar / Information Ratio 是”收益 / 风险”的不同版本。不知道用哪个就默认 Sharpe,但其实每一个都回答略不同的问题。

Sharpe · William Sharpe 1966 · 夏普比率。 Sharpe = (μ − r) / σ。最通用。用总波动率。Sharpe 1 = 有用、> 1 = 好、> 2 = 优秀、> 3 可能过拟合。CTA 长期 0.5–0.7,StatArb 2–3,HFT 5–10+。
Sortino · 索提诺比率。 Sortino = (μ − r) / σ_down。只用下行波动率作为分母(上涨不算”风险”)。适合评估非对称分布策略(如 put selling)。Sortino 比 Sharpe 通常高 30–50%。
Calmar · 卡尔玛比率。 Calmar = μ / |MDD|。收益 / 最大回撤。对客户最直观——“我最惨那段亏了多少?”
Information Ratio · 信息比率。 IR = α / TE,其中 α = 相对基准超额,TE = Tracking Error。主动管理衡量标准。长期 IR > 0.5 = 好的主动经理;> 1 顶级。
Treynor · 特雷诺比率。 Treynor = (μ − r) / β。用 β 作为分母,衡量每单位”系统性风险”的超额。只在已充分分散的组合中有意义。
Omega Ratio · Omega 比率。 Ω(r) = ∫(+)/(−) 按阈值 r 分割上下尾。考虑整个收益分布的不对称,比 Sharpe 更全信息。学术流行但工业应用有限。
MAR Ratio · MAR 比率。 MAR = CAGR / |MDD|。Managed Account Reports 创造。Calmar 的变种,用 CAGR 而非平均年化。CTA 行业标准评估指标。
Sharpe → Kelly · 夏普与凯利。 几何增长率 ≈ Sharpe² / 2。凯利最优化下,长期几何增长率 ≈ Sharpe 平方的一半。Sharpe 1 = 50bps/年几何增益;Sharpe 2 = 2%/年。这揭示了”高 Sharpe 策略 = 更陡峭复利”的本质。

§07 · 波动率目标 — the simplest sizing rule

波动率目标化(Vol Targeting)是机构投资者用得最广的仓位方法。比凯利更简单,不需要估期望收益——只需要把组合波动率锁定在目标水平。

Vol Target · 波动率目标。 Position = (Target σ / Asset σ) × NAV。例:Target σ = 10%、SPX σ = 16% → Position = 62.5% NAV。把资金按”目标波动率 / 资产当期波动率”调整仓位。资产波动扩大时自动减仓,反之加仓。这是大部分风险平价 / CTA 的底层机制。
Realized Vol · 已实现波动率。 σ_real = std(daily returns) × √252。过去 N 天(常用 20–60 天)日收益的年化标准差。EWMA(指数加权)和 GARCH 是更精细的估计方法。

为什么机构都在用

风险预算 —— 提前知道”最多波动多少”,对客户说得清。
波动率聚簇 —— 已实现波动对未来预测性强(尤其短期)。
避开危机 —— 2020-03 / 2008 波动飙升时自动减仓。
长期收益保留 —— 实证显示 Vol-Target 组合的 Sharpe 比不管理波动的原始组合高 10–20%。
可组合 —— 多个 Vol-Target 资产叠加就是风险平价。

实务参数

策略	Target σ
保守多元组合(60/40 类)	6–8%
稳健绝对收益	8–10%
股票基金	12–16%
对冲基金(典型)	10–15%
CTA 趋势	15–20%
激进多空	20–30%

§08 · 均值方差 — Mean-Variance Optimization

Harry Markowitz 1952 年在 Portfolio Selection 里建立现代资产组合理论(MPT),拿了 1990 诺贝尔经济学奖。凯利 1956 是他 4 年后。两者都在问”如何分配仓位”,只是目标函数不同:Markowitz 最小化方差给定收益,Kelly 最大化几何增长。

MPT · Modern Portfolio Theory · 现代组合理论。 min w'Σw s.t. w'μ = μ_p, Σwᵢ = 1。给定目标收益 μ_p,求方差最小的权重 w。输出是”有效前沿”(Efficient Frontier)——所有”最优”组合的包络线。
Efficient Frontier · 有效前沿。 收益-风险平面上的上方边界。任何不在前沿上的组合都是次优的——可以在保持风险不变时提高收益。
Tangency Portfolio · 切点组合。 w = Σ⁻¹(μ − r·1) / denominator。和无风险资产连线切到有效前沿的那个点——夏普比率最大的组合,CAL(Capital Allocation Line)的起点。
CAPM · Capital Asset Pricing Model · 资本资产定价模型。 E(Rᵢ) = Rf + βᵢ(Rm − Rf)。从 MPT 推演出的定价理论。只有不可分散的系统性风险(β)有溢价,特定风险应该被分散掉。
Black-Litterman 模型。 Goldman Sachs 1990 改进版。以市场均衡权重为先验 + 投资者”观点”为似然 → 后验组合。解决纯 MPT 对输入极度敏感的问题。
Shrinkage · 收缩估计。 样本协方差矩阵在高维下不稳定。Ledoit-Wolf shrinkage 把样本 Σ 朝一个结构化目标(单位矩阵、对角矩阵)“收缩”,显著改善 out-of-sample 表现。

⚠ MPT 最大实务问题 · 输入敏感度极高——“Optimization 越优化越差”。

MPT 用历史估计 μ 和 Σ 作输入,但μ 的估计误差远大于 Σ。小误差会被优化器放大成极端权重(做空某资产 300%、做多某资产 400%)。实务几乎从不直接用 MPT,而是用:Black-Litterman / Shrinkage / Risk Parity / Equal Weight 等 robust 变体。简单的 60/40 长期 Sharpe 常常和”科学最优”的 MPT 相当。

§09 · 风险平价 — Risk Parity

Ray Dalio 在 1996 年用 Bridgewater 做出风险平价(Risk Parity),核心思想:不按资金比例分配,按”风险贡献”比例分配。每个资产对组合风险贡献相等。

Risk Parity · 等风险贡献 · 风险平价。 RCᵢ = wᵢ × (Σw)ᵢ / σ_p;需要:RCᵢ = 1/N ∀i。每个资产对组合风险的边际贡献相等。“传统 60/40 里股票贡献了 90% 的波动”——风险平价用更多债券 + 适度杠杆把股债风险均衡。
Naive RP · 简化版 / Inverse Vol。 wᵢ = (1/σᵢ) / Σ(1/σⱼ)。只用每资产波动率倒数加权,忽略相关性。虽然不是真正的 RP,但实务中常常和正式 RP 差不多,简单可靠。

经典 All Weather 配置

资产类	权重(典型)
美股	30%
长期国债	40%
中期国债	15%
黄金	7.5%
商品	7.5%

优缺点

优点:

长期 Sharpe 高于 60/40(~0.7 vs 0.5)
回撤低 + 恢复快
对经济环境(增长、通胀)更稳健
不依赖对 μ 的精确估计

缺点:

需要**杠杆(1.5–2×)**才能达到股票的绝对收益
对利率冲击敏感——2022 股债双杀,风险平价 -20%+
债券超配假设”股债负相关”不总成立
复杂度 + 运营成本高于简单指数

其他常见仓位规则

CPPI · Constant Proportion Portfolio Insurance · 恒定比例组合保险。 风险资产 = m × (NAV − Floor),其中 m = 乘数(3–5),Floor = 底线金额。净值上涨时加仓、下跌时减仓。“保本 + 参与上涨”产品的底层。缺点是在震荡市反复止损,在 2008 大量 CPPI 产品触底被 trap。
Volatility Scaling · 波动率调整。 把每个策略缩放到相同波动率后加权。所有多策略平台(Millennium / Citadel / Balyasny)的底层机制。
Optimal F · Ralph Vince 最优 f。 凯利的期货扩展版本,按历史最大亏损归一化。比 Kelly 更激进,Ralph Vince Mathematics of Money Management。实务争议大。
Fixed Fractional · 固定比例法。 最简单:每次固定下账户的 X%(例如 2%)。交易新手推荐起点。凯利本质是”动态 fixed fractional”。
Fixed Dollar · 固定金额法。 每次下注金额不变(如总是 $1,000)。亏钱不减仓,赚钱不加仓。避免了情绪调仓,但长期复利效应差。
Anti-Martingale · 反马丁格尔。 “赢了加仓,输了减仓”。和 Martingale”输了翻倍”相反。顺应趋势的自然仓位机制——凯利在胜率稳定时也是”反 Martingale”。

§10 · 实战流程 — end-to-end sizing workflow

有一个正期望策略(无论是交易、赌博、还是商业投资),下面这套流程帮你从”要不要下注”到”下多大”完整决策。

第 1 步 · 验证正期望

至少 100+ 样本的回测 / 历史数据
Expectancy > 0 在 out-of-sample
对交易成本 / 滑点 / 税费做了扣除
Profit Factor > 1.5
胜率 × 盈亏比 > 1

第 2 步 · 估计参数

胜率 p 的 90% 置信区间
盈亏比 b 的稳定性(不同时段)
参数误差来源(样本太少 / 结构变化)
一般比估计值”打折”——真实经常比回测差 20–30%

第 3 步 · 计算 Kelly

f* = p − q/b(离散)或 (μ−r)/σ²(连续)
考虑多策略相关性(用协方差矩阵 Kelly)
实际下注用 Half Kelly 或 Quarter Kelly
再单独加”心理回撤上限”约束(MDD < 15%)
仓位不超过单一资产 20–25%(避免单点风险)

第 4 步 · 运行 + 复盘

每月 / 每季度重新估计 p, b
参数变化 > 20% 时重算 Kelly
记录实际 Sharpe vs 回测 Sharpe
触发停止条件:Expectancy 转负 / MDD 超阈值
每年回顾整个 sizing 框架是否需要调整

一个典型示例 · $100K 账户 + 一个 Sharpe 1.0 的策略如何下注?

策略回测:μ = 15%(年超额),σ = 15%,Sharpe = 1.0

连续 Kelly f* = μ/σ² = 0.15 / 0.0225 = 6.67×(理论 666% 杠杆)

Half Kelly → 3.3× 杠杆(仍不现实)

Quarter Kelly → 1.67× 杠杆(可行)

加 20% MDD 约束:实际仓位 < 1.0× NAV

结论:用 100% NAV(无杠杆),年化期望 15%、最大回撤 20–25%、Sharpe 保持 1.0

杠杆诱惑很大但参数不确定性让 1× 成为更稳健的选择

§11 · 常见陷阱 — the usual suspects

用回测参数直接算 Kelly。 回测 Sharpe 2.0 可能真实 0.5。参数不确定性意味着永远打折——全凯利几乎从不应该用。
忽略相关性加仓。 “每个策略下 10%” × 5 个策略 = 50% 仓位 — 但如果 5 个策略相关性 0.8,实际风险等于 40% 单一策略。要用协方差矩阵。
Martingale 追损。 “亏了就加倍,总能回本”——数学上是正期望,但需要无限资金。现实中破产概率 > 50%。历史上所有”Martingale 机器”最终都爆仓。
Kelly 用在负期望策略。 负期望下 Kelly 给出负仓位(应该反向做)。如果你坚持做多,Kelly 变成”如何最快亏光”的公式。先确认 EV > 0。
固定金额 vs 固定比例混淆。 “总是下 $1,000”和”总是下 1% NAV”复利效果天差地别。长期一定要用比例,否则赚钱不复利,亏钱却按 % 计。
波动率用得太远。 用 3 年波动估当前波动 = 低估突发波动。EWMA 或 1–3 月窗口更反映当下。
忽视”杠杆成本”。 Kelly 常给出 > 100% 仓位,需要借钱。借贷成本 3–6%/年吃掉很多超额——实际 Kelly 要减掉 borrowing rate。
一个 Sharpe 打天下。 策略 A Sharpe 1.0 但尾部厚 vs 策略 B Sharpe 0.8 但分布正态。Kelly 结论不同。正态假设下 Kelly ≈ Sharpe²/2,非正态要重新推。
MDD 止损 = 在底部卖。 严格 “20% 止损” 的策略,在 2020-03 或 2008-10 会全部砍仓 → 错过反弹。MDD 规则需要和”波动状态”结合,或用波动率目标代替硬止损。
过度集中 high-conviction。 “这次我非常确定” → 压 40% 仓位。Kelly 对参数估计的稳健性比信心重要——即使高信心也建议不超 25% 单一资产。
Sharpe ≠ 经济学最优。 高 Sharpe 可能来自尾部卖期权策略——99% 时间赚 1%,1% 时间赔 30%。Sortino / Calmar / MDD 必须同时看,Sharpe 不是唯一。
心理 vs 数学不匹配。 数学上 Half Kelly 最优,但客户 / 自己 MDD 30% 受不了。心理承受力决定实际 sizing,不是数学。顶级管理人把心理承受力作为硬约束,不是”可调优项”。