Tokens 成本速算公式
先拆出输入和输出,再拆缓存与非缓存,最后按单价相加。这个页面既能看公式,也能直接算价格。
总 tokens = 输入 + 输出
支持缓存击中率
支持 20:1 等任意输入输出比
可切换 ≤272K / >272K 单价
一眼看懂的通用公式
设总 tokens 为 T,输入输出比为 a:b,缓存击中率为 h。
输入 tokens = T × a / (a + b)
输出 tokens = T × b / (a + b)
缓存输入 = 输入 × h,非缓存输入 = 输入 × (1 - h)
总成本 = 非缓存输入/1,000,000 × 输入价 + 缓存输入/1,000,000 × Cache Read 价 + 输出/1,000,000 × 输出价
如果你的条件固定为 20:1 + 80% 缓存命中 + ≤272K 档价格,那么每 100 万总 tokens 的成本约是 $1.38095。
换句话说,总成本 ≈ 总 tokens(百万) × 1.38095。所以 1 亿总 tokens 约 $138.10,2 亿约 $276.19。
常用价格预设
≤272K 档
Input: $2.5 / 1M
Output: $15 / 1M
Cache Read: $0.25 / 1M
>272K 档
Input: $5 / 1M
Output: $22.5 / 1M
Cache Read: $0.5 / 1M
两个现成例子
1 亿总 tokens,20:1,80% 缓存命中,≤272K 档
成本约 $138.10
2 亿总 tokens,20:1,80% 缓存命中,≤272K 档
成本约 $276.19
同样条件但按 >272K 档
每 100 万总 tokens 约 $2.40476
在线速算
默认已经填好你前面那组参数。改数字后会自动更新。
输入 tokens-
输出 tokens-
缓存输入-
非缓存输入-
输入成本-
输出成本-
缓存成本-
总成本-
说明:这里默认把“总 tokens”理解为 输入 + 输出 的总和。如果你说的 tokens 只指输入,那就要换一套算法。