Skip to content

缓存命中折扣说明

AI Ping 提供隐式的“缓存命中”折扣,用户无需配置默认开启,如果多次前缀相同的请求命中同一服务商且触发了缓存命中,则 AI Ping 会提供同等的折扣价格。

1. 什么是缓存命中折扣

当同一服务商对单个的请求输入前缀命中了缓存,服务商通常会把这部分输入 token 以更低成本复用,从而使本次请求的输入成本下降。

在 AI Ping 平台上,用户不需要额外传参数来开启缓存命中折扣功能。如果上游服务商返回了命中缓存的 token 数量,则 AI Ping 平台会按折扣单价计费。

2. 触发条件

缓存命中折扣是否生效取决于两个条件同时满足:

  • 您的请求成功命中缓存
  • 该服务商提供了缓存命中折扣价,即您可以在 AI Ping 的模型计费页看到”缓存命中“价格

注:即使请求内容非常相似,如果服务商不支持 cached prompts,或因各类原因服务商缓存过期,或服务商未提供缓存命中单价,也不会产生折扣,折扣是否触发以计费页展示为准。

3. 折扣如何计算

缓存折扣只影响输入 token,不影响输出 token。你可以直接从响应返回值中读取命中缓存的输入 token 数量。

这部分命中的 token 会以独立价格计费,未命中的部分以及输出部分按原价计算。

4. 如何提高命中率

命中缓存通常依赖输入前缀一致。以下做法更容易命中:

  • 保持 system prompt、工具定义和前几轮对话稳定
  • 对同一类任务复用相同的固定上下文前缀,比如角色设定、规则、格式要求等
  • 尽量避免在前缀中插入随机字段