用量分析
用量分析用来回答“钱花到哪里去了”和“哪些请求造成了异常”。它基于请求监控采集到的事件和 模型价格 计算,不会改变提供商的真实计费。
先选范围
进入页面后先确认时间范围和粒度:
- 今天或最近一小时适合排查刚发生的异常。
- 7 天或 30 天适合看趋势和成本结构。
- 自定义范围适合对齐账单周期或事故时间段。
- 粒度越细,越适合定位峰值;粒度越粗,越适合看趋势。
筛选条件支持模型、API Key、提供商、状态、认证文件、延迟和缓存状态。筛选后,页面里的趋势、排行和明细都会围绕同一批请求计算。
主要视图
- 总览:看请求数、Token、成本、失败率和延迟是否有异常。
- 模型排行:找出最贵、最多请求或失败最多的模型。
- API Key 排行:判断哪个调用方造成成本或失败。
- 认证文件排行:把用量落到账号,配合配额和巡检使用。
- 趋势图:观察请求量、成本、Token 和失败率随时间的变化。
- 异常点:快速定位成本、Token 或失败的突增时间点。
- 热力图:看调用高峰和低谷,适合调整任务调度。
- 请求预览:从分析结果跳回请求监控明细。
排查成本突增
- 先看总览是否只有成本升高,还是请求数和失败率也一起升高。
- 打开模型排行,确认是否某个高价模型占比异常。
- 打开 API Key 排行,确认是否某个调用方突然增加请求。
- 打开认证文件排行,确认是否某个账号或项目集中消耗。
- 点击请求预览或“查看请求监控明细”,回到单条请求核对模型名、Token 和调用方。
如果模型名是别名或内部模型,先到 模型价格 补全价格,否则成本会低估或无法估算。
准确性边界
- 提供商实际账单以提供商为准。
- CPAMP 根据请求事件和模型价格估算成本。
- 如果模型名被客户端、提供商或路由别名改写,需要在模型价格中维护对应名称。
- 缺失 Token 字段时,成本可能无法完整估算。
- Manager Server 停机或队列过期期间丢失的请求事件无法补回。