用量分析

用量分析用来回答“钱花到哪里去了”和“哪些请求造成了异常”。它基于请求监控采集到的事件和模型价格计算，不会改变提供商的真实计费。

先选范围

进入页面后先确认时间范围和粒度：

今天或最近一小时适合排查刚发生的异常。
7 天或 30 天适合看趋势和成本结构。
自定义范围适合对齐账单周期或事故时间段。
粒度越细，越适合定位峰值；粒度越粗，越适合看趋势。

筛选条件支持模型、API Key、提供商、状态、认证文件、延迟和缓存状态。筛选后，页面里的趋势、排行和明细都会围绕同一批请求计算。

主要视图

总览：看请求数、Token、成本、失败率和延迟是否有异常。
模型排行：找出最贵、最多请求或失败最多的模型。
API Key 排行：判断哪个调用方造成成本或失败。
认证文件排行：把用量落到账号，配合配额和巡检使用。
趋势图：观察请求量、成本、Token 和失败率随时间的变化。
异常点：快速定位成本、Token 或失败的突增时间点。
热力图：看调用高峰和低谷，适合调整任务调度。
请求预览：从分析结果跳回请求监控明细。

排查成本突增

先看总览是否只有成本升高，还是请求数和失败率也一起升高。
打开模型排行，确认是否某个高价模型占比异常。
打开 API Key 排行，确认是否某个调用方突然增加请求。
打开认证文件排行，确认是否某个账号或项目集中消耗。
点击请求预览或“查看请求监控明细”，回到单条请求核对模型名、Token 和调用方。

如果模型名是别名或内部模型，先到模型价格补全价格，否则成本会低估或无法估算。

准确性边界

提供商实际账单以提供商为准。
CPAMP 根据请求事件和模型价格估算成本。
如果模型名被客户端、提供商或路由别名改写，需要在模型价格中维护对应名称。
缺失 Token 字段时，成本可能无法完整估算。
Manager Server 停机或队列过期期间丢失的请求事件无法补回。