HTTP 和上游指标
记录请求量、状态码、P50/P95/P99 延迟、SLO、路由热力、进程内存和上游调用情况。
Observability
AI API 调用需要能看见延迟、错误、成本和收益。Botat 内置 dashboard 和 metrics,方便团队上线后持续优化。

记录请求量、状态码、P50/P95/P99 延迟、SLO、路由热力、进程内存和上游调用情况。
按 API Key、项目、客户、模型统计费用、预算使用、毛利和异常消费,帮助运营判断成本风险。
聚合预算、余额、异常消费、失败和退款等信号,为告警和运营处理提供基础。
模型调用成本、延迟和错误往往和普通 HTTP 接口不同,必须结合 token、模型、预算和上游状态一起看。