Context management

上下文压缩和长对话成本控制

AI Agent 和客服类应用容易积累很长历史。Botat 可以在网关层压缩旧消息,让上下文继续可用,同时控制 token 成本。

Botat API Gateway product interface

核心能力

超过预算才压缩

默认只在上下文估算超过阈值时触发压缩,避免短会话被不必要地改写。

保留最近关键消息

旧历史变成摘要,最近轮次继续保留,兼顾成本控制和回答连续性。

模式可配置

通过不同模式让团队按业务风险选择是否压缩、压缩程度和输出预算策略。

相关服务页

常见问题

什么场景适合上下文压缩?

适合长对话、Agent 工具调用、客服历史、批处理总结等上下文容易增长但不需要逐字保留全部历史的场景。