超过预算才压缩
默认只在上下文估算超过阈值时触发压缩,避免短会话被不必要地改写。
Context management
AI Agent 和客服类应用容易积累很长历史。Botat 可以在网关层压缩旧消息,让上下文继续可用,同时控制 token 成本。

默认只在上下文估算超过阈值时触发压缩,避免短会话被不必要地改写。
旧历史变成摘要,最近轮次继续保留,兼顾成本控制和回答连续性。
通过不同模式让团队按业务风险选择是否压缩、压缩程度和输出预算策略。
适合长对话、Agent 工具调用、客服历史、批处理总结等上下文容易增长但不需要逐字保留全部历史的场景。