costlatencyslosuccess_rate
- 分类
- safety_reliability
- 难度
- 未设置
- 来源数
- 1
- 更新时间
- 2026/04/03 19:42
答案
至少定义三类核心指标:任务完成率(质量)、P95/P99 延迟(体验)、单任务 token/工具成本(经济性)。再细分到子链路(检索、工具、生成)才能快速定位瓶颈。SLO 必须和降级策略绑定。
相关题目(1)
safety_reliabilityauthorizationguardrailsprompt_injection
元信息
审核状态: active
关联来源: 1
来源面经题(0)
这道题目前没有手动沉淀的面经题来源。
来源(1)
Manual Q&A - 线上如何定义 Agent 的SLO(成功率/延迟/成本)?
manual_inputQuestion: 线上如何定义 Agent 的SLO(成功率/延迟/成本)?
Answer: 至少定义三类核心指标:任务完成率(质量)、P95/P99 延迟(体验)、单任务 token/工具成本(经济性)。再细分到子链路(检索、工具、生成)才能快速定位瓶颈。SLO 必须和降级策略绑定。