模型服务连接失败

线上如何定义 Agent 的SLO(成功率/延迟/成本)?

costlatencyslosuccess_rate
分类
safety_reliability
难度
未设置
来源数
1
更新时间
2026/04/03 19:42

答案

至少定义三类核心指标:任务完成率(质量)、P95/P99 延迟(体验)、单任务 token/工具成本(经济性)。再细分到子链路(检索、工具、生成)才能快速定位瓶颈。SLO 必须和降级策略绑定。

相关题目(1)

safety_reliabilityauthorizationguardrailsprompt_injection

元信息

审核状态: active
关联来源: 1

来源面经题(0)

这道题目前没有手动沉淀的面经题来源。

来源(1)

Manual Q&A - 线上如何定义 Agent 的SLO(成功率/延迟/成本)?

manual_input
Question: 线上如何定义 Agent 的SLO(成功率/延迟/成本)? Answer: 至少定义三类核心指标:任务完成率(质量)、P95/P99 延迟(体验)、单任务 token/工具成本(经济性)。再细分到子链路(检索、工具、生成)才能快速定位瓶颈。SLO 必须和降级策略绑定。