offline_evalonline_feedbackregression_test
- 分类
- evaluation
- 难度
- 未设置
- 来源数
- 1
- 更新时间
- 2026/04/03 19:42
答案
离线评测负责稳定基线(可复现),在线反馈反映真实流量问题(可观测),回归测试负责防止迭代退化(可门禁)。三者要共用统一指标口径,并把失败样本持续回流到评测集。
相关题目(1)
evaluationoffline_evalonline_metricstool_eval
元信息
审核状态: active
关联来源: 1
来源面经题(0)
这道题目前没有手动沉淀的面经题来源。
来源(1)
Manual Q&A - 如何构建持续评测闭环(离线数据集 + 在线反馈 + 回归测试)?
manual_inputQuestion: 如何构建持续评测闭环(离线数据集 + 在线反馈 + 回归测试)?
Answer: 离线评测负责稳定基线(可复现),在线反馈反映真实流量问题(可观测),回归测试负责防止迭代退化(可门禁)。三者要共用统一指标口径,并把失败样本持续回流到评测集。