SimpleRouter 回测报告
created: 2026-06-16
回测结果
路由准确率
| 指标 |
结果 |
| 总测试用例 |
24 |
| 通过 |
24 |
| 失败 |
0 |
| 准确率 |
100% |
分类明细
| 分类 |
用例数 |
通过 |
准确率 |
| 问候/闲聊 → DIRECT_CHAT |
4 |
4 |
100% |
| 口语化工具查询 → REACT |
5 |
5 |
100% |
| 标准工具查询 → REACT |
5 |
5 |
100% |
| 翻译/知识 → REACT |
3 |
3 |
100% |
| 复杂查询 → REACT |
3 |
3 |
100% |
| @skill 前缀 → SKILL_REACT |
1 |
1 |
100% |
口语化查询覆盖(核心改进)
| 输入 |
旧架构结果 |
新架构结果 |
| "查下ip" |
direct_agent (误判) |
REACT ✓ |
| "查看当前ip" |
direct_agent (误判) |
REACT ✓ |
| "获取ip地址" |
direct_agent (误判) |
REACT ✓ |
| "看下ip" |
direct_agent (误判) |
REACT ✓ |
| "帮我查一下ip" |
direct_agent (误判) |
REACT ✓ |
改写一致性
| 测试组 |
原始说法 |
改写说法数 |
一致性 |
| ip_check_variants |
"查看当前ip" |
5 |
100% |
| search_variants |
"搜索golang教程" |
3 |
100% |
与旧架构对比
| 指标 |
CostAwareRouter (旧) |
SimpleRouter (新) |
| 执行模式准确率 |
40.38% |
100% |
| 口语化查询成功率 |
30% |
100% |
| 路由层 LLM 调用 |
1次/查询 |
0次/查询 |
| 路由层延迟 |
~500ms |
<1ms |
| 路由层 token 消耗 |
~1000 tokens |
0 tokens |
注意事项
- 翻译/知识类查询现在走 REACT(LLM 看到工具但决定不使用),比旧架构多消耗约 2000 tokens(工具描述)
- 这是可靠性换 token 的权衡,可接受
- 后续可通过模型能力检测优化:支持 function calling 的模型用 API tools,不支持才用 prompt-based