docs/workspace/compare-evaluation-analysis/README.md
这个目录已经收敛成“当前规范 + 手工验收 + 真实样例 + 历史资料”四层结构。
如果你只想快速理解现在的实现,不要再从旧进度稿开始读。按这个顺序看:
real-api-samples/*/rendered-messages.mdcurrent-spec.md
当前唯一推荐的总览文档。
说明分析 / 评估 / 对比评估的语义、输入边界、4 个文本模式差异、当前已完成项和剩余问题。manual-acceptance.md
当前手工测试入口。
如果你要自己在浏览器里点一遍,就看这份。manual-test-playbook.md
当前最适合直接照着操作的一份手测步骤文档。
如果你要逐步验证 compare 阶段功能,优先看这份。protocol-migration-minimal-plan.md
compare / rewrite 从 Markdown 协议层迁移到 JSON payload 协议层的最小实现方案与落地说明。
如果你准备继续做协议层收敛或复盘这次迁移,优先看这份。auto-compare-rewrite-effect-analysis.md
基于真实 calibration 产物整理的效果分析。
如果你想判断“当前自动对比评估 + 智能改写到底有没有实际价值”,优先看这份。real-api-samples/
真实模型请求样例。
这是判断“现在到底发了什么给模型”的最高优先级证据。history/
历史设计稿、阶段进度、旧推导文档。
保留是为了追溯,不再作为当前实现的直接依据。| 能力 | basic-user | basic-system | pro-variable | pro-multi |
|---|---|---|---|---|
prompt-only | 有 | 有 | 有 | 有 |
prompt-iterate + focus | 有 | 暂无 | 暂无 | 暂无 |
| 能力 | basic-user | basic-system | pro-variable | pro-multi |
|---|---|---|---|---|
result | 有 | 有 | 有 | 有 |
result + focus | 有 | 暂无 | 暂无 | 暂无 |
compare | 有 | 有 | 有 | 有 |
compare + focus | 有 | 有 | 有 | 暂无 |
如果你在 history/ 里的旧文档中看到这些说法,不要直接当成当前事实:
original / optimizedA/B onlyworkspacePrompt + variants[]resolvedPrompt 仍直接进入右侧评估请求## 当前工作区提示词这些都属于阶段性推导或旧实现记录。当前实现请以:
为准。