docs/workspace/compare-evaluation-analysis/real-api-samples/pro-variable-compare-focus/request.md
comparedashscopepro/variable优先检查“不要解释”在跨模型下是否稳定,不要泛泛讨论诗歌质量
你是一位{{风格}}的诗人。请根据以下要求创作一首关于“{{主题}}”的诗歌,不要解释。
你是一位{{风格}}的诗人,请写一首{{主题}}的诗
shared-variable-focus-test-case变量输入除模型外,其余测试设置保持一致
变量输入variables风格=中文古典
主题=程序员加班
aAshared-variable-focus-test-casedashscopev1v1你是一位{{风格}}的诗人。请根据以下要求创作一首关于“{{主题}}”的诗歌,不要解释。
《夜半敲键歌》
残灯照案五更寒,十指敲冰未肯阑。
咖啡已冷人未歇,只把长更作短欢。
bBshared-variable-focus-test-casesiliconflowv1v1你是一位{{风格}}的诗人。请根据以下要求创作一首关于“{{主题}}”的诗歌,不要解释。
《夜半敲键歌》
夜深人静写代码。
说明:这首诗表现了程序员加班的辛苦。
{
"type": "compare",
"evaluationModelKey": "dashscope",
"mode": {
"functionMode": "pro",
"subMode": "variable"
},
"focus": {
"content": "优先检查“不要解释”在跨模型下是否稳定,不要泛泛讨论诗歌质量",
"source": "user",
"priority": "highest"
},
"target": {
"workspacePrompt": "你是一位{{风格}}的诗人。请根据以下要求创作一首关于“{{主题}}”的诗歌,不要解释。",
"referencePrompt": "你是一位{{风格}}的诗人,请写一首{{主题}}的诗"
},
"testCases": [
{
"id": "shared-variable-focus-test-case",
"label": "变量输入",
"settingsSummary": "除模型外,其余测试设置保持一致",
"input": {
"kind": "variables",
"label": "变量输入",
"content": "风格=中文古典\n主题=程序员加班"
}
}
],
"snapshots": [
{
"id": "a",
"label": "A",
"testCaseId": "shared-variable-focus-test-case",
"promptRef": {
"kind": "version",
"version": 1,
"label": "v1"
},
"promptText": "你是一位{{风格}}的诗人。请根据以下要求创作一首关于“{{主题}}”的诗歌,不要解释。",
"output": "《夜半敲键歌》\n\n残灯照案五更寒,十指敲冰未肯阑。\n咖啡已冷人未歇,只把长更作短欢。",
"modelKey": "dashscope",
"versionLabel": "v1"
},
{
"id": "b",
"label": "B",
"testCaseId": "shared-variable-focus-test-case",
"promptRef": {
"kind": "version",
"version": 1,
"label": "v1"
},
"promptText": "你是一位{{风格}}的诗人。请根据以下要求创作一首关于“{{主题}}”的诗歌,不要解释。",
"output": "《夜半敲键歌》\n\n夜深人静写代码。\n\n说明:这首诗表现了程序员加班的辛苦。",
"modelKey": "siliconflow",
"versionLabel": "v1"
}
]
}