docs/skills/image-generation.mdx
通用的图像生成与编辑技能,支持 OpenAI、Gemini、Seedream(火山方舟)、Qwen(百炼)、MiniMax、LinkAI 共六家厂商。配好任意一家的 Key 即可使用,配多家可享受自动回退。
| 厂商 | 模型 / 别名 | 特点 |
|---|---|---|
| OpenAI | gpt-image-2、gpt-image-1 | 通用文生图,高质量,支持 quality 控制画质 |
| Gemini Nano Banana | nano-banana-2、nano-banana-pro、nano-banana | 对应 gemini-3.1-flash、gemini-3-pro、gemini-2.5-flash 的图像版本 |
| Seedream(火山方舟) | seedream-5.0-lite、seedream-4.5 | 原生 2K–4K,最多 14 张图融合 |
| Qwen(百炼) | qwen-image-2.0、qwen-image-2.0-pro | 擅长中文排版和图文融合 |
| MiniMax | image-01 | 简单快速 |
| LinkAI | 任意模型 | 统一网关,作为兜底 |
默认走「自动路由 + 失败回退」:
OpenAI → Gemini → Seedream → Qwen → MiniMax → LinkAI 顺序选第一个已配置的厂商如需固定使用某个模型:
{
"skills": {
"image-generation": {
"model": "seedream-5.0-lite"
}
}
}
凭证统一复用主模型厂商的 Key:
| 字段 | 对应厂商 |
|---|---|
openai_api_key | OpenAI |
gemini_api_key | Gemini |
ark_api_key | 火山方舟(Seedream) |
dashscope_api_key | 阿里百炼(Qwen) |
minimax_api_key | MiniMax |
linkai_api_key | LinkAI |
技能会根据 API Key 自动调整状态:
如需手动控制:
/skill disable image-generation # 关闭
/skill enable image-generation # 重新开启
终端等价命令:cow skill disable image-generation / cow skill enable image-generation。
| 参数 | 类型 | 必填 | 默认 | 说明 |
|---|---|---|---|---|
prompt | string | 是 | — | 图像描述 |
image_url | string / list | 否 | null | 编辑用的输入图,本地路径或 URL;传列表为多图融合 |
quality | string | 否 | auto | low / medium / high,仅部分厂商支持 |
size | string | 否 | auto | 512 / 1K / 2K / 3K / 4K,或像素值如 1024x1024 |
aspect_ratio | string | 否 | null | 1:1 / 3:2 / 2:3 / 16:9 / 9:16 / 21:9;Gemini 还支持 1:4 / 4:1 / 1:8 / 8:1 |