Back to Chatgpt On Wechat

image-generation - 图像生成

docs/skills/image-generation.mdx

2.0.93.8 KB
Original Source

通用的图像生成与编辑技能,支持 OpenAI、Gemini、Seedream(火山方舟)、Qwen(百炼)、MiniMax、LinkAI 共六家厂商。配好任意一家的 Key 即可使用,配多家可享受自动回退。

支持的模型

厂商模型 / 别名特点
OpenAIgpt-image-2gpt-image-1通用文生图,高质量,支持 quality 控制画质
Gemini Nano Banananano-banana-2nano-banana-pronano-banana对应 gemini-3.1-flashgemini-3-progemini-2.5-flash 的图像版本
Seedream(火山方舟)seedream-5.0-liteseedream-4.5原生 2K–4K,最多 14 张图融合
Qwen(百炼)qwen-image-2.0qwen-image-2.0-pro擅长中文排版和图文融合
MiniMaximage-01简单快速
LinkAI任意模型统一网关,作为兜底

模型选择

默认走「自动路由 + 失败回退」:

  1. OpenAI → Gemini → Seedream → Qwen → MiniMax → LinkAI 顺序选第一个已配置的厂商
  2. 遇到 401、模型未开通、网络异常等错误时,自动切到下一家
  3. 用户在对话里指定模型时(如「用 seedream 画一只猫」),对应厂商会被提到最前优先尝试

如需固定使用某个模型:

json
{
  "skills": {
    "image-generation": {
      "model": "seedream-5.0-lite"
    }
  }
}

配置 API Key

<Tip> 推荐通过 [Web 控制台](/channels/web) 的「模型管理」页面配置,配好的对话模型 Key 会被图像生成技能自动复用,无需重复配置。也可手动编辑配置文件或在对话中通过 `env_config` 工具临时设置。 </Tip>

凭证统一复用主模型厂商的 Key:

字段对应厂商
openai_api_keyOpenAI
gemini_api_keyGemini
ark_api_key火山方舟(Seedream)
dashscope_api_key阿里百炼(Qwen)
minimax_api_keyMiniMax
linkai_api_keyLinkAI

开启和关闭

技能会根据 API Key 自动调整状态:

  • 已配置 Key:Agent 收到画图请求时直接调用
  • 未配置 Key:技能仍会出现在上下文中(标记为「需要配置」),Agent 会引导用户去配 Key

如需手动控制:

text
/skill disable image-generation    # 关闭
/skill enable image-generation     # 重新开启

终端等价命令:cow skill disable image-generation / cow skill enable image-generation

参数

参数类型必填默认说明
promptstring图像描述
image_urlstring / listnull编辑用的输入图,本地路径或 URL;传列表为多图融合
qualitystringautolow / medium / high,仅部分厂商支持
sizestringauto512 / 1K / 2K / 3K / 4K,或像素值如 1024x1024
aspect_ratiostringnull1:1 / 3:2 / 2:3 / 16:9 / 9:16 / 21:9;Gemini 还支持 1:4 / 4:1 / 1:8 / 8:1
<Warning> **质量越高、分辨率越大,耗时和成本越高。** 日常对话用默认(`auto`)或 `quality=low` + `size=1K` 即可,约 20 秒出图;做海报或明确要高清时再上 `high` + `2K/4K`,可能需要 1–5 分钟。 </Warning>

常见用法

  • 文生图:根据描述生成插画、海报、图标、头像、分镜图等
  • 图生图:在已有图片上改风格、换元素、加装饰、加文字等
  • 多图融合:把多张参考图合成一张(换装、角色合影等)
<Note> - bash 超时建议设 600 秒:单厂商 HTTP 超时 300 秒,脚本可能依次尝试多家 - 输入图片自动压缩到 4MB 以内、最长边不超过 4096px - Gemini / Seedream / Qwen / MiniMax 不支持 `quality` 参数 - Seedream 默认出 2K 图;`seedream-5.0-lite` 支持到 3K,`seedream-4.5` 支持到 4K </Note>