Back to Chatgpt On Wechat

OpenAI

docs/models/openai.mdx

2.0.92.8 KB
Original Source

OpenAI 是覆盖最完整的厂商,可同时承担文本对话、视觉理解、图像生成、语音识别(ASR)、语音合成(TTS)和向量(Embedding)能力。一份 open_ai_api_key 即可让 Agent 用到全部能力。

<Tip> 通过 Web 控制台的「模型管理」页面可一站式配置以下全部能力,无需手动改配置文件。 </Tip>

文本对话

json
{
  "model": "gpt-5.5",
  "open_ai_api_key": "YOUR_API_KEY",
  "open_ai_api_base": "https://api.openai.com/v1"
}
参数说明
model与 OpenAI 接口的 model 参数 一致,支持 gpt-5.5gpt-5.4gpt-5.4-minigpt-5.4-nanogpt-5 系列、gpt-4.1、o 系列等;Agent 模式默认 gpt-5.5,追求性价比可改为 gpt-5.4
open_ai_api_keyOpenAI 平台 创建
open_ai_api_base可选,修改可接入第三方代理
bot_type使用 OpenAI 官方模型时无需填写;通过兼容协议接入厂商模型时需设为 openai

图像理解

gpt-5.5gpt-5.4gpt-4ogpt-4.1 等 OpenAI 模型均原生支持视觉,配置 open_ai_api_key 后 Agent 的 Vision 工具会自动使用主模型识别图像。若主模型不支持视觉或希望显式指定,可在配置文件中配置:

json
{
  "tools": {
    "vision": {
      "model": "gpt-5.4-mini"
    }
  }
}

支持的 Vision 模型:gpt-5.5gpt-5.4gpt-5.4-minigpt-5.4-nanogpt-5gpt-4.1gpt-4.1-minigpt-4o

图像生成

在配置文件中指定图像生成模型,Agent 调用图像生成技能时会自动路由到 OpenAI:

json
{
  "skills": {
    "image-generation": {
      "model": "gpt-image-2"
    }
  }
}

支持的图像生成模型:gpt-image-2gpt-image-1

语音识别

json
{
  "voice_to_text": "openai",
  "voice_to_text_model": "gpt-4o-mini-transcribe"
}
参数说明
voice_to_text设为 openai 启用 OpenAI 语音识别
voice_to_text_model可选,默认 gpt-4o-mini-transcribe;也可填 gpt-4o-transcribewhisper-1

凭证自动复用 open_ai_api_key

语音合成

json
{
  "text_to_voice": "openai",
  "text_to_voice_model": "tts-1",
  "tts_voice_id": "alloy"
}
参数说明
text_to_voice_modeltts-1tts-1-hdgpt-4o-mini-tts
tts_voice_id音色:alloyechofableonyxnovashimmerashballadcoralsageverse

向量

json
{
  "embedding_provider": "openai",
  "embedding_model": "text-embedding-3-small"
}

可选模型:text-embedding-3-smalltext-embedding-3-largetext-embedding-ada-002。修改 embedding 后需执行 /memory rebuild-index 命令重建索引。