Back to Chatgpt On Wechat

智谱 GLM

docs/models/glm.mdx

2.0.91.6 KB
Original Source

智谱 AI 支持文本对话、图像理解、语音识别(ASR)和向量(Embedding),一份 zhipu_ai_api_key 即可启用全部能力。

<Tip> 通过 Web 控制台的「模型管理」页面可一站式配置以下全部能力,无需手动改配置文件。 </Tip>

文本对话

json
{
  "model": "glm-5.1",
  "zhipu_ai_api_key": "YOUR_API_KEY"
}
参数说明
model可填 glm-5.1glm-5-turboglm-5glm-4.7glm-4-plusglm-4-flashglm-4-air 等,参考 模型编码
zhipu_ai_api_key智谱 AI 控制台 创建
zhipu_ai_api_base可选,默认为 https://open.bigmodel.cn/api/paas/v4

图像理解

智谱 chat 系列模型(glm-5.1glm-5-turbo 等)不支持视觉,视觉调用统一路由到 glm-5v-turbo。配置 zhipu_ai_api_key 后 Agent 的 Vision 工具会自动使用该模型,无需在配置文件中显式指定。

语音识别

json
{
  "voice_to_text": "zhipu",
  "voice_to_text_model": "glm-asr-2512"
}
参数说明
voice_to_text设为 zhipu 启用智谱 ASR
voice_to_text_model可选,默认 glm-asr-2512

凭证自动复用 zhipu_ai_api_key。语音文件建议小于 25MB,超大文件可能被服务端拒绝。

向量

json
{
  "embedding_provider": "zhipu",
  "embedding_model": "embedding-3"
}

可选模型:embedding-3embedding-2。修改 embedding 后需执行 /memory rebuild-index 命令重建索引。