docs/models/glm.mdx
智谱 AI 支持文本对话、图像理解、语音识别(ASR)和向量(Embedding),一份 zhipu_ai_api_key 即可启用全部能力。
{
"model": "glm-5.1",
"zhipu_ai_api_key": "YOUR_API_KEY"
}
| 参数 | 说明 |
|---|---|
model | 可填 glm-5.1、glm-5-turbo、glm-5、glm-4.7、glm-4-plus、glm-4-flash、glm-4-air 等,参考 模型编码 |
zhipu_ai_api_key | 在 智谱 AI 控制台 创建 |
zhipu_ai_api_base | 可选,默认为 https://open.bigmodel.cn/api/paas/v4 |
智谱 chat 系列模型(glm-5.1、glm-5-turbo 等)不支持视觉,视觉调用统一路由到 glm-5v-turbo。配置 zhipu_ai_api_key 后 Agent 的 Vision 工具会自动使用该模型,无需在配置文件中显式指定。
{
"voice_to_text": "zhipu",
"voice_to_text_model": "glm-asr-2512"
}
| 参数 | 说明 |
|---|---|
voice_to_text | 设为 zhipu 启用智谱 ASR |
voice_to_text_model | 可选,默认 glm-asr-2512 |
凭证自动复用 zhipu_ai_api_key。语音文件建议小于 25MB,超大文件可能被服务端拒绝。
{
"embedding_provider": "zhipu",
"embedding_model": "embedding-3"
}
可选模型:embedding-3、embedding-2。修改 embedding 后需执行 /memory rebuild-index 命令重建索引。