docs/api/model.md
模型管理接口用于维护当前租户下可用的 LLM / Embedding / Rerank / VLLM / ASR 模型配置。
| 方法 | 路径 | 描述 |
|---|---|---|
| GET | /models/providers | 获取模型服务商列表 |
| POST | /models | 创建模型 |
| GET | /models | 获取模型列表 |
| GET | /models/:id | 获取模型详情 |
| PUT | /models/:id | 更新模型 |
| DELETE | /models/:id | 删除模型 |
WeKnora 支持多种主流 AI 模型服务商,在创建模型时可通过 parameters.provider 字段指定服务商类型以获得更好的兼容性。
| 服务商标识 | 名称 | 支持的模型类型 |
|---|---|---|
generic | 自定义 (OpenAI 兼容接口) | Chat, Embedding, Rerank, VLLM |
openai | OpenAI | Chat, Embedding, Rerank, VLLM |
aliyun | 阿里云 DashScope | Chat, Embedding, Rerank, VLLM |
zhipu | 智谱 BigModel | Chat, Embedding, Rerank, VLLM |
volcengine | 火山引擎 Volcengine | Chat, Embedding, VLLM |
hunyuan | 腾讯混元 Hunyuan | Chat, Embedding |
deepseek | DeepSeek | Chat |
minimax | MiniMax | Chat |
mimo | 小米 MiMo | Chat |
siliconflow | 硅基流动 SiliconFlow | Chat, Embedding, Rerank, VLLM |
jina | Jina | Embedding, Rerank |
openrouter | OpenRouter | Chat, VLLM |
gemini | Google Gemini | Chat |
modelscope | 魔搭 ModelScope | Chat, Embedding, VLLM |
moonshot | 月之暗面 Moonshot | Chat, VLLM |
qianfan | 百度千帆 Baidu Cloud | Chat, Embedding, Rerank, VLLM |
qiniu | 七牛云 Qiniu | Chat |
longcat | LongCat AI | Chat |
gpustack | GPUStack | Chat, Embedding, Rerank, VLLM |
实际可用的服务商以
GET /models/providers返回为准。
/models/providers - 获取模型服务商列表根据模型类型获取支持的服务商列表及配置信息(系统级元数据,与租户无关)。
查询参数:
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
| model_type | string | 否 | 模型类型,可选值:chat / embedding / rerank / vllm / asr;省略则返回全部 |
请求:
# 获取所有服务商
curl --location 'http://localhost:8080/api/v1/models/providers' \
--header 'X-API-Key: your_api_key'
# 获取支持 Embedding 类型的服务商
curl --location 'http://localhost:8080/api/v1/models/providers?model_type=embedding' \
--header 'X-API-Key: your_api_key'
响应:
{
"success": true,
"data": [
{
"value": "aliyun",
"label": "阿里云 DashScope",
"description": "qwen-plus, tongyi-embedding-vision-plus, qwen3-rerank, etc.",
"defaultUrls": {
"chat": "https://dashscope.aliyuncs.com/compatible-mode/v1",
"embedding": "https://dashscope.aliyuncs.com/compatible-mode/v1",
"rerank": "https://dashscope.aliyuncs.com/api/v1/services/rerank/text-rerank/text-rerank"
},
"modelTypes": ["chat", "embedding", "rerank", "vllm"]
},
{
"value": "zhipu",
"label": "智谱 BigModel",
"description": "glm-4.7, embedding-3, rerank, etc.",
"defaultUrls": {
"chat": "https://open.bigmodel.cn/api/paas/v4",
"embedding": "https://open.bigmodel.cn/api/paas/v4/embeddings",
"rerank": "https://open.bigmodel.cn/api/paas/v4/rerank"
},
"modelTypes": ["chat", "embedding", "rerank", "vllm"]
}
]
}
/models - 创建模型为当前租户创建一个新的模型配置。
参数说明(请求体):
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
| name | string | 是 | 模型名称(远程模型对应服务商的 model id,本地模型为 Ollama tag) |
| type | string | 是 | 模型类型,可选值:KnowledgeQA / Embedding / Rerank / VLLM / ASR |
| source | string | 是 | 模型来源,可选值:local / remote |
| description | string | 否 | 模型描述 |
| parameters | object | 是 | 模型参数,详见下方 Parameters |
当
parameters.base_url不为空时,后端会执行 SSRF 校验,校验失败将返回 400。
本地 Ollama 模型:
curl --location 'http://localhost:8080/api/v1/models' \
--header 'Content-Type: application/json' \
--header 'X-API-Key: your_api_key' \
--data '{
"name": "qwen3:8b",
"type": "KnowledgeQA",
"source": "local",
"description": "LLM Model for Knowledge QA",
"parameters": {
"base_url": "",
"api_key": ""
}
}'
远程 API 模型(指定服务商):
curl --location 'http://localhost:8080/api/v1/models' \
--header 'Content-Type: application/json' \
--header 'X-API-Key: your_api_key' \
--data '{
"name": "qwen-plus",
"type": "KnowledgeQA",
"source": "remote",
"description": "阿里云 Qwen 大模型",
"parameters": {
"base_url": "https://dashscope.aliyuncs.com/compatible-mode/v1",
"api_key": "sk-your-dashscope-api-key",
"provider": "aliyun"
}
}'
本地 Ollama 模型:
curl --location 'http://localhost:8080/api/v1/models' \
--header 'Content-Type: application/json' \
--header 'X-API-Key: your_api_key' \
--data '{
"name": "nomic-embed-text:latest",
"type": "Embedding",
"source": "local",
"description": "Embedding Model",
"parameters": {
"base_url": "",
"api_key": "",
"embedding_parameters": {
"dimension": 768,
"truncate_prompt_tokens": 0
}
}
}'
远程 API 模型(阿里云 DashScope):
curl --location 'http://localhost:8080/api/v1/models' \
--header 'Content-Type: application/json' \
--header 'X-API-Key: your_api_key' \
--data '{
"name": "text-embedding-v3",
"type": "Embedding",
"source": "remote",
"description": "阿里云通义千问 Embedding 模型",
"parameters": {
"base_url": "https://dashscope.aliyuncs.com/compatible-mode/v1",
"api_key": "sk-your-dashscope-api-key",
"provider": "aliyun",
"embedding_parameters": {
"dimension": 1024,
"truncate_prompt_tokens": 0
}
}
}'
远程 API 模型(Jina AI):
curl --location 'http://localhost:8080/api/v1/models' \
--header 'Content-Type: application/json' \
--header 'X-API-Key: your_api_key' \
--data '{
"name": "jina-embeddings-v3",
"type": "Embedding",
"source": "remote",
"description": "Jina AI Embedding 模型",
"parameters": {
"base_url": "https://api.jina.ai/v1",
"api_key": "jina_your_api_key",
"provider": "jina",
"embedding_parameters": {
"dimension": 1024,
"truncate_prompt_tokens": 0
}
}
}'
远程 API 模型(阿里云 DashScope):
curl --location 'http://localhost:8080/api/v1/models' \
--header 'Content-Type: application/json' \
--header 'X-API-Key: your_api_key' \
--data '{
"name": "gte-rerank",
"type": "Rerank",
"source": "remote",
"description": "阿里云 GTE Rerank 模型",
"parameters": {
"base_url": "https://dashscope.aliyuncs.com/api/v1/services/rerank/text-rerank/text-rerank",
"api_key": "sk-your-dashscope-api-key",
"provider": "aliyun"
}
}'
远程 API 模型(Jina AI):
curl --location 'http://localhost:8080/api/v1/models' \
--header 'Content-Type: application/json' \
--header 'X-API-Key: your_api_key' \
--data '{
"name": "jina-reranker-v2-base-multilingual",
"type": "Rerank",
"source": "remote",
"description": "Jina AI Rerank 模型",
"parameters": {
"base_url": "https://api.jina.ai/v1",
"api_key": "jina_your_api_key",
"provider": "jina"
}
}'
curl --location 'http://localhost:8080/api/v1/models' \
--header 'Content-Type: application/json' \
--header 'X-API-Key: your_api_key' \
--data '{
"name": "qwen-vl-plus",
"type": "VLLM",
"source": "remote",
"description": "阿里云通义千问视觉模型",
"parameters": {
"base_url": "https://dashscope.aliyuncs.com/compatible-mode/v1",
"api_key": "sk-your-dashscope-api-key",
"provider": "aliyun"
}
}'
响应:
{
"success": true,
"data": {
"id": "09c5a1d6-ee8b-4657-9a17-d3dcbd5c70cb",
"tenant_id": 1,
"name": "text-embedding-v3",
"type": "Embedding",
"source": "remote",
"description": "阿里云通义千问 Embedding 模型",
"parameters": {
"base_url": "https://dashscope.aliyuncs.com/compatible-mode/v1",
"api_key": "sk-***",
"provider": "aliyun",
"embedding_parameters": {
"dimension": 1024,
"truncate_prompt_tokens": 0
}
},
"is_default": false,
"status": "active",
"created_at": "2025-08-12T10:39:01.454591766+08:00",
"updated_at": "2025-08-12T10:39:01.454591766+08:00",
"deleted_at": null
}
}
/models - 获取模型列表返回当前租户下的所有模型。内置模型(is_builtin = true)的 base_url 与 api_key 会被清空以隐藏敏感信息。
请求:
curl --location 'http://localhost:8080/api/v1/models' \
--header 'Content-Type: application/json' \
--header 'X-API-Key: your_api_key'
响应: data 为数组,每个元素的字段结构同 POST /models 响应。内置模型的 base_url 与 api_key 字段为空字符串。
/models/:id - 获取模型详情路径参数:
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
| id | string | 是 | 模型 ID |
请求:
curl --location 'http://localhost:8080/api/v1/models/dff7bc94-7885-4dd1-bfd5-bd96e4df2fc3' \
--header 'Content-Type: application/json' \
--header 'X-API-Key: your_api_key'
响应: 字段结构同 POST /models 响应。404 表示模型不存在。
/models/:id - 更新模型路径参数:
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
| id | string | 是 | 模型 ID |
参数说明(请求体):
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
| name | string | 否 | 模型名称(为空字符串时保留原值) |
| description | string | 否 | 模型描述(始终覆盖,传空字符串会清空) |
| type | string | 否 | 模型类型,取值同创建接口 |
| source | string | 否 | 模型来源,取值同创建接口 |
| parameters | object | 否 | 模型参数;parameter_size 由后端管理,请求中无需提供;extra_config 为空时会沿用旧值 |
同样会对
parameters.base_url做 SSRF 校验,失败时返回 400。
请求:
curl --location --request PUT 'http://localhost:8080/api/v1/models/8fdc464d-8eaa-44d4-a85b-094b28af5330' \
--header 'Content-Type: application/json' \
--header 'X-API-Key: your_api_key' \
--data '{
"name": "gte-rerank-v2",
"type": "Rerank",
"source": "remote",
"description": "阿里云 GTE Rerank 模型 V2",
"parameters": {
"base_url": "https://dashscope.aliyuncs.com/api/v1/services/rerank/text-rerank/text-rerank",
"api_key": "sk-your-new-api-key",
"provider": "aliyun"
}
}'
响应: 字段结构同 POST /models 响应,返回更新后的完整模型对象。
/models/:id - 删除模型路径参数:
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
| id | string | 是 | 模型 ID |
请求:
curl --location --request DELETE 'http://localhost:8080/api/v1/models/8fdc464d-8eaa-44d4-a85b-094b28af5330' \
--header 'Content-Type: application/json' \
--header 'X-API-Key: your_api_key'
响应:
{
"success": true,
"message": "Model deleted"
}
404 表示模型不存在。
| 值 | 前端别名 | 说明 | 用途 |
|---|---|---|---|
| KnowledgeQA | chat | 对话模型 | 知识库问答、对话生成 |
| Embedding | embedding | 嵌入模型 | 文本向量化、知识库检索 |
| Rerank | rerank | 排序模型 | 检索结果重排序、相关性优化 |
| VLLM | vllm | 视觉语言模型 | 多模态分析、图文理解 |
| ASR | asr | 语音识别模型 | 音频转写 |
创建/更新接口请求体的
type字段使用第一列的后端枚举值(如KnowledgeQA);GET /models/providers?model_type=查询参数使用第二列的前端别名(如chat)。
| 值 | 说明 | 配置要求 |
|---|---|---|
| local | 本地模型 | 需要已安装 Ollama 并拉取模型 |
| remote | 远程 API | 需要提供 base_url 和 api_key |
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
| base_url | string | 否 | API 服务地址;远程模型必填,会经过 SSRF 校验 |
| api_key | string | 否 | API 密钥;远程模型必填,存储时使用 AES-256 加密 |
| provider | string | 否 | 服务商标识(见上方支持列表),用于选择特定的 API 适配器 |
| interface_type | string | 否 | 接口风格标识(OpenAI 兼容请留空) |
| embedding_parameters | object | 否 | Embedding 模型专用参数,见下方 |
| parameter_size | string | 否 | 模型参数规模(如 7B/13B/70B),通常由后端写入 |
| extra_config | object<string,string> | 否 | 服务商特定的额外配置 |
| custom_headers | object<string,string> | 否 | 调用上游 API 时附加的自定义 HTTP 头;保留头会被忽略 |
| supports_vision | bool | 否 | 模型是否支持图像/多模态输入 |
| 字段 | 类型 | 必填 | 说明 |
|---|---|---|---|
| dimension | int | 否 | 向量维度(如 768、1024) |
| truncate_prompt_tokens | int | 否 | 截断 Token 数(0 表示不截断) |