docs/models/gemini.mdx
Google Gemini 支持文本对话、图像理解和图像生成(Nano Banana 系列),一个 gemini_api_key 即可启用全部能力。
{
"model": "gemini-3.5-flash",
"gemini_api_key": "YOUR_API_KEY"
}
| 参数 | 说明 |
|---|---|
model | 推荐 gemini-3.5-flash,亦支持 gemini-3.1-pro-preview、gemini-3.1-flash-lite-preview、gemini-3-flash-preview、gemini-3-pro-preview 等,参考 官方文档 |
gemini_api_key | 在 Google AI Studio 创建 |
gemini_api_base | 可选,默认为 https://generativelanguage.googleapis.com,可改为第三方代理 |
Gemini 全系列模型均原生支持视觉,配置 gemini_api_key 后 Agent 的 Vision 工具会自动使用主模型识别图像,无需额外配置。
如需手动指定 Vision 模型:
{
"tools": {
"vision": {
"model": "gemini-3.1-flash-lite-preview"
}
}
}
{
"skills": {
"image-generation": {
"model": "gemini-3.1-flash-image-preview"
}
}
}
| 模型 ID | 别名 |
|---|---|
gemini-3.1-flash-image-preview | Nano Banana 2 |
gemini-3-pro-image-preview | Nano Banana Pro |
gemini-2.5-flash-image | Nano Banana |