document/content/docs/self-host/custom-models/bge-rerank.mdx
推荐配置如下:
| 模型名 | 内存 | 显存 | 硬盘空间 | 启动命令 |
|---|---|---|---|---|
| bge-reranker-base | >=4GB | >=4GB | >=8GB | python app.py |
| bge-reranker-large | >=8GB | >=8GB | >=8GB | python app.py |
| bge-reranker-v2-m3 | >=8GB | >=8GB | >=8GB | python app.py |
3 个模型代码分别为:
pip install -r requirements.txt
3个模型的 huggingface 仓库地址如下:
在对应代码目录下 clone 模型。目录结构:
bge-reranker-base/
app.py
Dockerfile
requirements.txt
python app.py
启动成功后应该会显示如下地址:
这里的
http://0.0.0.0:6006就是连接地址。
镜像名分别为:
端口
6006
环境变量
ACCESS_TOKEN=访问安全凭证,请求时,Authorization: Bearer ${ACCESS_TOKEN}
运行命令示例
# auth token 为mytoken
docker run -d --name reranker -p 6006:6006 -e ACCESS_TOKEN=mytoken --gpus all registry.cn-hangzhou.aliyuncs.com/fastgpt/bge-rerank-base:v0.1
docker-compose.yml示例
version: "3"
services:
reranker:
image: registry.cn-hangzhou.aliyuncs.com/fastgpt/bge-rerank-base:v0.1
container_name: reranker
# GPU运行环境,如果宿主机未安装,将deploy配置隐藏即可
deploy:
resources:
reservations:
devices:
- driver: nvidia
count: all
capabilities: [gpu]
ports:
- 6006:6006
environment:
- ACCESS_TOKEN=mytoken
bge-reranker-base,地址填写{{host}}/v1/rerank,host 为你部署的域名/IP:Port。FastGPT中,自定义请求 Token 和环境变量的 ACCESS_TOKEN 不一致。
Bus error (core dumped)尝试增加 docker-compose.yml 配置项 shm_size ,以增加容器中的共享内存目录大小。
...
services:
reranker:
...
container_name: reranker
shm_size: '2gb'
...