MaxKB 在V 1.4.0 版本之后已经支持自定义Embedding模型,那么如何对接本地Embedding模型,详细操作步骤如下:
一、下载向量模型
在对接向量模型之前,先去下载好对应的模型:https://huggingface.co/
(注意:下载模型需要使用魔法,最好使用网络稳定一点的。)
二、上传模型到服务器
下载好模型之后,上传到部署MaxKB的服务器上。
1. 创建 model 文件夹
## 创建 model 文件夹
mkdir
/opt/maxkb/model
2. 修改docker-compose.yaml,添加volume挂载点
## 修改docker-compose.yaml,添加volume挂载点
version:
"2.1"
services:
maxkb:
container_name: maxkb
hostname
: maxkb
restart: always
image: ${MAXKB_IMAGE_REPOSITORY}
/maxkb-pro
:${MAXKB_VERSION}
ports:
-
"${MAXKB_PORT}:8080"
healthcheck:
test
: [
"CMD"
,
"curl"
,
"-f"
,
"localhost:8080"
]
interval: 10s
timeout: 10s
retries: 120
volumes:
-
/tmp
:
/tmp
- ${MAXKB_BASE}
/maxkb/logs
:
/opt/maxkb/app/data/logs
- mk-model-data:
/opt/maxkb/model
env_file:
- ${MAXKB_BASE}
/maxkb/conf/maxkb
.
env
depends_on:
pgsql:
condition: service_healthy
networks:
- maxkb-network
entrypoint: [
"docker-entrypoint.sh"
]
command
:
"python /opt/maxkb/app/main.py start"
networks:
maxkb-network:
driver: bridge
ipam:
driver: default
volumes:
mk-model-data:
driver_opts:
type
: none
device: ${MAXKB_BASE}
/maxkb/model
o: bind
## 添加完之后重新启动
docker-compose -f docker-compose.yml -f docker-compose-pgsql.yml up -d
## 等一会查看一下状态
docker
ps
3. 检查mode文件夹是否有MaxKB的默认模型
4. 把下载好的向量模型放到model文件夹下
## 把下载的模型放到model当中
cp
-R
/opt/models--moka-ai--m3e-large
/opt/maxkb/model
注意:后续下载新的模型只需要放到model文件夹下面即可。
三、配置本地向量模型
1. 添加模型
系统管理->模型设置->本地模型→"添加模型"
1.1. 参数详情:
模型名字: 自定义模型名字(填写自己模型名字就好)
模型类型: 选择“向量模型”
基础模型:此处需要注意,要手动填写对应的模型地址。
所填写的地址必须要有,pytorch_model.bin、tokenizer_config.json、tokenizer.json 等这些文件
/opt/maxkb/model/models--moka-ai--m3e-large/snapshots/12900375086c37ba5d83d1e417b21dc7d1d1f388
不同的模型,路径应该有所不同,根据实际情况修改
模型目录: 默认跟“基础模型”路径一致
添加好之后如图:
2. 使用自定义模型
在创建知识库的时候,指定向量模型即可