有没有可能，向量的时候可以调用显卡来进行向量

user-opj6q2ujxiu · 2025 年7 月 6 日 08:28

调用显卡来进行向量，肯定比cpu向量快啊，cpu在短时间大量处理的时候太慢了

玉树 · 2025 年7 月 6 日 09:30

可以通过 Ollama 等框架自行部署向量模型并配置GPU调用，然后跟 MaxKB 进行对接，默认的模型在容器中没有GPU资源。