如何让Ollama使用GPU运行LLM模型

xin.bai · 2024 年4 月 29 日 08:57

说明：以 GPU 模式运行 Ollama 需要有 NVIDIA 显卡支持。

1. 安装英伟达容器安装包

我们以 Ubuntu22.04 为例（其他系统请参考：英伟达官方文档）

配置apt源

curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
  && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
    sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
    sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

更新源

sudo apt-get update

安装工具包

sudo apt-get install -y nvidia-container-toolkit

2. 使用 GPU 运行 Ollama

docker run --gpus all -d -v /opt/ai/ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

3. 使用 Ollama 下载模型

docker exec -it ollama ollama run qwen:7b

4. 在 MaxKB 的模型设置中添加模型进行对接

xin.bai · 2024 年4 月 29 日 08:57

user-ieu7ewbhntp · 2024 年7 月 2 日 04:43

win11下怎么操作才能调用GPU啊，我的英伟达显卡用不起来。

王贺 · 2024 年9 月 19 日 03:04

user-xutrhsklwtq · 2025 年1 月 10 日 07:00

我的情况一样，同问