GPU 透传
配置 GPU 后,Hermes 可以使用显卡加速语音识别、本地模型推理等任务。
- ✅ 宿主机已安装 NVIDIA 显卡驱动(
nvidia-smi能正常输出) - ✅ WSL2(Windows 用户)
- ✅ Docker Desktop(Windows 用户)
安装 NVIDIA Container Toolkit
Section titled “安装 NVIDIA Container Toolkit”Windows + WSL2 用户
Section titled “Windows + WSL2 用户”在 WSL2(Ubuntu)终端中运行:
# 添加 NVIDIA 软件源curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpgcurl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
# 安装sudo apt updatesudo apt install -y nvidia-container-toolkit
# 配置 Dockersudo nvidia-ctk runtime configure --runtime=docker
# 重启 Dockersudo systemctl restart dockerLinux 原生用户
Section titled “Linux 原生用户”# 同样方法安装distribution=$(. /etc/os-release;echo $ID$VERSION_ID)curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.listsudo apt update && sudo apt install -y nvidia-container-toolkitsudo systemctl restart docker配置 Docker Compose
Section titled “配置 Docker Compose”在 docker-compose.yml 中添加 GPU 配置:
services: hermes: # ... 其他配置 ... deploy: resources: reservations: devices: - driver: nvidia count: all capabilities: [gpu]验证 GPU 透传
Section titled “验证 GPU 透传”重启容器后验证:
docker compose up -ddocker exec hermes-agent nvidia-smi应该能看到:
+-----------------------------------------------------------------------+| NVIDIA-SMI ... Driver Version: ... CUDA Version: ... ||-------------------------------+----------------------+----------------+| GPU Name TCC/WDDN | Bus-Id Disp.A | Volatile Uncorr.||===============================+======================+================|| 0 NVIDIA GPU ... | ... | |+-------------------------------+----------------------+----------------+GPU 加速的应用
Section titled “GPU 加速的应用”语音转文字(Whisper)
Section titled “语音转文字(Whisper)”配置好 GPU 后,语音转文字会自动使用 GPU 加速,处理速度提升 5-10 倍。
# 在容器内检查 Whisper 是否使用 GPUdocker exec hermes-agent python3 -c "import torch; print(torch.cuda.is_available())"# 应该输出:True本地模型推理
Section titled “本地模型推理”可以用 ollama 或 llama.cpp 在容器内运行本地模型:
# 在 Hermes 对话中你:能不能在本地跑一个翻译模型?nvidia-smi 报错 “command not found”
Section titled “nvidia-smi 报错 “command not found””驱动还没有安装或者 WSL2 没有继承驱动。在 Windows 下安装 NVIDIA 驱动后重启。
“could not select device driver “nvidia""
Section titled ““could not select device driver “nvidia""”NVIDIA Container Toolkit 没有正确安装。重新执行安装步骤,确认 sudo systemctl restart docker 成功。
容器能启动但 nvidia-smi 不显示 GPU
Section titled “容器能启动但 nvidia-smi 不显示 GPU”# 检查 WSL2 中是否能识别 GPUnvidia-smi如果在 WSL2 终端里能看到 GPU,但容器里看不到,检查 Docker Desktop 的 WSL Integration 设置是否开启。