【严重】NVIDIA Container Toolkit < 1.17.8 容器逃逸漏洞
漏洞描述
NVIDIA Container Toolkit 是用于在容器中启用 GPU 加速计算的官方工具集,支持 NVIDIA 显卡驱动与 CUDA 环境的集成运行。
受漏洞影响版本中,NVIDIA Container Toolkit 中的 hook 初始化机制存在缺陷,由于在创建容器时继承环境变量 LD_PRELOAD,导致攻击者可以通过在容器启动时劫持挂载路径,将宿主机根目录挂入容器,并注入恶意共享库实现容器逃逸,获取宿主机 root 权限。
修复版本通过更新libnvidia-container库,阻止createContainer钩子继承恶意环境变量,从而防止容器逃逸。
| MPS编号 | MPS-zbip-29c7 |
|---|---|
| CVE编号 | CVE‑2025‑23266 |
| 处置建议 | 建议修复 |
| 发现时间 | 2025-07-18 |
| 利用成本 | 中 |
| 利用可能性 | 高 |
| 是否有POC | 是 |
影响范围
| 影响组件 | 受影响的版本 | 最小修复版本 |
|---|---|---|
| nvidia_container_toolkit | (-∞, 1.17.8) | 1.17.8 |
| nvidia_gpu_operator | (-∞, 25.3.1] | 暂无 |
| libnvidia_container | (-∞, 1.17.8) | 1.17.8 |
参考链接
https://www.oscs1024.com/hd/MPS-zbip-29c7
https://nvidia.custhelp.com/app/answers/detail/a_id/5659
https://github.com/NVIDIA/nvidia-container-toolkit/commit/77326385eaa22b516f9b43467ee4a8397319da13
排查方式
手动排查
检查nvidia-container-toolkit版本:运行nvidia-container-toolkit --version,确认是否<1.17.8;检查nvidia-gpu-operator版本:执行helm list -n gpu-operator,确认是否≤25.3.1;检查libnvidia-container版本:运行dpkg -l libnvidia-container或rpm -q libnvidia-container,确认是否<1.17.8。
一键自动排查全公司此类风险
墨菲安全为您免费提供一键排查全公司开源组件漏洞&投毒风险服务,可一键接入扫描全公司的代码仓库、容器镜像仓库、主机、制品仓库等。
试用地址:https://www.murphysec.com/adv?code=9VL5
提交漏洞情报:https://www.murphysec.com/bounty
处置方式
应急缓解方案
- 立即停止使用特权模式运行容器,确保所有容器以非root用户身份运行
- 在容器运行时配置中明确禁止设置
LD_PRELOAD环境变量,可通过容器运行时(如Docker、containerd)的环境变量白名单机制实现 - 实施临时策略,限制容器挂载宿主机目录的权限,仅允许必要的挂载点
- 对所有运行中的容器进行安全审计,检查是否存在异常挂载或可疑进程
- 在修复前,限制非必要容器的部署和启动权限
根本修复方案
- 将nvidia_container_toolkit升级至1.17.8或更高版本:
- Ubuntu/Debian系统:
apt-get update && apt-get install nvidia-container-toolkit=1.17.8-1 - RHEL/CentOS系统:
yum update nvidia-container-toolkit - 通过源码安装:从GitHub仓库获取1.17.8或更高版本源码编译安装
- 将nvidia_gpu_operator升级至25.3.2或更高版本:
- Helm部署方式:
helm upgrade nvidia-gpu-operator nvidia/gpu-operator --version 25.3.2 --namespace gpu-operator - 将libnvidia_container升级至1.17.8或更高版本:
- Ubuntu/Debian系统:
apt-get update && apt-get install libnvidia-container1=1.17.8-1 - RHEL/CentOS系统:
yum update libnvidia-container - 升级完成后重启容器运行时服务:
- Docker:
systemctl restart docker - Containerd:
systemctl restart containerd - 验证版本更新结果:
nvidia-container-toolkit --version确认显示1.17.8或更高版本