Mr.ZhengGang's blog Mr.ZhengGang's blog
首页
  • 天河一号
  • 01.编译环境
  • 02.基础库
  • 03.应用软件
  • 04.工具软件
  • 05.常用语言环境
  • 06.使用进阶
  • 入门课程

    • 01.超算历史
    • 02.VPN登录
    • 03.Mobaxterm工具
    • 04.Linux基本命令
    • 05.Module环境变量管理工具
    • 06.Vim文本编辑器使用
    • 07.Slurm作业管理系统
  • 01.登录问题
  • 02.编译问题
  • 03.作业问题
  • 04.存储和数据问题
  • 05.GPU问题
💖联系
🚀试用
GitHub (opens new window)
首页
  • 天河一号
  • 01.编译环境
  • 02.基础库
  • 03.应用软件
  • 04.工具软件
  • 05.常用语言环境
  • 06.使用进阶
  • 入门课程

    • 01.超算历史
    • 02.VPN登录
    • 03.Mobaxterm工具
    • 04.Linux基本命令
    • 05.Module环境变量管理工具
    • 06.Vim文本编辑器使用
    • 07.Slurm作业管理系统
  • 01.登录问题
  • 02.编译问题
  • 03.作业问题
  • 04.存储和数据问题
  • 05.GPU问题
💖联系
🚀试用
GitHub (opens new window)
  • 登陆问题

    • 登录问题汇总
    • VPN检测工具
    • Linux64位系统登录VPN
    • 保持VPN在线
    • 如何修改系统密码
    • 如何重置bashrc文件
  • 编译问题

    • 编译问题汇总
  • 作业问题

    • 作业常见问题
    • 调整作业顺序
    • slurm一次yhbatch提交多个任务
    • slurm一次yhrun加载多个作业步
    • slurm的内置环境变量
    • 环境变量配置
  • 存储和数据问题

    • 存储和数据问题汇总
    • 存储配额说明
    • 数据拷贝
  • GPU问题

    • GPU问题汇总
      • 1 no CUDA-capable device is detected
  • 问答
  • GPU问题
ZhengGang
2017-10-20

GPU问题汇总

# GPU问题

# 1 no CUDA-capable device is detected

问题:使用 CUDA toolkit 编译程序后,在 gpu_test 分区提交作业,运行时提示错误:no CUDA-capable device is detected

解答:可能原因有二种情况:

1.可能是分配到的该计算节点上用于连接CPU 与 GPU 的 PCIe 总线松动,导致无法找到 device。解决方法:在提交作业是可使用 -x 选项屏蔽该节点;

2.可能是编译时使用的 CUDA toolkit 和计算节点上安装的 CUDA driver 版本不一致导致,gpu_test 分区的计算节点上的 CUDA driver 版本是与 CUDA 7.5 的 toolkit 对应的。解决方法:使用 CUDA 7.5 或 CUDA 5.0 的 toolkit 编译程序。另外,如果同时设置了多个版本的 CUDA 环境,也会导致该问题出现,解决方法:清除所有有关 CUDA 的环境变量设置,然后重新加载一个版本的 CUDA 环境。

数据拷贝

← 数据拷贝

Theme by Vdoing | Copyright © 2018-2020 Zheng Gang | MIT License | 津ICP备17007036号-1
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式