Как узнать, что работает на моем графическом процессоре (NVIDIA)?

Я использую свой графический процессор (Tesla K80) для обучения нейронных сетей с помощью tensorflow, и что-то пошло не так. Когда я набираю nvidia-smi, я вижу, что используется 11239MiB / 11439MiB памяти, но процессы для графического процессора не указаны. Обычно, когда это происходит, я могу ввести ps aux | grep python и найти процесс, использующий GPU, но на этот раз ничего не происходит.

Как узнать, что работает на моем графическом процессоре, и как его убить?


person Toke Faurby    schedule 14.11.2017    source источник
comment
Я не знаю, возможно ли это на вашей машине, но на наших серверах, если nvidia-smi ведет себя странно, пришло время для перезагрузки. Обновления являются частой причиной того, что nvidia-smi показывает странную информацию, например, отсутствие видеокарты или процессов или что-то в этом роде.   -  person Thomas Pinetz    schedule 14.11.2017
comment
Перезапуск все исправил, но я надеялся на более элегантное и менее навязчивое решение.   -  person Toke Faurby    schedule 14.11.2017


Ответы (1)


Просматривайте все процессы, запущенные пользователем, который использовал GPU. Убейте все процессы, которые могли использовать GPU.

ps -ef | grep <username>

Вы также можете попробовать

sudo nvidia-smi --gpu-reset

Если ничего не работает, подумайте о перезагрузке.

person dgumo    schedule 14.11.2017