Я новичок в разработке CUDA и недавно перешел на использование Nvidia Nsight Eclipse IDE (версия 7.0 в Ubuntu 14.04).
У меня есть программа CUDA, которая компилируется и работает без проблем при сборке с использованием cmake.
Однако, когда я компилирую программу в Nsight, полученный двоичный файл работает очень медленно: >17000 мс/кадр (Nsight) против ‹20 мс/кадр (cmake).
Что может быть причиной этого замедления и как мне решить эту проблему?