Эквивалент функции cudaOccupancyMaxPotentialBlockSize в pycuda

Я хочу вычислить оптимальный размер сетки и размер блока, чтобы иметь высокую степень занятости для запуска ядра. Я видел, что в CUDA есть функция для этого:

cudaOccupancyMaxPotentialBlockSize() 

Я использую PyCUDA и хотел бы знать, существует ли эквивалентная функция в PyCUDA.


person axeldal    schedule 01.09.2015    source источник
comment
Максимальная заполняемость не всегда может быть достигнута при максимальном размере блока, то есть блоки меньшего размера могут обеспечить более высокую заполняемость.   -  person void_ptr    schedule 01.09.2015


Ответы (1)


Насколько я могу судить, функции занятости API драйвера, включая cuOccupancyMaxPotentialBlockSize, не были реализованы в PyCUDA версии 2015.1.3, на основе поиска на зеркале Github.

person talonmies    schedule 01.09.2015