Я хочу вычислить оптимальный размер сетки и размер блока, чтобы иметь высокую степень занятости для запуска ядра. Я видел, что в CUDA есть функция для этого:
cudaOccupancyMaxPotentialBlockSize()
Я использую PyCUDA и хотел бы знать, существует ли эквивалентная функция в PyCUDA.