cuFFT пакетное и одиночное преобразование

В документации NVIDIA cuda для cuFFT говорится: «Эти пакетные преобразования имеют более высокую производительность, чем одиночные преобразования». nofollow noreferrer">http://docs.nvidia.com/cuda/cufft/index.html#ixzz57haP0Mtz Следуйте за нами: @GPUComputing в Twitter | NVIDIA в Facebook) Но ничего количественного не показывает. какая-нибудь информация о том, насколько ускорение будет? из одного преобразования, которое я имею в виду внутри цикла for.


person JimBamFeng    schedule 21.02.2018    source источник


Ответы (1)


Ускорение будет зависеть от размера матриц, количества пакетов и целевого оборудования (а также версии CUDA Toolkit). Если у вас есть большая партия маленьких матриц, вы увидите большее ускорение, чем в противном случае. Часть ускорения заключается в том, чтобы избежать накладных расходов на запуск, поэтому для размеров матрицы, которые достаточно велики, чтобы накладные расходы на запуск были небольшими по сравнению с выполнением ядра, вы не увидите такого большого ускорения. Я считаю, что для очень маленьких матриц они могут упаковать несколько пакетов вместе и использовать более эффективные (память) функции устройства.

Я расспрашиваю всех, есть ли какие-нибудь официальные документы или другие опубликованные отчеты. Пока я не нашел ни одного.

person Mat Colgrove    schedule 22.02.2018
comment
Спасибо, Мэт, ты очень помог, я ценю это. - person JimBamFeng; 22.02.2018