cuFFT пакетное и одиночное преобразование

В документации NVIDIA cuda для cuFFT говорится: «Эти пакетные преобразования имеют более высокую производительность, чем одиночные преобразования». nofollow noreferrer">http://docs.nvidia.com/cuda/cufft/index.html#ixzz57haP0Mtz Следуйте за нами: @GPUComputing в Twitter | NVIDIA в Facebook) Но ничего количественного не показывает. какая-нибудь информация о том, насколько ускорение будет? из одного преобразования, которое я имею в виду внутри цикла for.

openacc cufft

JimBamFeng 21.02.2018 источник

Ответы (1)

arrow_upward
1
arrow_downward

Ускорение будет зависеть от размера матриц, количества пакетов и целевого оборудования (а также версии CUDA Toolkit). Если у вас есть большая партия маленьких матриц, вы увидите большее ускорение, чем в противном случае. Часть ускорения заключается в том, чтобы избежать накладных расходов на запуск, поэтому для размеров матрицы, которые достаточно велики, чтобы накладные расходы на запуск были небольшими по сравнению с выполнением ядра, вы не увидите такого большого ускорения. Я считаю, что для очень маленьких матриц они могут упаковать несколько пакетов вместе и использовать более эффективные (память) функции устройства.

Я расспрашиваю всех, есть ли какие-нибудь официальные документы или другие опубликованные отчеты. Пока я не нашел ни одного.

Mat Colgrove 22.02.2018

comment

Спасибо, Мэт, ты очень помог, я ценю это. - JimBamFeng; 22.02.2018

cuFFT пакетное и одиночное преобразование

Ответы (1)

Похожие вопросы