Вопросы по теме 'kepler'

Динамический параллелизм Kepler CUDA и расхождение потоков
Информации по dynamic parallelism Кеплера очень мало, из описания этой новой технологии, значит решается вопрос расхождения потока управления потоками в одном и том же варпе? Это позволяет recursion и запускать ядро ​​​​из кода устройства,...
1085 просмотров
schedule 19.07.2022

понимание инструкций по сборке Nvidia Kepler
Я наткнулся на этот документ cuobjdump.pdf . В нем перечислены инструкции Ферми и Кеплера, но без дополнительных объяснений. Помимо обычного сложения, вычитания, умножения и т. д., я не понимаю, что означают или делают другие инструкции. Может...
735 просмотров
schedule 24.11.2022

CUDA Kepler: недостаточно ALU
Согласно технической документации Kepler, размер варпа для графического процессора на базе Kepler составляет 32, и каждый мультипроцессор содержит 4 расписания варпа, которые выбирают две независимые инструкции из выбранного варпа. Это означает, что...
106 просмотров
schedule 26.05.2022

Max Warps на графическом процессоре GK110
Согласно техническому описанию GK110 , каждый SMX имеет максимум 64 деформации и максимальную емкость потока 2048 потоков. У меня такой вопрос: всегда ли каждый SMX работает с этим максимальным резидентным номером деформации 64 (при условии...
200 просмотров
schedule 16.08.2022

Плата для разработки Nvidia Jetson TK1 — вычислительные возможности Cuda
Я очень впечатлен этим комплектом развертывания. Вместо того, чтобы покупать новую карту CUDA, для которой может потребоваться новая основная плата и т. Д., Эта карта, похоже, предоставляет все в одном. В его спецификациях указано, что он имеет...
1108 просмотров

CUDA: трансляция уровня блоков потоков на K40 с использованием инструкций Shuffle
indirectJ2[MAX_SUPER_SIZE] — общий массив. Ядро моего устройства cuda содержит следующую инструкцию (выполняется всеми потоками в блоке потоков): int nnz_col = indirectJ2[MAX_SUPER_SIZE - 1]; Я подозреваю, что это вызовет конфликты с...
482 просмотров
schedule 04.06.2022

Более быстрые параллельные редукции на Кеплере
Я только новичок в CUDA и пытаюсь использовать Быстрые параллельные сокращения на Kepler в моей программе, но я не получил результата, ниже приведена функция того, что я делаю, вывод равен 0, я был бы признателен, если бы узнал, в чем моя ошибка?...
363 просмотров
schedule 01.06.2022