CUDA против управления памятью CuBlas

Я заметил, что я могу использовать блоки памяти для матриц, выделенных с помощью функции cudamalloc() или cublasalloc() для вызова функций cublas. Скорость передачи матриц и вычислительные процессы медленнее для массивов, выделенных с помощью cudamalloc(), чем с cublasalloc(), хотя есть и другие преимущества использования массивов с помощью cudamalloc(). Почему это так? Было бы здорово услышать некоторые комментарии.

memory cuda cublas

stanigator 05.11.2009 источник

comment

Видите ли вы это при работе с числами с плавающей запятой, двойными значениями или и тем, и другим? Это может быть проблема с выравниванием (cudaAlloc() принимает аргумент elemSize, а cudaMalloc() — нет). - Gabriel 05.11.2009

comment

Я работал с поплавками в обоих случаях. Не видел этого в двойнике, так как мне не нужно работать с двойниками в моем приложении. Заодно проверю cudaAlloc. - stanigator 05.11.2009

comment

Кстати, Габриэль, вы имеете в виду ''cublasAlloc()'', а не ''cudaAlloc()''? - stanigator 05.11.2009

comment

Да, это была опечатка. Если вы видите это с поплавками, то я не знаю, что сказать о разнице в производительности. - Gabriel 06.11.2009

comment

Если вы просто хотите оптимизировать, ознакомьтесь с 2D-выровненными pitch mallocs для cublas (вам нужно будет использовать термины lda и ldb в BLAS соответствующим образом). Это может дать значительное ускорение. И, конечно же, есть закрепленная память. - Gabriel 06.11.2009

comment

Я посмотрел на закрепленную память. Это выглядит многообещающе, так как я могу выделить память на хосте, доступную для GPU (особенно когда память на моем GPU находится на низком уровне). Я видел пример кода, размещенный на ddj.com/architect/217500110 . Однако будут ли какие-либо существенные потери производительности из-за дополнительных передач доступа к памяти, которые происходят между операциями? - stanigator 06.11.2009

Ответы (1)

arrow_upward
5
arrow_downward

cublasAlloc по сути является оболочкой вокруг cudaMalloc(), поэтому разницы быть не должно, есть ли что-то еще, что меняется в вашем коде?

Tom 19.11.2009

CUDA против управления памятью CuBlas

Ответы (1)

Похожие вопросы