Я заметил, что я могу использовать блоки памяти для матриц, выделенных с помощью функции cudamalloc() или cublasalloc() для вызова функций cublas. Скорость передачи матриц и вычислительные процессы медленнее для массивов, выделенных с помощью cudamalloc(), чем с cublasalloc(), хотя есть и другие преимущества использования массивов с помощью cudamalloc(). Почему это так? Было бы здорово услышать некоторые комментарии.
CUDA против управления памятью CuBlas
Ответы (1)
cublasAlloc
по сути является оболочкой вокруг cudaMalloc()
, поэтому разницы быть не должно, есть ли что-то еще, что меняется в вашем коде?
person
Tom
schedule
19.11.2009
cudaAlloc()
принимает аргументelemSize
, аcudaMalloc()
— нет). - person Gabriel   schedule 05.11.2009pitch
mallocs для cublas (вам нужно будет использовать терминыlda
иldb
в BLAS соответствующим образом). Это может дать значительное ускорение. И, конечно же, есть закрепленная память. - person Gabriel   schedule 06.11.2009