Привет, когда я компилирую с nvcc -arch=sm_13
, я получаю:
ptxas info : Used 29 registers, 28+16 bytes smem, 7200 bytes cmem[0], 8 bytes cmem[1]
когда я использую nvcc -arch=sm_20
, я получаю:
ptxas info : Used 34 registers, 60 bytes cmem[0], 7200 bytes cmem[2], 4 bytes cmem[16]
Я думал, что все параметры ядра передаются в разделяемую память, но для sm_20 это не так...?! Возможно, они также передаются в реестры? Глава моей функции выглядит следующим образом:
__global__ void func(double *, double , double, int)
Спасибо!