сокращение pyCUDA не работает

Я использую код сокращения в основном точно так же, как примеры в документах. Приведенный ниже код должен возвращать 2^3 + 2^3 = 16, но вместо этого возвращает 9. Что я сделал не так?

import numpy
import pycuda.reduction as reduct
import pycuda.gpuarray as gpuarray
import pycuda.autoinit
from pycuda.compiler import SourceModule as module

newzeros = [{1,2,3},{4,5,6}]
gpuSum = reduct.ReductionKernel(numpy.uint64, neutral="0", reduce_expr="a+b", map_expr="1 << x[i]", arguments="int* x")
mylengths = pycuda.gpuarray.to_gpu(numpy.array(map(len,newzeros),dtype = "uint64",))
sumfalse = gpuSum(mylengths).get()
print sumfalse

person Elliot Gorokhovsky    schedule 14.02.2015    source источник


Ответы (1)


Я только что понял это. Список аргументов, используемый при определении ядра, должен быть unsigned long *x, а не int *x. Я везде использовал 64-битные целые числа, и это все испортило.

person Elliot Gorokhovsky    schedule 14.02.2015