Проблемы с памятью CUDA

У меня есть ядро ​​CUDA, которое я компилирую в файл cubin без каких-либо специальных флагов:

nvcc text.cu -cubin

Он компилируется, но с этим сообщением:

Рекомендация: невозможно сказать, на что указывает указатель, принимая во внимание объем глобальной памяти.

и ссылка на строку в каком-то временном файле cpp. Я могу заставить это работать, закомментировав какой-нибудь, казалось бы, произвольный код, который не имеет для меня никакого смысла.

Ядро выглядит следующим образом:

__global__ void string_search(char** texts, int* lengths, char* symbol, int* matches, int symbolLength)
{
    int localMatches = 0;
    int blockId = blockIdx.x + blockIdx.y * gridDim.x;
    int threadId = threadIdx.x + threadIdx.y * blockDim.x;
    int blockThreads = blockDim.x * blockDim.y;

    __shared__ int localMatchCounts[32];

    bool breaking = false;
    for(int i = 0; i < (lengths[blockId] - (symbolLength - 1)); i += blockThreads)
    {
        if(texts[blockId][i] == symbol[0])
        {
            for(int j = 1; j < symbolLength; j++)
            {
                if(texts[blockId][i + j] != symbol[j])
                {
                    breaking = true;
                    break;
                }
            }
            if (breaking) continue;
            localMatches++;
        }
    }

    localMatchCounts[threadId] = localMatches;

    __syncthreads();

    if(threadId == 0)
    {
        int sum = 0;
        for(int i = 0; i < 32; i++)
        {
            sum += localMatchCounts[i];
        }
        matches[blockId] = sum;
    }
}

Если я заменю строку

localMatchCounts[threadId] = localMatches;

после первого цикла for с этой строкой

localMatchCounts[threadId] = 5;

он компилируется без уведомлений. Этого также можно добиться, закомментировав кажущиеся случайными части цикла над строкой. Я также попытался заменить массив локальной памяти обычным массивом, но безрезультатно. Кто-нибудь может сказать мне, в чем проблема?

Система Vista 64bit, чего бы это ни стоило.

Изменить: я исправил код, чтобы он действительно работал, хотя компилятор по-прежнему выдает уведомление. Не похоже, что предупреждение является проблемой, по крайней мере, в отношении правильности (оно может повлиять на производительность).


person Morten Christiansen    schedule 14.11.2008    source источник


Ответы (1)


Проблема, похоже, связана с параметром char**. Превращение этого в char* решило предупреждение, поэтому я подозреваю, что у cuda могут быть проблемы с этой формой данных. Возможно, cuda предпочитает, чтобы в этом случае использовались конкретные 2D-массивы cuda.

person Morten Christiansen    schedule 18.11.2008