Вопросы по теме 'pycuda'

PyCUDA / Copperhead, похоже, не распознает 64-битные машины
У меня сейчас две проблемы с копперхедом, которые, как я подозреваю, связаны между собой. Запуск демонстрационного файла (samples/axpy.py) породил множество маленьких предупреждений, но это особенно выделялось. g++ -pthread -fno-strict-aliasing...
432 просмотров
schedule 19.04.2023

Адресация памяти PyCUDA: смещение памяти?
У меня есть большой кусок сгенерированных данных (A[i,j,k]) на устройстве, но мне нужен только один «кусочек» A[i,:,:], и в обычном CUDA это может быть легко достигается с помощью некоторой арифметики указателя. Можно ли сделать то же самое в...
527 просмотров

CUDA/PyCUDA: на каком графическом процессоре работает X11?
В системе Linux с несколькими графическими процессорами, как определить, на каком графическом процессоре работает X11, а на каком совершенно бесплатно можно запускать ядра CUDA? В системе с маломощным графическим процессором для запуска X11 и более...
1143 просмотров
schedule 27.11.2023

Показать все предупреждения NVCC в PyCUDA
[обновление] Как вывести предупреждающие сообщения от compiler.SourceModule(kernel_code) ? С помощью @flipchart я смог передать нужные параметры в NVCC через PyCUDA, но я до сих пор не знаю, где получить доступ к предупреждениям компилятора....
3597 просмотров
schedule 22.06.2023

Ошибка установки pycuda на ubuntu: / usr / bin / ld: не удается найти -lcuda
Я новичок и устанавливаю pycuda2011.2.2 на ubuntu 11.10, но не могу его завершить. Cuda - 4.0. Я установил библиотеки: $ sudo apt-get install build-essential python-dev python-setuptools libboost-python-dev libboost-thread-dev -y вызов...
1736 просмотров
schedule 18.04.2024

Элементарная функция в массиве pycuda::complex
Я хочу запустить функцию для большого двухмерного сложного массива (в конечном итоге 2* 12x2 *12 точек данных). Однако pycuda не работает должным образом. Функция ElementWise не работает с двумерными массивами, поэтому я использовал функцию...
1987 просмотров
schedule 30.03.2022

перегрузка оператора в Cuda
Я успешно создал оператор + между двумя float4, выполнив: __device__ float4 operator+(float4 a, float4 b) { // ... } Однако, если, кроме того, я хочу иметь оператор + для uchar4, делая то же самое с uchar4, я получаю следующую ошибку:...
1579 просмотров
schedule 26.03.2023

cudaBindTextureToArray в PyCuda
Есть ли способ привязать массив, который уже находится на графическом процессоре, к текстуре с помощью PyCuda? Уже есть cuda.bind_array_to_texref(cuda.make_multichannel_2d_array(...), texref) , который привязывает массив на ЦП к текстуре, но я не...
911 просмотров
schedule 30.03.2022

Изменить значения нескольких ячеек в CUDA
Это должно быть просто, хотя я не могу найти ответ. Я пишу программу, которая должна вычислять состояния клеточных автоматов, и чтобы понять, как работает CUDA, я сначала попытался написать очень простую программу. Он принимает матрицу, и каждый...
121 просмотров
schedule 14.06.2023

PyCUDA: синтаксис для функции, которая вызывает функцию
При использовании функции из SourceModule, которая зависит от другой функции в SourceModule, как мне передать ее в вызове функции, т.е. что такое "???" в следующем коде: import numpy import pycuda.autoinit import pycuda.driver as drv from...
515 просмотров
schedule 11.09.2022

Интеграция ODE на GPU с помощью boost и python
Не так давно я писал здесь о модели, которую я пытаюсь построить с помощью pycuda, которая решает около 9000 связанных ODE. Однако моя модель слишком медленная, и член SO предположил, что, вероятно, виновата передача памяти с хоста на GPU. Прямо...
1502 просмотров
schedule 21.08.2022

установить модуль python для использования графического процессора в Windows 8.1 x64
У меня возникли проблемы с установкой модулей python. Я хочу использовать GPU в скрипте python, но получаю ошибку при установке модулей 1- Я устанавливаю графический драйвер: Geforce GT 650M 2- Устанавливаю cuda_5....
1575 просмотров
schedule 13.07.2023

PyCUDA точность кода умножения матриц
Я пытаюсь выучить CUDA и использовать PyCUDA для написания простого кода умножения матриц. Для двух случайно сгенерированных матриц 4x4 я получаю следующее решение: Cuda: [[ -5170.86181641 -21146.49609375 20690.02929688 -35413.9296875 ]...
2645 просмотров
schedule 11.05.2022

Развертывание тривиально распараллеливаемого цикла for в python с помощью CUDA
У меня есть цикл for в python, который я хочу развернуть на GPU. Я предполагаю, что должно быть простое решение, но я его еще не нашел. Наша функция перебирает элементы в массиве numpy и выполняет некоторые математические операции, сохраняя...
2628 просмотров
schedule 13.05.2023

сокращение pyCUDA не работает
Я использую код сокращения в основном точно так же, как примеры в документах. Приведенный ниже код должен возвращать 2^3 + 2^3 = 16 , но вместо этого возвращает 9. Что я сделал не так? import numpy import pycuda.reduction as reduct import...
508 просмотров
schedule 20.05.2022

Векторная арифметика Pycuda - идентификатор внутри ядра
Я пытаюсь разработать простую программу с pycuda, чтобы протестировать ее, а затем сравнить с моей реализацией opencl. Тем не менее, у меня возникли проблемы с добавлением 2 массивов 1D. Проблема в том, что я не могу найти правильный идентификатор...
634 просмотров

Как правильно инициализировать 2D-поверхность в PyCUDA? (pycuda._driver.LogicError)
Я пытаюсь инициализировать 2D-поверхность в PyCUDA и заполнить ее значениями из 2D-массива NumPy. Идея, как я понимаю, такова. открыть drv.ArrayDescriptor , создайте drv.Array , используя этот дескриптор, скопировать данные из массива NumPy...
340 просмотров
schedule 21.06.2022

Начало работы с общей памятью в PyCUDA
Я пытаюсь понять общую память, играя со следующим кодом: import pycuda.driver as drv import pycuda.tools import pycuda.autoinit import numpy from pycuda.compiler import SourceModule src=''' __global__ void reduce0(float *g_idata, float *g_odata)...
2394 просмотров
schedule 04.08.2022

Эквивалент функции cudaOccupancyMaxPotentialBlockSize в pycuda
Я хочу вычислить оптимальный размер сетки и размер блока, чтобы иметь высокую степень занятости для запуска ядра. Я видел, что в CUDA есть функция для этого: cudaOccupancyMaxPotentialBlockSize() Я использую PyCUDA и хотел бы знать,...
1106 просмотров
schedule 03.01.2023

установить pycuda в ubuntu 14.04 с cuda 7.0
я пытаюсь установить pycuda с cuda 7.0 без проблем и запустить код хорошо, но я не могу установить и запустить pycuda после установки pycuda с помощью Установка PyCUDA в Ubuntu Linux попробуйте запустить простой код с помощью простого кода pycuda...
668 просмотров
schedule 29.03.2023