Вопросы по теме 'gpgpu'

Выполнимость GPU в качестве процессора?
Как вы думаете, какое будущее у GPU как инициативы CPU, такие как CUDA? Как вы думаете, они станут мейнстримом и станут следующей причудой в индустрии? Apple создает новую структуру для использования графического процессора для выполнения задач ЦП,...
2582 просмотров
schedule 16.03.2023

Выполнение считывания с текстур и поверхностей Direct3D
Мне нужно выяснить, как получить данные из текстур и поверхностей D3D обратно в системную память. Какой самый быстрый способ сделать такие вещи и как? Кроме того, если мне нужен только один subrect, как можно прочитать только эту часть без...
18504 просмотров
schedule 17.07.2022

Проблемы с памятью CUDA
У меня есть ядро ​​CUDA, которое я компилирую в файл cubin без каких-либо специальных флагов: nvcc text.cu -cubin Он компилируется, но с этим сообщением: Рекомендация: невозможно сказать, на что указывает указатель, принимая во...
5743 просмотров
schedule 05.06.2023

Преобразование растрового изображения с использованием графического процессора
Не знаю, правильный ли это форум. В любом случае вот вопрос. В одном из наших приложений мы отображаем медицинские изображения, а поверх них растровое изображение, сгенерированное алгоритмом. Настоящее растровое изображение представляет собой...
674 просмотров
schedule 29.04.2023

Ядра CUDA дают разные результаты на 2 разных графических процессорах (GeForce 8600M GT против Quadro FX 770M)
Я работаю над приложением AES CUDA, и у меня есть ядро, которое выполняет шифрование ECB на графическом процессоре. Чтобы убедиться, что логика алгоритма не изменяется при параллельной работе, я отправляю известный входной тестовый вектор,...
1018 просмотров
schedule 01.05.2022

Есть ли библиотека Java для ускоренных векторных вычислений?
Я ищу библиотеку Java, которая позволяет выполнять некоторые быстрые вычисления с вектором (и, возможно, с матрицами). Под быстрым я подразумеваю использование преимуществ обработки GPU и/или инструкций SSE. Мне интересно, можно ли найти что-то...
2049 просмотров

выяснить, сколько блоков и потоков для ядра cuda и как их использовать
Я пытался понять, как сделать то, что, как я думал, будет простым ядром, которое будет принимать среднее значение значений в 2-мерной матрице, но у меня возникают некоторые проблемы с точным изложением своего мыслительного процесса. Согласно моему...
3329 просмотров
schedule 28.11.2022

Доступ графического процессора к оперативной памяти системы
В настоящее время я участвую в разработке крупного научного вычислительного проекта и изучаю возможность аппаратного ускорения с помощью графических процессоров в качестве альтернативы подходу MPI/кластера. Мы находимся в основном в ситуации,...
5069 просмотров
schedule 01.03.2022

Есть ли ограничение на локальную память OpenCL?
Сегодня я добавил еще четыре __local переменных в свое ядро ​​для вывода промежуточных результатов. Но просто добавление еще четырех переменных в сигнатуру ядра и добавление соответствующих аргументов ядра рендерит весь вывод ядра в «0». Ни одна из...
13256 просмотров
schedule 29.03.2022

CUDA: метод разделения *огромных* проблем?
Вся эта забава с CUDA тает в своей мощи, но мне было интересно узнать о жестких ограничениях на размеры 1d блока/сетки (обычно 512/65535 соответственно). При работе с проблемами, которые намного больше по своему масштабу (порядка миллиардов),...
1119 просмотров

OpenCL для поиска массива и установки флага
Я новичок в использовании OpenCL, и кажется, что это должно быть очень просто, так что потерпите меня. Я пишу простое ядро ​​для сканирования массива и поиска определенного значения. Если это значение найдено где-либо в массиве, я бы хотел, чтобы...
1043 просмотров
schedule 02.04.2022

Кэш L2 в NVIDIA Fermi
Глядя на название счетчиков производительности в архитектуре NVIDIA Fermi (файл Compute_profiler.txt в папке doc cuda), я заметил, что для промахов кэша L2 есть два счетчика производительности, l2_subp0_read_sector_misses и...
835 просмотров
schedule 09.02.2023

Нужен совет по библиотеке GPGPU
Я пишу приложение, и в итоге получается хорошо распараллеливаемая часть: two dimensional float initialData and result arrays for each cell (a, b) in result array: for each cell (i, j) in initialData: result(a, b) +=...
342 просмотров
schedule 12.04.2022

Проблемы с выделением и доступом к памяти CUDA
Я работаю над изучением CUDA прямо сейчас. У меня есть некоторый базовый опыт работы с MPI, поэтому я решил начать с нескольких действительно простых векторных операций. Я пытаюсь написать параллельный точечный продукт. У меня либо возникают...
954 просмотров
schedule 22.03.2022

Для каких типов доменов кода подходит OpenCL?
Я прочитал обзор OpenCL, и в нем говорится, что он подходит для кода, который работает на процессорах, GPGPU, DSP и т. Д. Однако, просматривая справочник по командам, кажется, что это все математические операции и операции с изображениями. Я не видел...
1364 просмотров

эффективный произвольный доступ к памяти графического процессора с OpenGL
Каков наилучший шаблон для эффективного вычисления графическим процессором «антифункциональных» процедур, которые обычно зависят от позиционированной записи в память, а не от чтения? Например. например, вычисление гистограммы, сортировка, деление...
4855 просмотров
schedule 16.09.2022

GPU для CFE/CE/QCC
HD7970 против FirePro V8800 Есть ли причина, по которой мне не следует использовать графику AMD Radeon™ HD7970? Я имею в виду, что это 970GFlops DP, который, я думаю, удовлетворяет мои потребности, а затем и некоторые другие. Я буду работать с...
247 просмотров

Могу ли я использовать GPU в качестве GPGPU в любой системе?
Я хочу использовать графический процессор системы в качестве GPGPU. Машина удаленная, у меня нет прав администратора и я ничего не знаю о ее драйверах. Я знаю, что у него есть карта Matrox VGA. Могу ли я использовать GPGPU с кодом C и компилятором...
236 просмотров
schedule 24.03.2024

Как использовать общую память между вызовом ядра CUDA?
Я хочу использовать общую память между вызовами ядра одного ядра. Могу ли я использовать общую память между вызовами ядра?
1235 просмотров
schedule 08.07.2023

Не удалось обнаружить устройство с поддержкой CUDA в графическом процессоре Opencv
Привет, Я пытаюсь использовать Opencv GPU с CUDA. Я использовал CMake для компиляции opencv 2.3.1 с cuda 4.0. Но когда я пытаюсь использовать функцию cv::gpu:getCudaEnabledDevice(), она возвращает мне ноль, что означает отсутствие доступного...
2677 просмотров
schedule 29.05.2022