Вопросы по теме 'gpgpu'
Выполнимость GPU в качестве процессора?
Как вы думаете, какое будущее у GPU как инициативы CPU, такие как CUDA? Как вы думаете, они станут мейнстримом и станут следующей причудой в индустрии? Apple создает новую структуру для использования графического процессора для выполнения задач ЦП,...
2582 просмотров
schedule
16.03.2023
Выполнение считывания с текстур и поверхностей Direct3D
Мне нужно выяснить, как получить данные из текстур и поверхностей D3D обратно в системную память. Какой самый быстрый способ сделать такие вещи и как?
Кроме того, если мне нужен только один subrect, как можно прочитать только эту часть без...
18504 просмотров
schedule
17.07.2022
Проблемы с памятью CUDA
У меня есть ядро CUDA, которое я компилирую в файл cubin без каких-либо специальных флагов:
nvcc text.cu -cubin
Он компилируется, но с этим сообщением:
Рекомендация: невозможно сказать, на что указывает указатель, принимая во...
5743 просмотров
schedule
05.06.2023
Преобразование растрового изображения с использованием графического процессора
Не знаю, правильный ли это форум. В любом случае вот вопрос. В одном из наших приложений мы отображаем медицинские изображения, а поверх них растровое изображение, сгенерированное алгоритмом. Настоящее растровое изображение представляет собой...
674 просмотров
schedule
29.04.2023
Ядра CUDA дают разные результаты на 2 разных графических процессорах (GeForce 8600M GT против Quadro FX 770M)
Я работаю над приложением AES CUDA, и у меня есть ядро, которое выполняет шифрование ECB на графическом процессоре. Чтобы убедиться, что логика алгоритма не изменяется при параллельной работе, я отправляю известный входной тестовый вектор,...
1018 просмотров
schedule
01.05.2022
Есть ли библиотека Java для ускоренных векторных вычислений?
Я ищу библиотеку Java, которая позволяет выполнять некоторые быстрые вычисления с вектором (и, возможно, с матрицами).
Под быстрым я подразумеваю использование преимуществ обработки GPU и/или инструкций SSE. Мне интересно, можно ли найти что-то...
2049 просмотров
schedule
01.03.2022
выяснить, сколько блоков и потоков для ядра cuda и как их использовать
Я пытался понять, как сделать то, что, как я думал, будет простым ядром, которое будет принимать среднее значение значений в 2-мерной матрице, но у меня возникают некоторые проблемы с точным изложением своего мыслительного процесса.
Согласно моему...
3329 просмотров
schedule
28.11.2022
Доступ графического процессора к оперативной памяти системы
В настоящее время я участвую в разработке крупного научного вычислительного проекта и изучаю возможность аппаратного ускорения с помощью графических процессоров в качестве альтернативы подходу MPI/кластера. Мы находимся в основном в ситуации,...
5069 просмотров
schedule
01.03.2022
Есть ли ограничение на локальную память OpenCL?
Сегодня я добавил еще четыре __local переменных в свое ядро для вывода промежуточных результатов. Но просто добавление еще четырех переменных в сигнатуру ядра и добавление соответствующих аргументов ядра рендерит весь вывод ядра в «0». Ни одна из...
13256 просмотров
schedule
29.03.2022
CUDA: метод разделения *огромных* проблем?
Вся эта забава с CUDA тает в своей мощи, но мне было интересно узнать о жестких ограничениях на размеры 1d блока/сетки (обычно 512/65535 соответственно).
При работе с проблемами, которые намного больше по своему масштабу (порядка миллиардов),...
1119 просмотров
schedule
11.03.2022
OpenCL для поиска массива и установки флага
Я новичок в использовании OpenCL, и кажется, что это должно быть очень просто, так что потерпите меня.
Я пишу простое ядро для сканирования массива и поиска определенного значения. Если это значение найдено где-либо в массиве, я бы хотел, чтобы...
1043 просмотров
schedule
02.04.2022
Кэш L2 в NVIDIA Fermi
Глядя на название счетчиков производительности в архитектуре NVIDIA Fermi (файл Compute_profiler.txt в папке doc cuda), я заметил, что для промахов кэша L2 есть два счетчика производительности, l2_subp0_read_sector_misses и...
835 просмотров
schedule
09.02.2023
Нужен совет по библиотеке GPGPU
Я пишу приложение, и в итоге получается хорошо распараллеливаемая часть:
two dimensional float initialData and result arrays
for each cell (a, b) in result array:
for each cell (i, j) in initialData:
result(a, b) +=...
342 просмотров
schedule
12.04.2022
Проблемы с выделением и доступом к памяти CUDA
Я работаю над изучением CUDA прямо сейчас. У меня есть некоторый базовый опыт работы с MPI, поэтому я решил начать с нескольких действительно простых векторных операций. Я пытаюсь написать параллельный точечный продукт. У меня либо возникают...
954 просмотров
schedule
22.03.2022
Для каких типов доменов кода подходит OpenCL?
Я прочитал обзор OpenCL, и в нем говорится, что он подходит для кода, который работает на процессорах, GPGPU, DSP и т. Д. Однако, просматривая справочник по командам, кажется, что это все математические операции и операции с изображениями. Я не видел...
1364 просмотров
schedule
25.09.2022
эффективный произвольный доступ к памяти графического процессора с OpenGL
Каков наилучший шаблон для эффективного вычисления графическим процессором «антифункциональных» процедур, которые обычно зависят от позиционированной записи в память, а не от чтения? Например. например, вычисление гистограммы, сортировка, деление...
4855 просмотров
schedule
16.09.2022
GPU для CFE/CE/QCC
HD7970 против FirePro V8800
Есть ли причина, по которой мне не следует использовать графику AMD Radeon™ HD7970? Я имею в виду, что это 970GFlops DP, который, я думаю, удовлетворяет мои потребности, а затем и некоторые другие.
Я буду работать с...
247 просмотров
schedule
19.05.2022
Могу ли я использовать GPU в качестве GPGPU в любой системе?
Я хочу использовать графический процессор системы в качестве GPGPU. Машина удаленная, у меня нет прав администратора и я ничего не знаю о ее драйверах. Я знаю, что у него есть карта Matrox VGA. Могу ли я использовать GPGPU с кодом C и компилятором...
236 просмотров
schedule
24.03.2024
Как использовать общую память между вызовом ядра CUDA?
Я хочу использовать общую память между вызовами ядра одного ядра. Могу ли я использовать общую память между вызовами ядра?
1235 просмотров
schedule
08.07.2023
Не удалось обнаружить устройство с поддержкой CUDA в графическом процессоре Opencv
Привет,
Я пытаюсь использовать Opencv GPU с CUDA. Я использовал CMake для компиляции opencv 2.3.1 с cuda 4.0. Но когда я пытаюсь использовать функцию cv::gpu:getCudaEnabledDevice(), она возвращает мне ноль, что означает отсутствие доступного...
2677 просмотров
schedule
29.05.2022