Вопросы по теме 'cublas'

CUDA против управления памятью CuBlas
Я заметил, что я могу использовать блоки памяти для матриц, выделенных с помощью функции cudamalloc() или cublasalloc() для вызова функций cublas. Скорость передачи матриц и вычислительные процессы медленнее для массивов, выделенных с помощью...
2140 просмотров
schedule 11.05.2022

CUBLAS - возможно ли возведение в степень матричных элементов?
Я использую CUBLAS (библиотеки Cuda Blas) для матричных операций. Можно ли использовать CUBLAS для достижения возведения в степень / среднеквадратичного значения элементов матрицы? Я имею в виду, имея матрицу 2x2 1 4 9 16 Я хочу, чтобы...
1939 просмотров
schedule 24.05.2023

Простой пример умножения матриц CUBLAS?
Я ищу очень простой пример умножения матрицы костей для CUBLAS, который может умножать M на N и помещать результаты в P для следующего кода, используя высокопроизводительные операции графического процессора: float M[500][500], N[500][500],...
20696 просмотров
schedule 20.01.2023

приведение типов в CUDA и cuBLAS
Я пишу программу на cuda и пытаюсь уменьшить накладные расходы на передачу данных. Я использую библиотеку cuBLAS для умножения матриц, и мне нужно отправить 30 000 000 чисел, значения которых находятся в диапазоне от 0 до 255. Прямо сейчас я...
1800 просмотров
schedule 20.03.2022

Безопасно ли устанавливать элементы унифицированного массива в 0 с помощью операций CUBLAS/CUSPARSE?
Когда, например. накапливая результаты различных умножений матрицы-вектора (это то, что вы делаете в BLAS, даже когда есть только один накапливающий элемент), формально начинается с нулевого вектора. Но не существует способа без накладных расходов...
364 просмотров
schedule 16.04.2023

CUDA cublas‹t›gbmv понимание
Недавно я хотел использовать простое умножение матрицы на вектор CUDA. Я нашел подходящую функцию в библиотеке cublas: cublas‹‹>>gbmv. Вот документация Но на самом деле он очень беден, поэтому мне не удалось понять, что означают параметры kl и...
921 просмотров
schedule 23.04.2022

Сохранение скалярного произведения на GPGPU с помощью процедуры CUBLAS
Я пишу код для вычисления скалярного произведения двух векторов с использованием процедуры скалярного произведения CUBLAS, но он возвращает значение в памяти хоста. Я хочу использовать скалярное произведение для дальнейших вычислений только на GPGPU....
3766 просмотров
schedule 17.04.2022

cusparse csrsvanalysis иногда работает, иногда нет
Я пытаюсь использовать предварительно обусловленный сопряженный градиент для разрешения Ax=b. Поэтому я взял пример с образца, предоставленного cuda-sdk. Иногда, когда я вызываю функцию cusparseScsrsv_analysis , она возвращает ошибку 6, которая...
1050 просмотров
schedule 08.06.2023

Есть ли в cublas-4.1.28 изменение параметров функции?
Я хочу сделать следующее матрично-матричное умножение с помощью cublas: cA(M by K) * cB(K by N) => cAout(M by N) Я назначил cA с K в качестве ведущего индекса и cB с N в качестве ведущего индекса. Согласно справочнику cublas-4.0, я...
113 просмотров
schedule 29.12.2022

Матрица, обратная с помощью решателя линейной системы через cublas, cublasCreate exception или что-то еще
Я пытаюсь инвертировать матрицу, используя решатель линейных уравнений через библиотеку cublas CUDA. Исходное уравнение имеет вид: Ax = B = I I - identity matrix A - The matrix I'm trying to inverse x - (hopefully) the inverse(A) matrix...
2335 просмотров
schedule 02.07.2023

cublas cublasDgetrfBatched() пакетная факторизация LU не работает с матрицами размером более 32x32
Я написал функцию cuda для Matlab, чтобы выполнить факторизацию LU пакета матриц с использованием cublasDgetrfBatched(). Инструментальная документация по этой функции находится здесь . Он отлично работает для матриц размером до 32x32. Но это не...
774 просмотров
schedule 21.06.2022

Лучшие практики синхронизации cuBLAS
Я прочитал два сообщения о переполнении стека, а именно функции ядра cubas автоматически синхронизируются с хостом? и CUDA Dynamic параллелизм; потоковую синхронизацию с устройства , и они рекомендуют использовать некоторые API синхронизации,...
2703 просмотров
schedule 14.02.2023

Асинхронность и владение памятью в CUBLAS
CUBLAS - это асинхронная библиотека. Каковы требования к владению памятью для параметров, передаваемых в CUBLAS? Кажется очевидным, что матрицы, с которыми работает CUBLAS, не следует освобождать до завершения асинхронных вызовов - но как насчет...
188 просмотров
schedule 07.07.2023

Числовая ошибка в простом ядре cuda/cublas с использованием определенного ввода
Я работаю с cuda и cubas, и я пытался реализовать простые операции, такие как матричное поэлементное умножение/деление. Я использую только float для своих экспериментов. Я знаю, что самый очевидный способ сделать это — написать такое ядро:...
157 просмотров
schedule 19.04.2022

Ошибка сегментации тяги Cublas
Я новичок в программировании на CUDA. Я работал над примером кода, который умножает матрицу на вектор и печатает результаты. Я использую API Cublas Dgemv для выполнения умножения. При запуске программы с помощью cuda-memcheck я получаю следующую...
400 просмотров
schedule 26.07.2022

Инверсия матрицы CUDA по ссылке на CUDA-указатель
В настоящее время я просто пытаюсь реализовать простой алгоритм линейной регрессии в матричной форме на основе cuBLAS с CUDA. Умножение и транспонирование матриц хорошо работает с функцией cublasSgemm . Проблемы начинаются с инверсии матриц на...
494 просмотров
schedule 22.01.2023

CUDA: сложное матричное умножение
Я решаю большое количество линейных уравнений с комплексными числами, и мне нужно обновить свой решатель с помощью CUDA. Я хотел использовать cublas , поэтому я использовал cuComplex , но я не хочу, чтобы предварительная или постобработка зависела...
476 просмотров
schedule 30.12.2022

Использование cublasStbsv в ядре CUDA
Я пытаюсь решить уравнение с функцией cublasStbsv в своем ядре CUDA. Код ядра выглядит следующим образом: __global__ void invokeDeviceCublasSgemm(cublasStatus_t *returnValue, int n,...
362 просмотров
schedule 06.09.2023

сообщение device-function-maxrregcount при компиляции кода cuda
Я пытаюсь написать код, который выполняет множественное скалярное произведение внутри ядра. Я использую функцию cublasSdot из библиотеки cublas для выполнения скалярного произведения векторов. Это мой код: using namespace std; __global__...
790 просмотров
schedule 26.08.2022

Не удалось создать дескриптор CUBLAS. Взаимодействие Tensorflow с OpenCV
Я пытаюсь использовать PlayStation Eye Camera для проекта глубокого обучения с подкреплением. Сеть, установка TensorFlow (0.11) и CUDA (8.0) работают, потому что мне удалось обучить сеть на симуляции. Теперь, когда я пытаюсь прочитать изображения...
10656 просмотров
schedule 29.06.2023