Вопросы по теме 'cublas'
CUDA против управления памятью CuBlas
Я заметил, что я могу использовать блоки памяти для матриц, выделенных с помощью функции cudamalloc() или cublasalloc() для вызова функций cublas. Скорость передачи матриц и вычислительные процессы медленнее для массивов, выделенных с помощью...
2140 просмотров
schedule
11.05.2022
CUBLAS - возможно ли возведение в степень матричных элементов?
Я использую CUBLAS (библиотеки Cuda Blas) для матричных операций.
Можно ли использовать CUBLAS для достижения возведения в степень / среднеквадратичного значения элементов матрицы?
Я имею в виду, имея матрицу 2x2
1 4
9 16
Я хочу, чтобы...
1939 просмотров
schedule
24.05.2023
Простой пример умножения матриц CUBLAS?
Я ищу очень простой пример умножения матрицы костей для CUBLAS, который может умножать M на N и помещать результаты в P для следующего кода, используя высокопроизводительные операции графического процессора:
float M[500][500], N[500][500],...
20696 просмотров
schedule
20.01.2023
приведение типов в CUDA и cuBLAS
Я пишу программу на cuda и пытаюсь уменьшить накладные расходы на передачу данных. Я использую библиотеку cuBLAS для умножения матриц, и мне нужно отправить 30 000 000 чисел, значения которых находятся в диапазоне от 0 до 255.
Прямо сейчас я...
1800 просмотров
schedule
20.03.2022
Безопасно ли устанавливать элементы унифицированного массива в 0 с помощью операций CUBLAS/CUSPARSE?
Когда, например. накапливая результаты различных умножений матрицы-вектора (это то, что вы делаете в BLAS, даже когда есть только один накапливающий элемент), формально начинается с нулевого вектора. Но не существует способа без накладных расходов...
364 просмотров
schedule
16.04.2023
CUDA cublas‹t›gbmv понимание
Недавно я хотел использовать простое умножение матрицы на вектор CUDA. Я нашел подходящую функцию в библиотеке cublas: cublas‹‹>>gbmv. Вот документация
Но на самом деле он очень беден, поэтому мне не удалось понять, что означают параметры kl и...
921 просмотров
schedule
23.04.2022
Сохранение скалярного произведения на GPGPU с помощью процедуры CUBLAS
Я пишу код для вычисления скалярного произведения двух векторов с использованием процедуры скалярного произведения CUBLAS, но он возвращает значение в памяти хоста. Я хочу использовать скалярное произведение для дальнейших вычислений только на GPGPU....
3766 просмотров
schedule
17.04.2022
cusparse csrsvanalysis иногда работает, иногда нет
Я пытаюсь использовать предварительно обусловленный сопряженный градиент для разрешения Ax=b. Поэтому я взял пример с образца, предоставленного cuda-sdk. Иногда, когда я вызываю функцию cusparseScsrsv_analysis , она возвращает ошибку 6, которая...
1050 просмотров
schedule
08.06.2023
Есть ли в cublas-4.1.28 изменение параметров функции?
Я хочу сделать следующее матрично-матричное умножение с помощью cublas:
cA(M by K) * cB(K by N) => cAout(M by N)
Я назначил cA с K в качестве ведущего индекса и cB с N в качестве ведущего индекса. Согласно справочнику cublas-4.0, я...
113 просмотров
schedule
29.12.2022
Матрица, обратная с помощью решателя линейной системы через cublas, cublasCreate exception или что-то еще
Я пытаюсь инвертировать матрицу, используя решатель линейных уравнений через библиотеку cublas CUDA.
Исходное уравнение имеет вид:
Ax = B = I
I - identity matrix
A - The matrix I'm trying to inverse
x - (hopefully) the inverse(A) matrix...
2335 просмотров
schedule
02.07.2023
cublas cublasDgetrfBatched() пакетная факторизация LU не работает с матрицами размером более 32x32
Я написал функцию cuda для Matlab, чтобы выполнить факторизацию LU пакета матриц с использованием cublasDgetrfBatched(). Инструментальная документация по этой функции находится здесь .
Он отлично работает для матриц размером до 32x32. Но это не...
774 просмотров
schedule
21.06.2022
Лучшие практики синхронизации cuBLAS
Я прочитал два сообщения о переполнении стека, а именно функции ядра cubas автоматически синхронизируются с хостом? и CUDA Dynamic параллелизм; потоковую синхронизацию с устройства , и они рекомендуют использовать некоторые API синхронизации,...
2703 просмотров
schedule
14.02.2023
Асинхронность и владение памятью в CUBLAS
CUBLAS - это асинхронная библиотека. Каковы требования к владению памятью для параметров, передаваемых в CUBLAS?
Кажется очевидным, что матрицы, с которыми работает CUBLAS, не следует освобождать до завершения асинхронных вызовов - но как насчет...
188 просмотров
schedule
07.07.2023
Числовая ошибка в простом ядре cuda/cublas с использованием определенного ввода
Я работаю с cuda и cubas, и я пытался реализовать простые операции, такие как матричное поэлементное умножение/деление. Я использую только float для своих экспериментов. Я знаю, что самый очевидный способ сделать это — написать такое ядро:...
157 просмотров
schedule
19.04.2022
Ошибка сегментации тяги Cublas
Я новичок в программировании на CUDA. Я работал над примером кода, который умножает матрицу на вектор и печатает результаты. Я использую API Cublas Dgemv для выполнения умножения. При запуске программы с помощью cuda-memcheck я получаю следующую...
400 просмотров
schedule
26.07.2022
Инверсия матрицы CUDA по ссылке на CUDA-указатель
В настоящее время я просто пытаюсь реализовать простой алгоритм линейной регрессии в матричной форме на основе cuBLAS с CUDA. Умножение и транспонирование матриц хорошо работает с функцией cublasSgemm .
Проблемы начинаются с инверсии матриц на...
494 просмотров
schedule
22.01.2023
CUDA: сложное матричное умножение
Я решаю большое количество линейных уравнений с комплексными числами, и мне нужно обновить свой решатель с помощью CUDA. Я хотел использовать cublas , поэтому я использовал cuComplex , но я не хочу, чтобы предварительная или постобработка зависела...
476 просмотров
schedule
30.12.2022
Использование cublasStbsv в ядре CUDA
Я пытаюсь решить уравнение с функцией cublasStbsv в своем ядре CUDA. Код ядра выглядит следующим образом:
__global__ void invokeDeviceCublasSgemm(cublasStatus_t *returnValue,
int n,...
362 просмотров
schedule
06.09.2023
сообщение device-function-maxrregcount при компиляции кода cuda
Я пытаюсь написать код, который выполняет множественное скалярное произведение внутри ядра. Я использую функцию cublasSdot из библиотеки cublas для выполнения скалярного произведения векторов. Это мой код:
using namespace std;
__global__...
790 просмотров
schedule
26.08.2022
Не удалось создать дескриптор CUBLAS. Взаимодействие Tensorflow с OpenCV
Я пытаюсь использовать PlayStation Eye Camera для проекта глубокого обучения с подкреплением. Сеть, установка TensorFlow (0.11) и CUDA (8.0) работают, потому что мне удалось обучить сеть на симуляции.
Теперь, когда я пытаюсь прочитать изображения...
10656 просмотров
schedule
29.06.2023