Статьи по тематике cublas

Вопросы по теме 'cublas'

Я заметил, что я могу использовать блоки памяти для матриц, выделенных с помощью функции cudamalloc() или cublasalloc() для вызова функций cublas. Скорость передачи матриц и вычислительные процессы медленнее для массивов, выделенных с помощью...

2140 просмотров

memory cuda cublas

11.05.2022

CUBLAS - возможно ли возведение в степень матричных элементов?

Я использую CUBLAS (библиотеки Cuda Blas) для матричных операций. Можно ли использовать CUBLAS для достижения возведения в степень / среднеквадратичного значения элементов матрицы? Я имею в виду, имея матрицу 2x2 1 4 9 16 Я хочу, чтобы...

1939 просмотров

matrix cuda cublas

24.05.2023

Простой пример умножения матриц CUBLAS?

Я ищу очень простой пример умножения матрицы костей для CUBLAS, который может умножать M на N и помещать результаты в P для следующего кода, используя высокопроизводительные операции графического процессора: float M[500][500], N[500][500],...

20696 просмотров

gpu cuda matrix-multiplication cublas

20.01.2023

приведение типов в CUDA и cuBLAS

Я пишу программу на cuda и пытаюсь уменьшить накладные расходы на передачу данных. Я использую библиотеку cuBLAS для умножения матриц, и мне нужно отправить 30 000 000 чисел, значения которых находятся в диапазоне от 0 до 255. Прямо сейчас я...

1800 просмотров

casting cuda cublas

20.03.2022

Безопасно ли устанавливать элементы унифицированного массива в 0 с помощью операций CUBLAS/CUSPARSE?

Когда, например. накапливая результаты различных умножений матрицы-вектора (это то, что вы делаете в BLAS, даже когда есть только один накапливающий элемент), формально начинается с нулевого вектора. Но не существует способа без накладных расходов...

364 просмотров

c initialization cuda cublas blas

16.04.2023

CUDA cublas‹t›gbmv понимание

Недавно я хотел использовать простое умножение матрицы на вектор CUDA. Я нашел подходящую функцию в библиотеке cublas: cublas‹‹>>gbmv. Вот документация Но на самом деле он очень беден, поэтому мне не удалось понять, что означают параметры kl и...

921 просмотров

cuda cublas

23.04.2022

Сохранение скалярного произведения на GPGPU с помощью процедуры CUBLAS

Я пишу код для вычисления скалярного произведения двух векторов с использованием процедуры скалярного произведения CUBLAS, но он возвращает значение в памяти хоста. Я хочу использовать скалярное произведение для дальнейших вычислений только на GPGPU....

3766 просмотров

cuda dot-product cublas gpgpu

17.04.2022

cusparse csrsvanalysis иногда работает, иногда нет

Я пытаюсь использовать предварительно обусловленный сопряженный градиент для разрешения Ax=b. Поэтому я взял пример с образца, предоставленного cuda-sdk. Иногда, когда я вызываю функцию cusparseScsrsv_analysis , она возвращает ошибку 6, которая...

1050 просмотров

cuda cublas

08.06.2023

Есть ли в cublas-4.1.28 изменение параметров функции?

Я хочу сделать следующее матрично-матричное умножение с помощью cublas: cA(M by K) * cB(K by N) => cAout(M by N) Я назначил cA с K в качестве ведущего индекса и cB с N в качестве ведущего индекса. Согласно справочнику cublas-4.0, я...

113 просмотров

cuda cublas

29.12.2022

Матрица, обратная с помощью решателя линейной системы через cublas, cublasCreate exception или что-то еще

Я пытаюсь инвертировать матрицу, используя решатель линейных уравнений через библиотеку cublas CUDA. Исходное уравнение имеет вид: Ax = B = I I - identity matrix A - The matrix I'm trying to inverse x - (hopefully) the inverse(A) matrix...

2335 просмотров

gpu algorithm cuda linear-equation cublas

02.07.2023

cublas cublasDgetrfBatched() пакетная факторизация LU не работает с матрицами размером более 32x32

Я написал функцию cuda для Matlab, чтобы выполнить факторизацию LU пакета матриц с использованием cublasDgetrfBatched(). Инструментальная документация по этой функции находится здесь . Он отлично работает для матриц размером до 32x32. Но это не...

774 просмотров

matlab matrix cuda cublas

21.06.2022

Лучшие практики синхронизации cuBLAS

Я прочитал два сообщения о переполнении стека, а именно функции ядра cubas автоматически синхронизируются с хостом? и CUDA Dynamic параллелизм; потоковую синхронизацию с устройства , и они рекомендуют использовать некоторые API синхронизации,...

2703 просмотров

c cuda cublas

14.02.2023

Асинхронность и владение памятью в CUBLAS

CUBLAS - это асинхронная библиотека. Каковы требования к владению памятью для параметров, передаваемых в CUBLAS? Кажется очевидным, что матрицы, с которыми работает CUBLAS, не следует освобождать до завершения асинхронных вызовов - но как насчет...

188 просмотров

cuda cublas

07.07.2023

Числовая ошибка в простом ядре cuda/cublas с использованием определенного ввода

Я работаю с cuda и cubas, и я пытался реализовать простые операции, такие как матричное поэлементное умножение/деление. Я использую только float для своих экспериментов. Я знаю, что самый очевидный способ сделать это — написать такое ядро:...

157 просмотров

c++ cuda numerical-analysis cublas

19.04.2022

Ошибка сегментации тяги Cublas

Я новичок в программировании на CUDA. Я работал над примером кода, который умножает матрицу на вектор и печатает результаты. Я использую API Cublas Dgemv для выполнения умножения. При запуске программы с помощью cuda-memcheck я получаю следующую...

400 просмотров

cuda segmentation-fault thrust cublas

26.07.2022

Инверсия матрицы CUDA по ссылке на CUDA-указатель

В настоящее время я просто пытаюсь реализовать простой алгоритм линейной регрессии в матричной форме на основе cuBLAS с CUDA. Умножение и транспонирование матриц хорошо работает с функцией cublasSgemm . Проблемы начинаются с инверсии матриц на...

494 просмотров

c++ cuda cublas

22.01.2023

CUDA: сложное матричное умножение

Я решаю большое количество линейных уравнений с комплексными числами, и мне нужно обновить свой решатель с помощью CUDA. Я хотел использовать cublas , поэтому я использовал cuComplex , но я не хочу, чтобы предварительная или постобработка зависела...

476 просмотров

cuda cublas

30.12.2022

Использование cublasStbsv в ядре CUDA

Я пытаюсь решить уравнение с функцией cublasStbsv в своем ядре CUDA. Код ядра выглядит следующим образом: __global__ void invokeDeviceCublasSgemm(cublasStatus_t *returnValue, int n,...

362 просмотров

cuda cublas

06.09.2023

сообщение device-function-maxrregcount при компиляции кода cuda

Я пытаюсь написать код, который выполняет множественное скалярное произведение внутри ядра. Я использую функцию cublasSdot из библиотеки cublas для выполнения скалярного произведения векторов. Это мой код: using namespace std; __global__...

790 просмотров

cuda cublas dynamic-parallelism

26.08.2022

Не удалось создать дескриптор CUBLAS. Взаимодействие Tensorflow с OpenCV

Я пытаюсь использовать PlayStation Eye Camera для проекта глубокого обучения с подкреплением. Сеть, установка TensorFlow (0.11) и CUDA (8.0) работают, потому что мне удалось обучить сеть на симуляции. Теперь, когда я пытаюсь прочитать изображения...

10656 просмотров

python opencv tensorflow cublas

29.06.2023

Вопросы по теме 'cublas'

Похожие вопросы