Вопросы по теме 'openacc'

Использование общей памяти с OpenACC
Я пытаюсь использовать общую память для кэширования вещей с помощью OpenACC. В основном я работаю над умножением матриц, и вот что у меня есть: typedef float ff; // Multiplies two square row-major matrices a and b, puts the result in c. void...
1522 просмотров
schedule 22.03.2022

NVCC 5.0 и OpenACC
Согласно веб-сайту NVIDIA : «Набор инструментов CUDA дополняет и полностью поддерживает программирование с помощью директив OpenACC». Означает ли это, что программы OpenACC (паргма и API) могут быть скомпилированы с помощью nvcc...
2350 просмотров
schedule 02.04.2022

Разница между построением ядер и параллельным построением
Я изучаю много статей и руководство по OpenACC, но до сих пор не понимаю основного различия этих двух конструкций.
2913 просмотров
schedule 11.07.2023

Использование OpenACC поверх OpenCL?
Я новичок в OpenACC, который представляет собой новый стандарт программирования для ускорения графического процессора, а также для ЦП. Насколько мне известно, OpenACC - это язык, который является директивой компилятора, напрямую мы можем ускорить...
8471 просмотров
schedule 10.05.2023

Изменение формы динамического массива с использованием параметров функции
Сегодня я обнаружил это в файле примера, предоставленном мне компанией: void mySgemm( int m, int n, int k, float alpha, float beta, float a[m][n], float b[n][k], float c[m][k], int accelerate ) Вызывается с: a_cpu = malloc(..); b_cpu =...
147 просмотров
schedule 26.05.2023

Как переменная в памяти устройства используется внешней функцией?
В этом коде: #include <iostream> void intfun(int * variable, int value){ #pragma acc parallel present(variable[:1]) num_gangs(1) num_workers(1) { *variable = value; } } int main(){ int var, value = 29; #pragma...
404 просмотров
schedule 12.07.2023

Могут ли компиляторы PGI вывести сгенерированный код Cuda в файл
Я хочу, чтобы сгенерированный код CUDA был сохранен в файле для изучения. Возможно ли это с компиляторами OpenAcc и PGI?
540 просмотров
schedule 01.12.2022

Makefile для ссылки на библиотеку Armadillo с помощью компилятора PGI
Я пытаюсь использовать флаг -U__GNUG__ компилятора PGI в Makefile, пытаясь скомпилировать все файлы .cpp в папке, связываясь с Armadillo (с помощью компилятора g++ код компилируется и запускается). Makefile, который у меня есть составляет:...
276 просмотров
schedule 25.04.2023

При использовании цикла OpenACC каждый поток получает частные копии скаляров?
У меня есть довольно простой фрагмент кода: $acc data copy(a(:),b(:)) $acc kernels $acc loop vector do i=1,1000 x = a(i) b(i) = sqrt(x) enddo $acc end kernels $acc end data И, конечно, я мог бы легко обойтись x , но это пример, и x...
397 просмотров
schedule 13.07.2022

openACC передает список структур
У меня есть программа на C, чтобы определить, перекрываются ли 2 набора полигонов. Пользователь вводит 2 набора полигонов (каждый набор данных содержит несколько тысяч полигонов), и программа видит, какой полигон в наборе 1 перекрывается с каким...
470 просмотров
schedule 18.11.2022

Функция подкачки OpenACCArray
при попытке создать объектно-ориентированную реализацию OpenACC я наткнулся на этот вопрос . Оттуда я взял код, предоставленный @mat-colgrove на GTC15 (код доступен по адресу http://www.pgroup.com/lit/samples/gtc15_S5233.tar ). Поскольку мне...
240 просмотров
schedule 09.04.2022

Изменение переменной цикла (индекса) в OpenACC
У меня есть ситуация, когда мне нужно повторить определенную итерацию цикла несколько раз. Итак, в этой конкретной итерации я уменьшаю индекс на один шаг, чтобы следующее приращение индекса цикла не имело значения. Этот подход, который я должен...
336 просмотров
schedule 01.08.2022

OpenACC против C++: FATAL ERROR: переменная частично присутствует на устройстве
Я пытаюсь перенести какое-то приложение C++ на GPU с помощью OpenACC. Как и следовало ожидать, в коде C++ много инкапсуляции и абстракции. Память выделяется в некотором векторном классе, затем этот класс повторно используется во многих других...
1085 просмотров
schedule 01.08.2022

Отладка ошибки недопустимого адресного пространства
Я создал код C++, использующий OpenACC, и скомпилировал его с помощью компилятора PGI для использования на графическом процессоре Tesla. Компиляция проходит успешно без каких-либо предупреждений. Запускаю программу и получаю две ошибки: call...
363 просмотров
schedule 30.05.2022

сокращение при размещении данных на устройстве
У меня есть простой код реализации nbody. Короче говоря, я убрал лишний код в randomizeBodies() . typedef struct { float x; float y; float z; float w; } Point4; n=16384; Point4 positions [n]; Point4 velocities [n]; Point4...
53 просмотров
schedule 31.05.2023

невозможно использовать cudaMemcpy с openacc
У меня есть следующий код const int GL=100000; Particle particles[GL]; int cp01[2][GL]; #pragma acc declare create(particles,cp01) ... где я звоню с хоста #pragma acc update self(cp01) #pragma acc host_data use_device(particles) {...
101 просмотров
schedule 05.01.2023

cuFFT пакетное и одиночное преобразование
В документации NVIDIA cuda для cuFFT говорится: «Эти пакетные преобразования имеют более высокую производительность, чем одиночные преобразования». nofollow noreferrer">http://docs.nvidia.com/cuda/cufft/index.html#ixzz57haP0Mtz Следуйте за нами:...
85 просмотров
schedule 16.08.2022

включение некоторого флага в openACC, чтобы получать предупреждение только для циклов, которые не допускаются к распараллеливанию
Я помещаю директивы openACC для улучшения существующего последовательного кода. Мне было интересно, есть ли какие-либо флаги компилятора, которые будут вызывать генерацию предупреждений для циклов, для которых компилятор проигнорировал их...
42 просмотров
schedule 26.05.2023

вложенные классы с указателями с openACC
У меня довольно большой код на C ++, мне пришлось интегрировать какой-то новый класс в базовый класс, как показано ниже. class A { int N; B b; double *__restrict__ w; construct(); } A::construct() { w=new...
48 просмотров
schedule 02.06.2023

OpenACC на встроенных видеокартах Intel (Intel Iris Plus Graphics 655)
Я хотел бы узнать, поддерживают ли встроенные видеокарты Intel (например, Intel Iris Plus Graphics 655) директивы OpenACC? Кто-нибудь сможет направить меня к любой соответствующей информации?
444 просмотров
schedule 10.04.2022