Вопросы по теме 'openacc'
Использование общей памяти с OpenACC
Я пытаюсь использовать общую память для кэширования вещей с помощью OpenACC.
В основном я работаю над умножением матриц, и вот что у меня есть:
typedef float ff;
// Multiplies two square row-major matrices a and b, puts the result in c.
void...
1522 просмотров
schedule
22.03.2022
NVCC 5.0 и OpenACC
Согласно веб-сайту NVIDIA :
«Набор инструментов CUDA дополняет и полностью поддерживает программирование с помощью директив OpenACC».
Означает ли это, что программы OpenACC (паргма и API) могут быть скомпилированы с помощью nvcc...
2350 просмотров
schedule
02.04.2022
Разница между построением ядер и параллельным построением
Я изучаю много статей и руководство по OpenACC, но до сих пор не понимаю основного различия этих двух конструкций.
2913 просмотров
schedule
11.07.2023
Использование OpenACC поверх OpenCL?
Я новичок в OpenACC, который представляет собой новый стандарт программирования для ускорения графического процессора, а также для ЦП. Насколько мне известно, OpenACC - это язык, который является директивой компилятора, напрямую мы можем ускорить...
8471 просмотров
schedule
10.05.2023
Изменение формы динамического массива с использованием параметров функции
Сегодня я обнаружил это в файле примера, предоставленном мне компанией:
void mySgemm( int m, int n, int k, float alpha, float beta, float a[m][n], float b[n][k], float c[m][k], int accelerate )
Вызывается с:
a_cpu = malloc(..);
b_cpu =...
147 просмотров
schedule
26.05.2023
Как переменная в памяти устройства используется внешней функцией?
В этом коде:
#include <iostream>
void intfun(int * variable, int value){
#pragma acc parallel present(variable[:1]) num_gangs(1) num_workers(1)
{
*variable = value;
}
}
int main(){
int var, value = 29;
#pragma...
404 просмотров
schedule
12.07.2023
Могут ли компиляторы PGI вывести сгенерированный код Cuda в файл
Я хочу, чтобы сгенерированный код CUDA был сохранен в файле для изучения. Возможно ли это с компиляторами OpenAcc и PGI?
540 просмотров
schedule
01.12.2022
Makefile для ссылки на библиотеку Armadillo с помощью компилятора PGI
Я пытаюсь использовать флаг -U__GNUG__ компилятора PGI в Makefile, пытаясь скомпилировать все файлы .cpp в папке, связываясь с Armadillo (с помощью компилятора g++ код компилируется и запускается). Makefile, который у меня есть составляет:...
276 просмотров
schedule
25.04.2023
При использовании цикла OpenACC каждый поток получает частные копии скаляров?
У меня есть довольно простой фрагмент кода:
$acc data copy(a(:),b(:))
$acc kernels
$acc loop vector
do i=1,1000
x = a(i)
b(i) = sqrt(x)
enddo
$acc end kernels
$acc end data
И, конечно, я мог бы легко обойтись x , но это пример, и x...
397 просмотров
schedule
13.07.2022
openACC передает список структур
У меня есть программа на C, чтобы определить, перекрываются ли 2 набора полигонов. Пользователь вводит 2 набора полигонов (каждый набор данных содержит несколько тысяч полигонов), и программа видит, какой полигон в наборе 1 перекрывается с каким...
470 просмотров
schedule
18.11.2022
Функция подкачки OpenACCArray
при попытке создать объектно-ориентированную реализацию OpenACC я наткнулся на этот вопрос .
Оттуда я взял код, предоставленный @mat-colgrove на GTC15 (код доступен по адресу http://www.pgroup.com/lit/samples/gtc15_S5233.tar ).
Поскольку мне...
240 просмотров
schedule
09.04.2022
Изменение переменной цикла (индекса) в OpenACC
У меня есть ситуация, когда мне нужно повторить определенную итерацию цикла несколько раз. Итак, в этой конкретной итерации я уменьшаю индекс на один шаг, чтобы следующее приращение индекса цикла не имело значения.
Этот подход, который я должен...
336 просмотров
schedule
01.08.2022
OpenACC против C++: FATAL ERROR: переменная частично присутствует на устройстве
Я пытаюсь перенести какое-то приложение C++ на GPU с помощью OpenACC. Как и следовало ожидать, в коде C++ много инкапсуляции и абстракции. Память выделяется в некотором векторном классе, затем этот класс повторно используется во многих других...
1085 просмотров
schedule
01.08.2022
Отладка ошибки недопустимого адресного пространства
Я создал код C++, использующий OpenACC, и скомпилировал его с помощью компилятора PGI для использования на графическом процессоре Tesla.
Компиляция проходит успешно без каких-либо предупреждений.
Запускаю программу и получаю две ошибки:
call...
363 просмотров
schedule
30.05.2022
сокращение при размещении данных на устройстве
У меня есть простой код реализации nbody. Короче говоря, я убрал лишний код в randomizeBodies() .
typedef struct
{
float x;
float y;
float z;
float w;
} Point4;
n=16384;
Point4 positions [n];
Point4 velocities [n];
Point4...
53 просмотров
schedule
31.05.2023
невозможно использовать cudaMemcpy с openacc
У меня есть следующий код
const int GL=100000;
Particle particles[GL];
int cp01[2][GL];
#pragma acc declare create(particles,cp01)
...
где я звоню с хоста
#pragma acc update self(cp01)
#pragma acc host_data use_device(particles)
{...
101 просмотров
schedule
05.01.2023
cuFFT пакетное и одиночное преобразование
В документации NVIDIA cuda для cuFFT говорится: «Эти пакетные преобразования имеют более высокую производительность, чем одиночные преобразования». nofollow noreferrer">http://docs.nvidia.com/cuda/cufft/index.html#ixzz57haP0Mtz Следуйте за нами:...
85 просмотров
schedule
16.08.2022
включение некоторого флага в openACC, чтобы получать предупреждение только для циклов, которые не допускаются к распараллеливанию
Я помещаю директивы openACC для улучшения существующего последовательного кода. Мне было интересно, есть ли какие-либо флаги компилятора, которые будут вызывать генерацию предупреждений для циклов, для которых компилятор проигнорировал их...
42 просмотров
schedule
26.05.2023
вложенные классы с указателями с openACC
У меня довольно большой код на C ++, мне пришлось интегрировать какой-то новый класс в базовый класс, как показано ниже.
class A
{
int N;
B b;
double *__restrict__ w;
construct();
}
A::construct()
{
w=new...
48 просмотров
schedule
02.06.2023
OpenACC на встроенных видеокартах Intel (Intel Iris Plus Graphics 655)
Я хотел бы узнать, поддерживают ли встроенные видеокарты Intel (например, Intel Iris Plus Graphics 655) директивы OpenACC? Кто-нибудь сможет направить меня к любой соответствующей информации?
444 просмотров
schedule
10.04.2022