Я ищу очень простой пример умножения матрицы костей для CUBLAS, который может умножать M на N и помещать результаты в P для следующего кода, используя высокопроизводительные операции графического процессора:
float M[500][500], N[500][500], P[500][500];
for(int i = 0; i < Width; i++){
for(int j = 0; j < Width; j++)
{
M[i][j] = 500;
N[i][j] = 500;
P[i][j] = 0;
}
}
До сих пор большая часть кода, который я нахожу для выполнения любого матричного умножения с использованием CUBLAS, (казалось бы?) Слишком сложна.
Я пытаюсь разработать базовую лабораторную работу, в которой учащиеся могут сравнить производительность умножения матриц на графическом процессоре и умножения матриц на процессоре, предположительно с повышенной производительностью на графическом процессоре.