Я хотел бы объявить выравнивание для глобальной переменной устройства в CUDA. В частности, у меня есть строковое объявление, например __device__ char str1 = "some pre-defined string";
В обычном gcc я могу запросить выравнивание у компилятора как __device__ char str1 __attribute__ ((aligned (4))) = "some pre-defined string";
Однако, когда я попробовал это на nvcc, компилятор игнорирует эти запросы. Причина, по которой я хотел бы сделать это, состоит в том, чтобы скопировать эти строки в буфер в моих ядрах, а копирование слов за раз намного быстрее, чем копирование байтов за раз, хотя они требуют, чтобы строка src была выровнена. Может ли кто-нибудь сказать мне, как запросить выравнивание у компилятора nvcc?