Я пытаюсь реализовать встроенный ассемблер (в коде C / C ++), чтобы воспользоваться преимуществами SSE. Я хотел бы копировать и дублировать значения (из регистра XMM или из памяти) в другой регистр XMM. Например, предположим, что у меня есть некоторые значения {1, 2, 3, 4} в памяти. Я хотел бы скопировать эти значения так, чтобы xmm1 был заполнен {1, 1, 1, 1}, xmm2 - {2, 2, 2, 2} и так далее и так далее.
Просматривая справочные руководства Intel, я не нашел инструкции для этого. Мне просто нужно использовать комбинацию повторяющихся MOVSS и поворотов (через PSHUFD?)?