согласно Википедии (http://en.wikipedia.org/wiki/Loop_tiling) и многим другим источников, мощение цикла — это метод оптимизации цикла, который помогает использовать преимущества кеша (локальности ссылки). Пространство итераций разделено на количество блоков, что позволяет лучше использовать кеш.
Из приведенной выше ссылки может кто-нибудь объяснить, в чем разница для случая 1D (раздел «Обзор»)? На мой взгляд, в обоих случаях будет одинаковое количество промахов кеша.