Какие приемы использует процессор для оптимизации кода?

Я ищу такие вещи, как изменение порядка кода, которые могут даже сломать код в случае нескольких процессоров.

processor optimization language-agnostic

yesraaj 07.11.2008 источник

comment

Не могли бы вы обновить, чтобы сформулировать это в форме вопроса? - Mitch Wheat 07.11.2008

comment

Вы имеете в виду компилятор? Потому что вы получите совершенно разные ответы... - Bill the Lizard 07.11.2008

comment

Какой компилятор? Какая платформа? - Mitch Wheat 07.11.2008

comment

Вы имеете в виду такие вещи, как выполнение не по порядку в конвейере процессора? Эти виды оптимизации очень тщательно управляются с помощью обнаружения зависимостей и т. д., чтобы гарантировать, что они остаются согласованными. - workmad3 07.11.2008

comment

Процессор не оптимизирует код в обычном смысле, он может оптимизировать выполнение той небольшой части инструкций, которую он видит... Он не помнит, что он что-то делал с кодом. Любая книга по компьютерной архитектуре описывает некоторые из них. - Uri 07.11.2008

Ответы (4)

arrow_upward
0
arrow_downward

В Википедии есть довольно полный список методов оптимизации здесь.

Robert Gamble 07.11.2008

comment

+0: это отвечает на то, как компиляторы оптимизируют код, а не на то, как это делают процессоры. - Thomas Eding; 01.11.2011

arrow_upward
13
arrow_downward

Наиболее важным из них будет переупорядочение доступа к памяти.

В отсутствие ограждений памяти или инструкций по сериализации процессор может свободно переупорядочивать доступ к памяти. Некоторые процессорные архитектуры имеют ограничения на то, насколько они могут переупорядочиваться; Альфа известна тем, что является самой слабой (то есть той, которая может переупорядочивать больше всего).

Очень хорошее рассмотрение этой темы можно найти в исходной документации ядра Linux по адресу Documentation/memory-barriers.txt.

В большинстве случаев лучше всего использовать блокирующие примитивы из вашего компилятора или стандартной библиотеки; они хорошо протестированы, должны иметь все необходимые барьеры памяти и, вероятно, достаточно оптимизированы (оптимизация блокирующих примитивов сложна; даже эксперты могут иногда ошибаться).

CesarB 07.11.2008

comment

Связанный вопрос: stackoverflow.com/questions/286629 / - CesarB; 13.11.2008

arrow_upward
0
arrow_downward

Да, но в чем именно заключается ваш вопрос?

Однако, поскольку это интересная тема: приемы, которые используют компиляторы и процессоры для оптимизации кода, не должны ломать код даже при наличии нескольких процессоров при отсутствии в этом коде условий гонки. Это называется гарантией последовательной непротиворечивости: если в вашей программе нет условий гонки и все данные правильно заблокированы перед доступом, код будет вести себя так, как если бы он выполнялся последовательно.

Здесь есть действительно хорошее видео, в котором Херб Саттер говорит об этом:

http://video.google.com/videoplay?docid=-4714369049736584770

Это должен посмотреть каждый :)

DavidK 07.11.2008

arrow_upward
0
arrow_downward

Ответ DavidK правильный, однако также очень важно знать модель памяти для вашего языка/среды выполнения. Даже без условий гонки и с последовательной согласованностью и использованием мьютекса ваш код все равно может сломаться, когда данные кэшируются разными потоками, работающими в разных ядрах процессора. Некоторые языки, например, Java, гарантируют состояние данных между потоками при использовании блокировки мьютекса, но редко бывает достаточно просто гарантировать, что никакие два потока не могут получить доступ к данным одновременно. Вам необходимо правильно использовать мьютекс, чтобы убедиться, что среда выполнения языка синхронизирует состояние данных между двумя потоками. В java это делается путем синхронизации двух потоков на одном и том же объекте.

Вот хорошая страница, объясняющая проблему и то, как она решается в модели памяти javas.

http://gee.cs.oswego.edu/dl/cpj/jmm.html

kasperjj 07.11.2008

Какие приемы использует процессор для оптимизации кода?

Ответы (4)

Похожие вопросы