построить тензорный поток для Intel Xeon Gold 6148

У меня есть сервер с двумя Intel xeon gold 6148 и tenorflow, работающими на нем. Когда я устанавливаю tf с помощью pip, я получаю сообщение о том, что AVX2 и AVX512 не используются в моей установке. Итак, чтобы добиться максимальной производительности, я попытался собрать tf из исходного кода с помощью docker. Я сделал это после https://www.tensorflow.org/install/source, но для Я использовал команду сборки bazel:

bazel build --config=mkl -c opt --copt=-mavx --copt=-mavx2 --copt=-mfma --copt=-mavx512f --copt=-mavx512pf --copt=-mavx512cd --copt=-mavx512er //tensorflow/tools/pip_package:build_pip_package

следующие https://software.intel.com/en-us/articles/intel-optimization-for-tensorflow-installation-guide.
Но эта установка работает намного хуже, чем стандартная установка pip.

Итак, подведем итог: как лучше всего установить tensorflow и архитектуру xeon gold?

Daniel Lang 28.11.2018 источник

comment

Только KNL (Xeon Phi) имеет -mavx512er, а не основные процессоры Xeon. В идеале используйте -march=native (за исключением того, что сценарии сборки, похоже, искажают параметры компилятора, содержащие =). - Peter Cordes 30.03.2019

comment

@ChileAddict: пожалуйста, не удаляйте ключевой общий тег, например tensorflow. Люди, выполняющие поиск по этому тегу, по-прежнему хотят, чтобы этот вопрос возник, даже если они не знали, что делать ([tensorflow] OR [intel-tensorflow]) - Peter Cordes 19.11.2019

Ответы (1)

arrow_upward
2
arrow_downward

Попробуйте использовать колесо тензорного потока с веб-сайта Intel.

Выполните следующие шаги, чтобы создать собственную среду conda и установить колесо.

1) conda create -n ENV_NAME -c intel python = 3.6 pip numpy

2) источник активировать ENV_NAME

3) pip install https://storage.googleapis.com/intel-optimized-tensorflow/tensorflow-1.11.0-cp36-cp36m-linux_x86_64.whl.

Надеюсь это поможет.

Aswathy - Intel 05.12.2018

comment

Оказалось, что проблема в том, что значения для inter_op_parallelism_threads и intra_op_parallelism_threads на сайте tenorflow [tensorflow.org/ руководство / производительность / обзор] просто не работают. Но когда я использую что-то вроде intra = 10 и inter = 1, он отлично работает для установки сборки. - Daniel Lang; 06.12.2018

построить тензорный поток для Intel Xeon Gold 6148

Ответы (1)

Похожие вопросы