построить тензорный поток для Intel Xeon Gold 6148

У меня есть сервер с двумя Intel xeon gold 6148 и tenorflow, работающими на нем. Когда я устанавливаю tf с помощью pip, я получаю сообщение о том, что AVX2 и AVX512 не используются в моей установке. Итак, чтобы добиться максимальной производительности, я попытался собрать tf из исходного кода с помощью docker. Я сделал это после https://www.tensorflow.org/install/source, но для Я использовал команду сборки bazel:

bazel build --config=mkl -c opt --copt=-mavx --copt=-mavx2 --copt=-mfma --copt=-mavx512f --copt=-mavx512pf --copt=-mavx512cd --copt=-mavx512er //tensorflow/tools/pip_package:build_pip_package

следующие https://software.intel.com/en-us/articles/intel-optimization-for-tensorflow-installation-guide.
Но эта установка работает намного хуже, чем стандартная установка pip.

Итак, подведем итог: как лучше всего установить tensorflow и архитектуру xeon gold?


person Daniel Lang    schedule 28.11.2018    source источник
comment
Только KNL (Xeon Phi) имеет -mavx512er, а не основные процессоры Xeon. В идеале используйте -march=native (за исключением того, что сценарии сборки, похоже, искажают параметры компилятора, содержащие =).   -  person Peter Cordes    schedule 30.03.2019
comment
@ChileAddict: пожалуйста, не удаляйте ключевой общий тег, например tensorflow. Люди, выполняющие поиск по этому тегу, по-прежнему хотят, чтобы этот вопрос возник, даже если они не знали, что делать ([tensorflow] OR [intel-tensorflow])   -  person Peter Cordes    schedule 19.11.2019


Ответы (1)


Попробуйте использовать колесо тензорного потока с веб-сайта Intel.

Выполните следующие шаги, чтобы создать собственную среду conda и установить колесо.

1) conda create -n ENV_NAME -c intel python = 3.6 pip numpy

2) источник активировать ENV_NAME

3) pip install https://storage.googleapis.com/intel-optimized-tensorflow/tensorflow-1.11.0-cp36-cp36m-linux_x86_64.whl.

Надеюсь это поможет.

person Aswathy - Intel    schedule 05.12.2018
comment
Оказалось, что проблема в том, что значения для inter_op_parallelism_threads и intra_op_parallelism_threads на сайте tenorflow [tensorflow.org/ руководство / производительность / обзор] просто не работают. Но когда я использую что-то вроде intra = 10 и inter = 1, он отлично работает для установки сборки. - person Daniel Lang; 06.12.2018