ошибка построения тензорного потока с поддержкой cuda в Windows с помощью bazel

Я пытаюсь скомпилировать TensorFlow с поддержкой CUDA в Windows 10 64bit через bazel. Вот как устроена моя система:

  • Windows 10 64-битная
  • Nvidia GeForce 1050 с возможностями CUDA 6.1
  • CUDA Toolkit v8.0 -> C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0
  • cuDNN v6.0 -> C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0
  • bazel 0.7.0 (переименован в bazel.exe) -> C:\Users\eliam\bazel\0.7.0
  • MSYS2 64 бит
  • Основная ветка TensorFlow -> C:\Users\eliam\tensorflow

Я также уже установил эти переменные среды:

BAZEL_PYTHON=C:/Users/eliam/Miniconda3
BAZEL_SH=C:/msys64/usr/bin/bash.exe
BAZEL_VC=C:/Program Files (x86)/Microsoft Visual Studio/2017/BuildTools/VC
BAZEL_VS=C:/Program Files (x86)/Microsoft Visual Studio 14.0
CUDA_PATH=C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v8.0
CUDA_TOOLKIT_PATH=C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v8.0
LD_LIBRARY_PATH=C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v8.0/lib/x64
PYTHON_BIN_PATH=C:/Users/eliam/Miniconda3/python.exe
PYTHON_PATH=C:/Users/eliam/Miniconda3/python.exe
PYTHONPATH=C:/Users/eliam/Miniconda3/python.exe
PYTHON_LIB_PATH=C:/Users/eliam/Miniconda3/lib/site-packages
PATH=C:\Users\eliam\bazel\0.7.0;C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0;C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin;C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\lib\x64;C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\include;%PATH%

Bazel настроен со всеми шагами, необходимыми для его веб-сайта (https://docs.bazel.build/versions/master/install-windows.html).

MSYS2 настроен со всеми шагами, необходимыми для его веб-сайта (http://www.msys2.org/ )

Мне удалось завершить configure.py без проблем.

python ./configure.py
You have bazel 0.7.0 installed.
Do you wish to build TensorFlow with XLA JIT support? [y/N]:
No XLA JIT support will be enabled for TensorFlow.

Do you wish to build TensorFlow with GDR support? [y/N]:
No GDR support will be enabled for TensorFlow.

Do you wish to build TensorFlow with VERBS support? [y/N]:
No VERBS support will be enabled for TensorFlow.

Do you wish to build TensorFlow with CUDA support? [y/N]: y
CUDA support will be enabled for TensorFlow.

Please specify the CUDA SDK version you want to use, e.g. 7.0. [Leave empty to default to CUDA 8.0]:


Please specify the cuDNN version you want to use. [Leave empty to default to cuDNN 6.0]:


Please specify the location where cuDNN 6 library is installed. Refer to README.md for more details. [Default is C:/Program Files/NVIDIA                 GPU Computing Toolkit/CUDA/v8.0]:


Please specify a list of comma-separated Cuda compute capabilities you want to build with.
You can find the compute capability of your device at: https://developer.nvidia.com/cuda-gpus.
Please note that each additional compute capability significantly increases your build time and binary size. [Default is: 3.5,5.2]


Do you wish to build TensorFlow with MPI support? [y/N]:
No MPI support will be enabled for TensorFlow.

Please specify optimization flags to use during compilation when bazel option "--config=opt" is specified [Default is -march=native]:


Add "--config=mkl" to your bazel command to build with MKL support.
Please note that MKL on MacOS or windows is still not supported.
If you would like to use a local MKL instead of downloading, please set the environment variable "TF_MKL_ROOT" every time before build.
Configuration finished

После этого я установил некоторые другие переменные среды с помощью следующей команды:

set BUILD_OPTS='--cpu=x64_windows_msvc --host_cpu=x64_windows_msvc --copt=/w --verbose_failures --experimental_ui --config=cuda'

Чтобы предотвратить эту ошибку

$ bazel build -c opt --config=cuda --verbose_failures --subcommands //tensorflow/cc:tutorials_example_trainer
..............
WARNING: The lower priority option '-c opt' does not override the previous value '-c opt'.
____Loading package: tensorflow/cc
____Loading package: @local_config_cuda//crosstool
____Loading package: @local_config_xcode//
ERROR: No toolchain found for cpu 'x64_windows'. Valid cpus are: [
  k8,
  piii,
  arm,
  darwin,
  ppc,
].
____Elapsed time: 10.196s

Затем я запускаю сборку bazel, используя следующую команду

bazel build -c opt $BUILD_OPTS //tensorflow/tools/pip_package:build_pip_package

Здесь начинаются проблемы. Это ссылка на полный журнал.

Есть идеи, почему?


person ParKein    schedule 19.10.2017    source источник
comment
--cpu=x64_windows_msvc и ERROR: No toolchain found for cpu 'x64_windows' кажутся мне довольно понятными   -  person talonmies    schedule 19.10.2017
comment
Как я уже сказал в своем сообщении, эта ошибка была решена с помощью set BUILD_OPTS='--cpu=x64_windows_msvc --host_cpu=x64_windows_msvc --copt=/w --verbose_failures --experimental_ui --config=cuda. Ошибка, я не понимаю, почему происходит, это последняя строка сообщения (есть ссылка на весь журнал)   -  person ParKein    schedule 20.10.2017
comment
@talonmies не могли бы вы объяснить, что вы имеете в виду?   -  person ParKein    schedule 23.10.2017


Ответы (1)


Важная часть журнала такова:

ERROR: C:/msys64/home/eliam/tensorflow/tensorflow/stream_executor/BUILD:52:1: C++ compilation of rule '//tensorflow/stream_executor:cuda_platform' failed (Exit 2).
tensorflow/stream_executor/cuda/cuda_platform.cc(48): error C3861: 'strcasecmp': identifier not found
tensorflow/stream_executor/cuda/cuda_platform.cc(50): error C3861: 'strcasecmp': identifier not found
tensorflow/stream_executor/cuda/cuda_platform.cc(52): error C3861: 'strcasecmp': identifier not found
Target //tensorflow/cc:tutorials_example_trainer failed to build

48) содержит strcmp.

Компилятор жалуется на strcasecmp, поэтому что-то должно быть #define от strcmp к strcasecmp. В любом случае, не могли бы вы запустить сборку с --verbose_failures? Это покажет команду, которую выполнял Базель. Это может намекнуть на то, что происходит.

Кроме того, я вижу это в ваших envvars:

BAZEL_VC=C:/Program Files (x86)/Microsoft Visual Studio/2017/BuildTools/VC
BAZEL_VS=C:/Program Files (x86)/Microsoft Visual Studio 14.0

Вам нужно установить только одно из них. Я рекомендую оставить BAZEL_VC, поскольку это указывает на более новый компилятор. Признаюсь, я не знаю, что происходит, когда определены оба envvars, предпочитает ли Bazel одно другому. Но я знаю, что он отлично работает только с одним из них.

person László    schedule 23.10.2017