Я получаю следующее предупреждение при запуске задания PySpark:
10.17.06 18:27:16 ПРЕДУПРЕЖДЕНИЕ ARPACK: не удалось загрузить реализацию из: com.github.fommil.netlib.NativeSystemARPACK
10.17.06 18:27:16 ПРЕДУПРЕЖДЕНИЕ ARPACK: не удалось загрузить реализацию из: com.github.fommil.netlib.NativeRefARPACK
Мой код
mat = RowMatrix(tf_rdd_vec.cache())
svd = mat.computeSVD(num_topics, computeU=False)
Я использую экземпляр Ubuntu 16.04 EC2. И я установил все следующие библиотеки в свою систему.
sudo apt install libarpack2 Arpack++ libatlas-base-dev liblapacke-dev libblas-dev gfortran libblas-dev liblapack-dev libnetlib-java libgfortran3 libatlas3-base libopenblas-base
Я настроил LD_LIBRARY_PATH, чтобы он указывал на путь к общей библиотеке, как показано ниже.
export LD_LIBRARY_PATH=/usr/lib/
Теперь, когда я указываю каталог $LD_LIBRARY_PATH, он показывает мне следующие файлы .so
ubuntu:~$ ls $LD_LIBRARY_PATH/*.so | grep "pack\|blas"
/usr/lib/libarpack.so
/usr/lib/libblas.so
/usr/lib/libcblas.so
/usr/lib/libf77blas.so
/usr/lib/liblapack_atlas.so
/usr/lib/liblapacke.so
/usr/lib/liblapack.so
/usr/lib/libopenblasp-r0.2.18.so
/usr/lib/libopenblas.so
/usr/lib/libparpack.so
Но все же я не могу использовать реализацию Native ARPACK. Также я кэширую RDD, переходящий в матрицу, но он все равно выдает кэш-предупреждение. Любое предложение, как решить эти 3 предупреждения?
Я скачал скомпилированную версию spark-2.2.0 со страницы загрузки spark.
/*usr*/lib/libarpack.so
vsexport LD_LIBRARY_PATH=/*var*/lib/
-- Вероятно, это просто ошибка в вашем описании. - person Rick Moritz   schedule 13.10.2017