Автономный кластер Spark 1.5.1 — неправильная конфигурация удаленного взаимодействия Akka?

Делая первые шаги со Spark, я столкнулся с проблемами отправки заданий в кластер из кода приложения. Копаясь в журналах, я заметил периодические сообщения WARN в главном журнале:

15/10/08 13:00:00 WARN remote.ReliableDeliverySupervisor: Association with remote system [akka.tcp://[email protected]:64014] has failed, address is now gated for [5000] ms. Reason: [Disassociated]

Проблема в том, что IP-адрес не существует в нашей сети и нигде не был настроен. Тот же неверный IP-адрес отображается в журнале рабочего процесса, когда он пытается выполнить задачу (неверный IP-адрес передается в --driver-url):

15/10/08 12:58:21 INFO worker.ExecutorRunner: Launch command: "/usr/java/latest//bin/java" "-cp" "/path/spark/spark-1.5.1-bin-ha
doop2.6/sbin/../conf/:/path/spark/spark-1.5.1-bin-hadoop2.6/lib/spark-assembly-1.5.1-hadoop2.6.0.jar:/path/spark/
spark-1.5.1-bin-hadoop2.6/lib/datanucleus-api-jdo-3.2.6.jar:/path/spark/spark-1.5.1-bin-hadoop2.6/lib/datanucleus-rdbms-3.2.9.ja
r:/path/spark/spark-1.5.1-bin-hadoop2.6/lib/datanucleus-core-3.2.10.jar:/path/hadoop/2.6.0//etc/hadoop/" "-Xms102
4M" "-Xmx1024M" "-Dspark.driver.port=64014" "-Dspark.driver.port=53411" "org.apache.spark.executor.CoarseGrainedExecutorBackend" "--driver-url"
"akka.tcp://[email protected]:64014/user/CoarseGrainedScheduler" "--executor-id" "39" "--hostname" "192.168.10.214" "--cores" "16" "--app-id"  "app-20151008123702-0003" "--worker-url" "akka.tcp://[email protected]:37625/user/Worker"
15/10/08 12:59:28 INFO worker.Worker: Executor app-20151008123702-0003/39 finished with state EXITED message Command exited with code 1 exitStatus 1

Любая идея, что я сделал неправильно и как это можно исправить?

Версия Java — 1.8.0_20, и я использую готовые двоичные файлы Spark.

Спасибо!


person Seffy    schedule 08.10.2015    source источник


Ответы (1)


Возможно, это даст вам некоторые подсказки здесь, в мой ответ на аналогичный вопрос, который похож на ваш вопрос "Ошибка связи с удаленной системой"

person keypoint    schedule 08.10.2015