Делая первые шаги со Spark, я столкнулся с проблемами отправки заданий в кластер из кода приложения. Копаясь в журналах, я заметил периодические сообщения WARN в главном журнале:
15/10/08 13:00:00 WARN remote.ReliableDeliverySupervisor: Association with remote system [akka.tcp://[email protected]:64014] has failed, address is now gated for [5000] ms. Reason: [Disassociated]
Проблема в том, что IP-адрес не существует в нашей сети и нигде не был настроен. Тот же неверный IP-адрес отображается в журнале рабочего процесса, когда он пытается выполнить задачу (неверный IP-адрес передается в --driver-url):
15/10/08 12:58:21 INFO worker.ExecutorRunner: Launch command: "/usr/java/latest//bin/java" "-cp" "/path/spark/spark-1.5.1-bin-ha
doop2.6/sbin/../conf/:/path/spark/spark-1.5.1-bin-hadoop2.6/lib/spark-assembly-1.5.1-hadoop2.6.0.jar:/path/spark/
spark-1.5.1-bin-hadoop2.6/lib/datanucleus-api-jdo-3.2.6.jar:/path/spark/spark-1.5.1-bin-hadoop2.6/lib/datanucleus-rdbms-3.2.9.ja
r:/path/spark/spark-1.5.1-bin-hadoop2.6/lib/datanucleus-core-3.2.10.jar:/path/hadoop/2.6.0//etc/hadoop/" "-Xms102
4M" "-Xmx1024M" "-Dspark.driver.port=64014" "-Dspark.driver.port=53411" "org.apache.spark.executor.CoarseGrainedExecutorBackend" "--driver-url"
"akka.tcp://[email protected]:64014/user/CoarseGrainedScheduler" "--executor-id" "39" "--hostname" "192.168.10.214" "--cores" "16" "--app-id" "app-20151008123702-0003" "--worker-url" "akka.tcp://[email protected]:37625/user/Worker"
15/10/08 12:59:28 INFO worker.Worker: Executor app-20151008123702-0003/39 finished with state EXITED message Command exited with code 1 exitStatus 1
Любая идея, что я сделал неправильно и как это можно исправить?
Версия Java — 1.8.0_20, и я использую готовые двоичные файлы Spark.
Спасибо!