Не удалось создать кластер Azure Databricks из-за недоступных экземпляров

Я пытаюсь создать кластер в Azure Databricks и получаю сообщение об ошибке

Resources were not reachable via SSH. If the problem persists, this usually indicates a network environment misconfiguration. Please check your cloud provider configuration, and make sure that Databricks control plane can reach Spark clusters instances.

У меня такая конфигурация по умолчанию:

Кластерный режим: Standard

Бассейн: None

Версия среды выполнения: 5.5 LTS

Автомасштабирование включено

Тип работника: Standard_DS3_v2

Тип драйвера: Standard_DS3_v2

Из Logs Analytics я вижу, что Azure пыталась создать виртуальные машины, и без какой-либо причины (я полагаю, потому что они были недоступны) пришлось удалить их все.

Кто-нибудь сталкивался с такой проблемой?


person deeptowncitizen    schedule 23.10.2019    source источник


Ответы (2)


Если проблема носит временный характер, это может быть вызвано отказом драйвера виртуальной машины или сетевой проблемой, поскольку Azure Databricks смог запустить кластер, но потерял соединение с экземпляром, на котором размещен драйвер Spark, ссылаясь на это. Вы можете попробовать удалить его и снова создать кластер.

Если проблема не исчезнет, ​​это может произойти, если у вас есть Рабочее пространство Azure Databricks развернуто в вашей собственной виртуальной сети. Если виртуальная сеть, в которой развернута рабочая область, уже является пиринговой или имеет подключение ExpressRoute к локальным ресурсам, виртуальная сеть не может установить ssh подключение к узлу кластера, когда Azure Databricks пытается создать кластер. Вы можете добавить определяемый пользователем маршрут (UDR), чтобы предоставить плоскости управления Azure Databricks ssh доступ к экземплярам кластера.

Подробные инструкции UDR см. На странице Шаг 3. Создайте определяемые пользователем маршруты и свяжите их с подсетями виртуальной сети Azure Databricks. Дополнительные сведения об устранении неполадок, связанных с виртуальной сетью, см. В разделе Устранение неполадок

Надеюсь, это может вам помочь.

person Nancy Xiong    schedule 24.10.2019

Проблема: экземпляры недоступны: ресурсы не были доступны через SSH.

Возможная причина: трафик от уровня управления к рабочим заблокирован. Если вы выполняете развертывание в существующей виртуальной сети, подключенной к вашей локальной сети, проверьте свою настройку, используя информацию, предоставленную в Подключите рабочую область Azure Databricks к локальной сети.

Ссылка: Azure Databricks - устранение неполадок

Надеюсь это поможет.

person CHEEKATLAPRADEEP-MSFT    schedule 24.10.2019
comment
есть абсолютно такой же экземпляр блоков данных с такой же конфигурацией (я сравнивал экспортированные конфиги JSON), и он работает .. - person deeptowncitizen; 24.10.2019
comment
Привет, @deeptowncitizen! Вы бы опубликовали это как ответ, чтобы вы могли отметить этот вопрос как ответ? - person CHEEKATLAPRADEEP-MSFT; 25.10.2019