Стратегии отказоустойчивости Zooker

Мы молодая команда, создающая приложение с использованием Storm и Kafka. У нас есть общий ансамбль Zookeeper из 3 узлов, который используется как Storm, так и Kafka.

Я написал тестовый пример для проверки отказоустойчивости zooker

1) Убедитесь, что все три узла работают, и убедитесь, что один из них выбран в качестве лидера.

2) Используя unix-клиент Zookeeper, создайте znode и установите значение. Убедитесь, что значения отражаются на других узлах.

3) Измените файл znode. установите значение в одном узле и убедитесь, что изменение отражено на других узлах.

4) Убейте один из рабочих узлов и убедитесь, что главный / лидер уведомлен о сбое.

5) Убейте ведущий узел. Убедитесь, что из двух других узлов один выбран в качестве лидера.

Мне нужно добавить еще тестовый пример? дополнительные идеи / предложения / указатели добавить?


person james007    schedule 08.09.2014    source источник
comment
У вас есть конкретная проблема? На ваш вопрос прямо сейчас нельзя дать однозначного ответа, поэтому вы можете не получить ответ, который ищете.   -  person Kit Menke    schedule 08.09.2014
comment
Также это zooker сокращение от zookeeper ????   -  person Kit Menke    schedule 08.09.2014


Ответы (1)


Из документации
Проверка автоматического переключения при отказе

После настройки автоматического аварийного переключения следует протестировать его работу. Для этого сначала найдите активный NameNode. Вы можете определить, какой узел активен, посетив веб-интерфейсы NameNode - каждый узел сообщает о своем состоянии HA вверху страницы.

Как только вы найдете свой активный NameNode, вы можете вызвать сбой на этот узел. Например, вы можете использовать kill -9 для имитации сбоя JVM. Или вы можете выключить и снова включить машину или отключить его сетевой интерфейс, чтобы смоделировать другой вид сбоя. После запуска отключения, которое вы хотите протестировать, другой NameNode должен автоматически стать активным в течение нескольких секунд. Время, необходимое для обнаружения сбоя и переключения при отказе, зависит от конфигурации ha.zookeeper.session-timeout.ms, но по умолчанию составляет 5 секунд.

Если тест не прошел успешно , возможно, у вас неправильная конфигурация. Проверьте журналы для демонов zkfc, а также для демонов NameNode для дальнейшей диагностики проблемы.

подробнее о настройке автоматического переключения при отказе < / а>

person user2720864    schedule 10.09.2014