Удаляет ли Cassandra Cleanup старые данные из существующего кластера

У меня есть кластер cassandra из 5 узлов с 9 ТБ данных, и я планирую добавить в кластер еще 5 узлов. После добавления новых узлов запустится балансировка нагрузки, и поддиапазон ключей разделов будет сопоставлен с новыми узлами. Когда именно я должен выполнить очистку nodetool. Будет ли выполняться очистка nodetool сразу после запуска новых узлов, будут ли удалены старые данные, принадлежащие этому поддиапазону, из старых узлов в кластере.


person venkat sam    schedule 01.10.2014    source источник


Ответы (1)


В документе DataStax Добавление узлов в существующий кластер упоминается это :

  1. Запускайте Cassandra на каждом новом узле. Разрешить две минуты между инициализациями узлов. Вы можете отслеживать процесс запуска и потоковой передачи данных, используя netstats nodetool.

  2. После запуска всех новых узлов запустите очистку nodetool на каждом из ранее существовавших узлов, чтобы удалить ключи, которые больше не принадлежат этим узлам. Дождитесь завершения очистки на одном узле, прежде чем выполнять следующий. Уборку можно безопасно отложить на часы малой активности.

Казалось бы, это указывает на то, что вы должны запустить nodetool cleanup после того, как все новые узлы будут запущены, запущены и полностью загружены. Этот процесс удалит старые данные из поддиапазонов на старых узлах. Как указано, обязательно запускайте nodetool cleanup на каждом старом узле, по одному узлу за раз.

person Aaron    schedule 01.10.2014
comment
У меня есть кластер с объемом данных около 6 ТБ. После запуска новых узлов инициализация завершится через 2 минуты. Если да, балансировка нагрузки 3 ТБ данных может занять больше времени, и если я запустил очистку nodetool во время балансировки нагрузки, он может удалить данные со старых узлов. Итак, как я могу узнать о ходе load_balancing, и когда он закончится, я смогу безопасно выполнить команду очистки nodetool? - person venkat sam; 02.10.2014
comment
@venkatsam Запуск nodetool status должен дать вам представление о статусе / прогрессе балансировки нагрузки. - person Aaron; 19.11.2014