У меня есть кластер cassandra из 5 узлов с 9 ТБ данных, и я планирую добавить в кластер еще 5 узлов. После добавления новых узлов запустится балансировка нагрузки, и поддиапазон ключей разделов будет сопоставлен с новыми узлами. Когда именно я должен выполнить очистку nodetool. Будет ли выполняться очистка nodetool сразу после запуска новых узлов, будут ли удалены старые данные, принадлежащие этому поддиапазону, из старых узлов в кластере.
Удаляет ли Cassandra Cleanup старые данные из существующего кластера
Ответы (1)
В документе DataStax Добавление узлов в существующий кластер упоминается это :
Запускайте Cassandra на каждом новом узле. Разрешить две минуты между инициализациями узлов. Вы можете отслеживать процесс запуска и потоковой передачи данных, используя netstats nodetool.
После запуска всех новых узлов запустите очистку nodetool на каждом из ранее существовавших узлов, чтобы удалить ключи, которые больше не принадлежат этим узлам. Дождитесь завершения очистки на одном узле, прежде чем выполнять следующий. Уборку можно безопасно отложить на часы малой активности.
Казалось бы, это указывает на то, что вы должны запустить nodetool cleanup
после того, как все новые узлы будут запущены, запущены и полностью загружены. Этот процесс удалит старые данные из поддиапазонов на старых узлах. Как указано, обязательно запускайте nodetool cleanup
на каждом старом узле, по одному узлу за раз.
nodetool status
должен дать вам представление о статусе / прогрессе балансировки нагрузки.
- person Aaron; 19.11.2014