У меня есть конвейер развертывания Jenkins, который включает плагин kubernetes. Используя плагин kubernetes, я создаю подчиненный модуль для создания приложения узла с использованием пряжи. Установлены запросы и ограничения для ЦП и памяти.
Когда мастер Jenkins планирует подчиненное устройство, иногда (поскольку на данный момент я не видел шаблона), модуль делает весь узел недоступным и меняет статус узла на «Неизвестный». При внимательном осмотре в Grafana ресурсы ЦП и памяти, кажется, находятся в пределах допустимого диапазона без видимых всплесков. Единственный всплеск, который происходит, связан с дисковым вводом-выводом, который достигает ~ 4 МБ.
Я не уверен, является ли это причиной того, что узел не может обращаться к себе как к члену кластера. Здесь мне может понадобиться помощь в нескольких вещах:
а) Как глубоко диагностировать причины выхода узла из кластера.
б) Если причина в Disk IOPS, есть ли какие-либо запросы по умолчанию, ограничения для IOPS на уровне Kubernetes?
PS: Я использую EBS (gp2)