У меня есть кластер ES с несколькими индексами, которые получают обновления через случайные промежутки времени. У меня есть экземпляр logstash, извлекающий данные из ES и передающий их в Kafka.
Что было бы хорошим способом запускать это каждую минуту и получать любые обновления в ES?
Конф:
input {
elasticsearch {
hosts => [ "hostname1.com:5432", "hostname2.com" ]
index => "myindex-*"
query => "*"
size => 10000
scroll => "5m"
}
}
output {
kafka {
bootstrap-servers => "abc-kafka.com:1234"
topic_id => "my.topic.test"
}
}
Я хотел бы использовать документы @timestamp в запросе и сохранить его во временном файле, затем повторно запустить запрос (с расписанием) и получить последние обновления/вставить (что-то вроде того, что плагин jdbc-input поддерживает logstash)
Любые идеи?
заранее спасибо