Я немного запутался с количеством документов для выбранного индекса в эластичном поиске, ниже приведен фрагмент индекса
GET /_cat/indices/zipkin-span-2020-07-30?v
health status index uuid pri rep docs.count docs.deleted store.size pri.store.size
yellow open zipkin-span-2020-07-30 STcY29kkT3W7Y0XybbfVTQ 1 1 264996 0 88.9mb 88.9mb
Он показывает, что количество документов составляет 264996, тогда как он показывает очень мало записей (МАКС. 20 записей), когда я нажимаю на приведенный ниже запрос.
GET /zipkin-span-2020-07-30/_search
{"took":774,"timed_out":false,"_shards":{"total":1,"successful":1,"skipped":0,"failed":0},
"hits":{"total":{"value":10000,"relation":"gte"},"max_score":1.0,"hits":[{.... records.....}]}}
Примечание. Я также пытался использовать API-интерфейс прокрутки, но все равно показывал тот же результат. Вопрос -
- Связана ли эта проблема с дубликатами записей?
- Учитывает ли этот подсчет также записи реплик?
"hits":{"total":{"value":10000,"relation":"gte"}
говорит, что у вас более 10 000 документов, что подтверждает общее количество, которое_cat
сообщает о 264 996. 10 000 — это максимальное количество обращений по соображениям производительности. Elastic не волнует, идентичны документы или нет, они все равно являются отдельными документами. - person Nate   schedule 31.07.2020