Уникальные ключи после агрегирования данных в elasticsearch

У меня есть следующие документы в моем индексе.

{"id":"1","Ref":192,"valueId":596,"locationId":45}
{"id":"21","Ref":192,"valueId":596,"locationId":323}
{"id":"31","Ref":192,"valueId":5596,"locationId":5435}
{"id":"41","Ref":192,"valueId":5596,"locationId":535}
{"id":"51","Ref":192,"valueId":5996,"locationId":78}
{"id":"61","Ref":192,"valueId":5996,"locationId":6565}
{"id":"71","Ref":192,"valueId":5196,"locationId":868}
{"id":"81","Ref":192,"valueId":5296,"locationId":68687}
{"id":"91","Ref":192,"valueId":5296,"locationId":6836}
{"id":"101","Ref":192,"valueId":5296,"locationId":96}
{"id":"111","Ref":192,"valueId":5396,"locationId":56}

{"id":"121","Ref":576,"valueId":5396,"locationId":5}
{"id":"131","Ref":576,"valueId":5496,"locationId":8}
{"id":"141","Ref":576,"valueId":5496,"locationId":5356}
{"id":"151","Ref":576,"valueId":5496,"locationId":896}
{"id":"261","Ref":576,"valueId":5896,"locationId":99}
{"id":"271","Ref":576,"valueId":5896,"locationId":8589}
{"id":"671","Ref":576,"valueId":5896,"locationId":999}
{"id":"431","Ref":576,"valueId":5896,"locationId":3565868}
{"id":"241","Ref":576,"valueId":5896,"locationId":9998}

Как построить запрос (агрегации) в эластичном поиске, чтобы он возвращал результат следующим образом

{
    "key" : 192, "Count" : 5,
    "key" : 576, "Count" : 3
}

Count 5 for the key 192 implies number of distinct valueIds for the "Ref"= 192,
Count 3 for the key 576 implies number of distinct valueIds for the "Ref" =576 

Может ли кто-нибудь помочь мне ..?
Мне нужно только через агрегаты.
Спасибо


person Nithin Veer Reddy Kankanti    schedule 27.09.2016    source источник


Ответы (2)


POST test/_search
{
   "size": 0,
   "aggs": {
      "refs": {
         "terms": {
            "field": "Ref"
         },
         "aggs": {
            "valueIdCount": {
               "cardinality": {
                  "field": "valueId"
               }
            }
         }
      }
   }
}

Это должно сработать (хотя JSON не совсем то, что вы ожидали).

  • Во-первых, мы используем обычную агрегацию терминов, чтобы разделить все документы на сегменты.
  • Для каждого сегмента мы используем агрегацию количества элементов, чтобы узнать, сколько различных значений valueId мы находим в каждом сегменте.

Вот результат (оказывается, у нас есть 6 различных идентификаторов значений для ключа 192, а не 5):

{
   [...]
   "aggregations": {
      "refs": {
         "doc_count_error_upper_bound": 0,
         "sum_other_doc_count": 0,
         "buckets": [
            {
               "key": 192,
               "doc_count": 11,
               "valueIdCount": {
                  "value": 6
               }
            },
            {
               "key": 576,
               "doc_count": 9,
               "valueIdCount": {
                  "value": 3
               }
            }
         ]
      }
   }
}
person Uli R    schedule 27.09.2016

POST your_index/_search
{
  "size": 0,
  "aggs": {
    "keys": {
      "terms": {
        "field": "Ref"

      }
    }
  }
}

Вы можете получить больше примеров здесь< /а>

person pkhlop    schedule 27.09.2016