Я загрузил данные в Druid из Hive и не использовал столбцы HLL.
Когда я запускаю COUNT(DISTINCT mycol)
запрос в Druid, я не получаю точных подсчетов. Счетчики кажутся близкими, но не совпадают с тем, что у меня есть в Hive.
Почему Druid может не вести точный подсчет, даже если я ничего не упомянул о HLL? В качестве альтернативы, есть ли способ получить точное количество различий в Druid?
Нашел старую публикацию 2014 года по той же проблеме https://groups.google.com/forum/#!topic/druid-development/AMSOVGx5PhQ, я не уверен, поддерживает ли текущая версия Druid точное количество различий.