Вопросы по теме 'druid'

Может ли друид заменить хадуп?
Druid используется как для обработки в реальном времени, так и для пакетной обработки. Но может ли он полностью заменить hadoop? Если нет, то почему? В чем преимущество хадупа перед друидом? Я читал, что друид используется вместе с хадупом. Так...
3015 просмотров
schedule 19.12.2022

Как ввод данных в Druid в реальном времени?
У меня есть аналитический сервер (например счетчик кликов). Я хочу отправить данные друиду с помощью некоторого api. Как мне это сделать? Могу ли я использовать его как замену Google Analytics?
2774 просмотров
schedule 24.04.2022

Многозначный размер в строке, разделенной запятыми
У нас есть измерение, которое содержит значение в виде строки с разделителями-запятыми (например, «t1, t2, t3»). Есть ли возможности, при которых мы можем обработать это измерение как многозначное измерение, не сохраняя их в виде массивов JSON?...
666 просмотров
schedule 13.05.2022

Tranquility не отправляет данные в Druid
Я оцениваю Druid для своего варианта использования, который принимает данные csv через спокойствие в режиме реального времени. Ниже приведена конфигурация сервера: { "dataSources" : { "audience" : { "spec" : { "dataSchema" :...
1183 просмотров
schedule 21.04.2023

Запрос Druid не возвращает регистр. Нечувствительные результаты для агрегирования счетчика.
В идеале мне нужно подсчитать, сколько раз слово «Лондон» используется в названии города. Но запрос возвращает разные значения для «london» и «London», «LoNdOn» и так далее. Я пробовал использовать Case Insensitive в качестве опции, но это не дало...
421 просмотров

Druid batch indexing inputSpec гранулярность типа, ошибка при отсутствии входных путей, указанных в задании
Я следую инструкции, написанной здесь: http://druid.io/docs/0.9.2/ingestion/batch-ingestion.html (перейдите к «Спецификация InputSpec», найдите «детализацию»). В моей задаче индексирования JSON есть: "inputSpec": { "type": "granularity",...
747 просмотров

Крюк друида воздушного потока не работает
Я пытаюсь использовать druid hook для загрузки данных из hdfs в druid, ниже мой скрипт dag: from datetime import datetime, timedelta import json from airflow.hooks import HttpHook, DruidHook from airflow.operators import PythonOperator from...
420 просмотров
schedule 13.01.2023

Сброс данных из исторической памяти узлов в глубокое хранилище
Первоначально я установил кластер друидов с двумя историческими узлами по 30 ГБ памяти каждый. 2 узла среднего менеджера, один узел с работающим координатором и повелителем, 1 узел брокера. После успешного запуска в течение 3-4 недель я увидел,...
670 просмотров
schedule 01.01.2023

Точный счетчик в друиде
Я загрузил данные в Druid из Hive и не использовал столбцы HLL. Когда я запускаю COUNT(DISTINCT mycol) запрос в Druid, я не получаю точных подсчетов. Счетчики кажутся близкими, но не совпадают с тем, что у меня есть в Hive. Почему Druid может...
2071 просмотров
schedule 18.07.2022

Не удается запросить данные из источника данных Druid во внешней таблице Hive
Кластер Druid и кластер Hive / Hadoop работают нормально по отдельности. Мы создаем таблицу в Hive, которая считывает данные из Druid (для ETL), однако при начальных тестах мы обнаружили, что не можем сделать из нее простой SELECT * , за которым...
325 просмотров
schedule 03.04.2022

org.apache.druid.java.util.common.ISE: сервер по умолчанию не найден
Я впервые настраиваю друида и столкнулся со следующими проблемами при попытке запустить друида с помощью docker-compose: 2020-04-10T14:40:01,837 ОШИБКА [qtp1667348377-84] org.apache.druid.server.router.QueryHostFinder — катастрофический сбой!...
1390 просмотров
schedule 18.02.2024

Не могу запустить друид
введите здесь описание изображения У меня есть окна с подсистемой linux, и я пытаюсь запустить druid. Я получаю сообщение НЕВОЗМОЖНО СОЗДАТЬ FIFO. Что мне делать, чтобы этого избежать?
91 просмотров
schedule 17.12.2022

DRUID SQL LATEST () и EARLIEST () возвращают ноль
У меня есть этот источник данных в друиде: Я пытаюсь использовать LATEST() , чтобы вернуть последние координаты каждого пользователя, активного в последнюю минуту. Я намерен показать их местоположение в реальном времени, используя...
286 просмотров
schedule 29.12.2022

Как можно настроить Druid в Dataproc?
Теперь, когда Druid стал необязательным компонентом Google Cloud Dataproc ( https://cloud.google.com/dataproc/docs/concepts/components/druid ), мне интересно, как можно выполнить настройку Druid из создания кластера Dataproc? Я пробовал следующую...
102 просмотров
schedule 02.04.2022

Настройка Druid Apache Kafka
Я создал экземпляр AWS EC2 и установил в него druid. Также у нас есть AWS kafka, работающая в EC2. Как я могу передать данные из моей темы кафка в druid?
73 просмотров
schedule 23.02.2022