Вопросы по теме 'impala'
Mysql - нужна помощь с запросом IMPALA
У меня есть одна таблица в кусте table1 . Я использую impala для извлечения данных из таблицы
table1
------
name, amount
где значения таблицы
test1, 10
test1, 15
test1, 30
test2, 30
test2, 40
test2, 50
test3, 30
test3, 40
test3, 50...
221 просмотров
schedule
16.04.2023
Настройка Impala с LDAP
Я использую CDH 4.5. Я установил Impala вручную (без Cloudera Manager). Я настроил LDAP для Impala (используя инструкции на странице...
565 просмотров
schedule
10.04.2023
Как заставить Spark Streaming записывать свой вывод, чтобы Impala могла его прочитать?
У меня есть следующая проблема с Spark Streaming API. В настоящее время я передаю входные данные через Flume в Spark Streaming, с помощью которого я планирую выполнить некоторую предварительную обработку данных. Затем я хотел бы сохранить данные в...
5067 просмотров
schedule
24.04.2023
Многомерный анализ в Hive / Impala
У меня есть денормализованная таблица продаж, которая выглядит так:
SalesKey, SalesOfParts, SalesOfEquipments, CostOfSales в качестве некоторых числовых показателей Отрасль, Страна, Штат, Площадь продаж, Идентификатор оборудования, Идентификатор...
1521 просмотров
schedule
10.03.2022
Как сгруппировать по неделям Cloudera impala
Как сгруппировать результат запроса Impala по неделям? Данные выглядят так:
userguid eventtime
0 66AB1405446C74F2992016E5 2014-08-01T16:43:05Z
1 66AB1405446C74F2992016E5 2014-08-02T20:12:12Z
2 4097483F53AB3C170A490D44...
6626 просмотров
schedule
18.07.2023
Сравнение Hive, Impala, HBASE и SQL для заказа по
Я совершенно новичок в улье, импала, HBASE. Я делаю приложение для полнотекстового поиска. У меня был болезненный шаг сортировки релевантности с использованием порядка в SQL на платформе оракула. Интересно, если я изменю это в экосистеме хаупа, это...
234 просмотров
schedule
18.04.2023
Нужно вручную создать dfs.domain.socket.path в Hadoop-2.0.0, чтобы использовать Impala?
Я следую инструкциям по настройке кластера hadoop-2.0.0 для установки Impala. В hdfs-site.xml я добавляю два свойства «dfs.client.read.shortcircuit» и «dfs.domain.socket.path» (/var/lib/hadoop-hdfs/dn_socket).
Но когда я запускаю кластер Hadoop с...
1931 просмотров
schedule
04.09.2022
Impala - преобразовать существующую таблицу в формат паркета
У меня есть таблица с разделами, и я использую файлы avro или текстовые файлы для создания и вставки в таблицу.
Как только стол будет готов, есть ли способ превратить его в паркет? Я имею в виду, что я знаю, что мы могли бы сказать CREATE TABLE...
9717 просмотров
schedule
05.07.2023
Раздел Hive с подстановочным знаком
Я новичок в разделах.
Предположим, у меня есть следующая таблица
таблица mytable (отметка времени mytime, строка myname)
где столбец mytime выглядит так: год-месяц-день час: мин: сек.мсек (например, 2014-12-05 08: 55: 59.3131)
Я хочу...
1706 просмотров
schedule
24.06.2023
Более быстрые технологии по сравнению с Impala в стеке Hadoop?
Мы использовали Impala более 4 месяцев, и мы обнаружили, что в большинстве случаев она работает очень быстро по сравнению с ульем. Поскольку мы находимся в процессе оценки быстрых фреймворков в Hadoop для обработки данных, мы хотели знать, есть ли...
127 просмотров
schedule
08.05.2023
Удаленные таблицы impala должны отправляться в корзину текущих пользователей, а не в impala.
Как я могу настроить параметры impala так, чтобы удаленные таблицы попадали в /user/$USER/.Trash вместо /user/impala/.Trash ?
767 просмотров
schedule
24.01.2023
Импала Типы данных
Я пытаюсь понять разницу между следующими данными в Impala.
Нить
Чар
Варчар
Будучи схемой при чтении, потребуется 3 разных типа. Мне интересно, есть ли какие-либо преимущества в производительности от использования Char/Varchars по...
1802 просмотров
schedule
20.03.2023
Impala - Пусть Impala выбирает свой собственный лимит памяти
У меня на кластере установлена Cloudera Express 5.3.2. Я хотел бы использовать его для запросов Impala.
Я хочу, чтобы Impala устанавливала ограничение в зависимости от емкости кластера. В конфигурации Impala в диспетчере cloudera написано...
1040 просмотров
schedule
13.04.2022
Как записать результаты запроса в impala в файл CSV с помощью драйвера JDBC
Можно ли с помощью драйвера Impala JDBC записать результаты запроса в файл CSV?
ИЛИ это impala-shell единственный способ добиться этого?
Каковы побочные эффекты безопасности/производительности вызова impala-shell из веб-приложения?
Спасибо.
515 просмотров
schedule
17.12.2023
Оболочка Impala зависает при вызове для пользователей LDAP
Я установил кластер с impala и sentry (CDH 5.2) на CentOS 6.5 с помощью командной строки, а также настроил openLDAP (без TLS). Оба работают без каких-либо проблем независимо друг от друга.
Чтобы настроить кластер Hadoop для openLDAP, я создал...
259 просмотров
schedule
02.07.2023
Арифметическая операция с операторами SELECT в Impala
Я пишу запрос, который должен ГРУППИРОВАТЬ по типу строки и делить значение на общее количество, чтобы узнать% от общего числа в IMPALA. Бывший.:
Name performance
something type1 something 15
something type1...
248 просмотров
schedule
11.09.2022
Почему секционированное соединение (перемешивание) не всегда лучше, чем широковещательное соединение?
Я провел глубокое исследование, но не нашел ничего достаточно подробного. Я прочитал это: 1) http://www.cloudera.com/content/www/en-us/documentation/enterprise/latest/PDF/cloudera-impala.pdf 2)...
1971 просмотров
schedule
10.10.2022
Параметры запроса с драйвером Impala ODBC
Я использую драйвер Impala ODBC, предоставленный Cloudera. Кажется, я не могу правильно использовать параметры запроса. Например:
OdbcCommand command = DbConnection.CreateCommand();
command.CommandText = "INSERT INTO TABLE test VALUES(?, ?)";...
1884 просмотров
schedule
04.09.2022
Использование развивающейся схемы avro для хранилища импала / улья
У нас есть структура JSON, которую нам нужно проанализировать и использовать в импале / улье. Поскольку структура JSON развивается, мы подумали, что можем использовать Avro.
Мы планировали разобрать JSON и отформатировать его как avro.
Данные в...
287 просмотров
schedule
01.08.2022
Почему sqlQuery от RODBC не всегда возвращает одни и те же данные при запросе базы данных Impala?
Я пытаюсь получить некоторые данные из базы данных Impala, используя функцию sqlQuery из пакета RODBC. Результаты, которые я получаю, меняются от одного выполнения запроса к другому выполнению того же самого запроса.
Data.frame, который я получаю,...
552 просмотров
schedule
22.05.2022