Вопросы по теме 'impala'

Mysql - нужна помощь с запросом IMPALA
У меня есть одна таблица в кусте table1 . Я использую impala для извлечения данных из таблицы table1 ------ name, amount где значения таблицы test1, 10 test1, 15 test1, 30 test2, 30 test2, 40 test2, 50 test3, 30 test3, 40 test3, 50...
221 просмотров
schedule 16.04.2023

Настройка Impala с LDAP
Я использую CDH 4.5. Я установил Impala вручную (без Cloudera Manager). Я настроил LDAP для Impala (используя инструкции на странице...
565 просмотров
schedule 10.04.2023

Как заставить Spark Streaming записывать свой вывод, чтобы Impala могла его прочитать?
У меня есть следующая проблема с Spark Streaming API. В настоящее время я передаю входные данные через Flume в Spark Streaming, с помощью которого я планирую выполнить некоторую предварительную обработку данных. Затем я хотел бы сохранить данные в...
5067 просмотров

Многомерный анализ в Hive / Impala
У меня есть денормализованная таблица продаж, которая выглядит так: SalesKey, SalesOfParts, SalesOfEquipments, CostOfSales в качестве некоторых числовых показателей Отрасль, Страна, Штат, Площадь продаж, Идентификатор оборудования, Идентификатор...
1521 просмотров
schedule 10.03.2022

Как сгруппировать по неделям Cloudera impala
Как сгруппировать результат запроса Impala по неделям? Данные выглядят так: userguid eventtime 0 66AB1405446C74F2992016E5 2014-08-01T16:43:05Z 1 66AB1405446C74F2992016E5 2014-08-02T20:12:12Z 2 4097483F53AB3C170A490D44...
6626 просмотров
schedule 18.07.2023

Сравнение Hive, Impala, HBASE и SQL для заказа по
Я совершенно новичок в улье, импала, HBASE. Я делаю приложение для полнотекстового поиска. У меня был болезненный шаг сортировки релевантности с использованием порядка в SQL на платформе оракула. Интересно, если я изменю это в экосистеме хаупа, это...
234 просмотров
schedule 18.04.2023

Нужно вручную создать dfs.domain.socket.path в Hadoop-2.0.0, чтобы использовать Impala?
Я следую инструкциям по настройке кластера hadoop-2.0.0 для установки Impala. В hdfs-site.xml я добавляю два свойства «dfs.client.read.shortcircuit» и «dfs.domain.socket.path» (/var/lib/hadoop-hdfs/dn_socket). Но когда я запускаю кластер Hadoop с...
1931 просмотров
schedule 04.09.2022

Impala - преобразовать существующую таблицу в формат паркета
У меня есть таблица с разделами, и я использую файлы avro или текстовые файлы для создания и вставки в таблицу. Как только стол будет готов, есть ли способ превратить его в паркет? Я имею в виду, что я знаю, что мы могли бы сказать CREATE TABLE...
9717 просмотров
schedule 05.07.2023

Раздел Hive с подстановочным знаком
Я новичок в разделах. Предположим, у меня есть следующая таблица таблица mytable (отметка времени mytime, строка myname) где столбец mytime выглядит так: год-месяц-день час: мин: сек.мсек (например, 2014-12-05 08: 55: 59.3131) Я хочу...
1706 просмотров
schedule 24.06.2023

Более быстрые технологии по сравнению с Impala в стеке Hadoop?
Мы использовали Impala более 4 месяцев, и мы обнаружили, что в большинстве случаев она работает очень быстро по сравнению с ульем. Поскольку мы находимся в процессе оценки быстрых фреймворков в Hadoop для обработки данных, мы хотели знать, есть ли...
127 просмотров
schedule 08.05.2023

Удаленные таблицы impala должны отправляться в корзину текущих пользователей, а не в impala.
Как я могу настроить параметры impala так, чтобы удаленные таблицы попадали в /user/$USER/.Trash вместо /user/impala/.Trash ?
767 просмотров
schedule 24.01.2023

Импала Типы данных
Я пытаюсь понять разницу между следующими данными в Impala. Нить Чар Варчар Будучи схемой при чтении, потребуется 3 разных типа. Мне интересно, есть ли какие-либо преимущества в производительности от использования Char/Varchars по...
1802 просмотров
schedule 20.03.2023

Impala - Пусть Impala выбирает свой собственный лимит памяти
У меня на кластере установлена ​​Cloudera Express 5.3.2. Я хотел бы использовать его для запросов Impala. Я хочу, чтобы Impala устанавливала ограничение в зависимости от емкости кластера. В конфигурации Impala в диспетчере cloudera написано...
1040 просмотров
schedule 13.04.2022

Как записать результаты запроса в impala в файл CSV с помощью драйвера JDBC
Можно ли с помощью драйвера Impala JDBC записать результаты запроса в файл CSV? ИЛИ это impala-shell единственный способ добиться этого? Каковы побочные эффекты безопасности/производительности вызова impala-shell из веб-приложения? Спасибо.
515 просмотров
schedule 17.12.2023

Оболочка Impala зависает при вызове для пользователей LDAP
Я установил кластер с impala и sentry (CDH 5.2) на CentOS 6.5 с помощью командной строки, а также настроил openLDAP (без TLS). Оба работают без каких-либо проблем независимо друг от друга. Чтобы настроить кластер Hadoop для openLDAP, я создал...
259 просмотров
schedule 02.07.2023

Арифметическая операция с операторами SELECT в Impala
Я пишу запрос, который должен ГРУППИРОВАТЬ по типу строки и делить значение на общее количество, чтобы узнать% от общего числа в IMPALA. Бывший.: Name performance something type1 something 15 something type1...
248 просмотров
schedule 11.09.2022

Почему секционированное соединение (перемешивание) не всегда лучше, чем широковещательное соединение?
Я провел глубокое исследование, но не нашел ничего достаточно подробного. Я прочитал это: 1) http://www.cloudera.com/content/www/en-us/documentation/enterprise/latest/PDF/cloudera-impala.pdf 2)...
1971 просмотров
schedule 10.10.2022

Параметры запроса с драйвером Impala ODBC
Я использую драйвер Impala ODBC, предоставленный Cloudera. Кажется, я не могу правильно использовать параметры запроса. Например: OdbcCommand command = DbConnection.CreateCommand(); command.CommandText = "INSERT INTO TABLE test VALUES(?, ?)";...
1884 просмотров
schedule 04.09.2022

Использование развивающейся схемы avro для хранилища импала / улья
У нас есть структура JSON, которую нам нужно проанализировать и использовать в импале / улье. Поскольку структура JSON развивается, мы подумали, что можем использовать Avro. Мы планировали разобрать JSON и отформатировать его как avro. Данные в...
287 просмотров
schedule 01.08.2022

Почему sqlQuery от RODBC не всегда возвращает одни и те же данные при запросе базы данных Impala?
Я пытаюсь получить некоторые данные из базы данных Impala, используя функцию sqlQuery из пакета RODBC. Результаты, которые я получаю, меняются от одного выполнения запроса к другому выполнению того же самого запроса. Data.frame, который я получаю,...
552 просмотров
schedule 22.05.2022