Вопросы по теме 'hive'
Гарантировано ли, что при использовании Hadoop мои редукторы получат все записи с одним и тем же ключом?
Я запускаю задание Hadoop с использованием Hive, которое должно содержать uniq строки во многих текстовых файлах. На этапе сокращения он выбирает для каждого ключа самую последнюю запись с отметкой времени.
Гарантирует ли Hadoop, что каждая...
5984 просмотров
schedule
09.04.2022
Где Hive хранит файлы в HDFS?
Я хотел бы знать, как найти соответствие между таблицами Hive и фактическими файлами HDFS (или, скорее, каталогами), которые они представляют. Мне нужен прямой доступ к файлам таблиц.
Где Hive хранит свои файлы в HDFS?
144069 просмотров
schedule
10.08.2022
Добавление нового тома к псевдораспределенному узлу Hadoop завершается сбоем
Я пытаюсь добавить новый том в псевдораспределенный узел Hadoop, добавив местоположение тома в dfs.name.dir в hdfs-site.xml , и я вижу файл блокировки в этом месте, но как я ни старался, кажется, что когда я загружаю файлы (с использованием улья)...
840 просмотров
schedule
01.10.2023
Hive не отвечает, когда я пытаюсь сделать запрос
У меня есть установка на экземпляре EC2, который использует Whirr для запуска новых экземпляров Hadoop. Я пытался заставить Hive работать с этой настройкой. Hive должен быть настроен на использование mysql в качестве локального хранилища метаданных....
2353 просмотров
schedule
02.03.2023
Как настроить сервер hive для работы в удаленном режиме?
я добавил пакет hive в свой кластер hadoop. если я зайду в hive cli, я смогу запустить hive в удаленном режиме. но запросы, проходящие через сервер улья, выполняются в локальном режиме, что очень медленно... единственные изменения, которые я сделал...
4357 просмотров
schedule
08.03.2023
Оживленная кассандра TimeUUIDType
Я использовал юркий. Семейство столбцов cassandra автоматически сопоставляется с таблицами Hive. Однако, если в семействе столбцов используется тип данных timeuuid, они не читаются в таблицах Hive.
Например, я использовал следующую команду для...
768 просмотров
schedule
10.02.2023
Использование отсортированных таблиц в Hive
Подводя итог: я чувствую, что моя система игнорирует концепцию предварительно отсортированных таблиц. - Я рассчитывал сэкономить время на этапе сортировки, поскольку использовал предварительно отсортированные данные, но план запроса, похоже,...
9464 просмотров
schedule
05.06.2022
зарегистрировать hive udf с помощью hue api
Как зарегистрировать UDF с помощью HUE API? Я использую приведенный ниже код, но он не может его зарегистрировать.
Query query1=new Query("create temporary function calculate as 'com.sample.MYUDF'",configuration,hadoop_user);...
1906 просмотров
schedule
11.07.2022
Почему результаты запроса куста разбиваются на несколько файлов
У меня есть задание Amazon ElasticMapreduce, настроенное для выполнения запроса куста.
CREATE EXTERNAL TABLE output_dailies (
day string, type string, subType string, product string, productDetails string,
uniqueUsers int, totalUsers int
)
ROW...
4315 просмотров
schedule
04.05.2022
Настройка Hive с помощью Hbase
Мне нужно выполнять запросы к HBase, используя куст. Я загрузил HBase, и мой HMaster работает нормально; Мне нужно знать, какие изменения конфигурации мне нужно сделать, чтобы Hive работал с HBase в качестве серверной базы данных. Любой учебник по...
7236 просмотров
schedule
14.07.2022
Ошибка в конфигурации Hive
Сценарий:
Во время настройки Hive, когда я ввожу hive-dir-path$ bin/hive, я получаю сообщение об ошибке: Missing Hive Builtins Jar.
Описание:
После успешной сборки пакета через ant, когда я пытаюсь запустить Hive CLI из каталога Hive. Я...
959 просмотров
schedule
16.10.2022
Как получить и проанализировать данные с сервера MS SQL с помощью Hadoop, Hive и Sqoop?
Я хочу провести анализ данных, которые находятся в базе данных (MS SQL Server). Итак, как я могу перенести эти данные в HDFS с помощью Sqoop/Hive? Возможно ли это с Hive/Sqoop? Пожалуйста, предложите мне, как мы можем это сделать.
Спасибо.
544 просмотров
schedule
26.09.2022
hive создать таблицу с именем файла 000000_0?
В настоящее время я создаю внешнюю таблицу следующим образом:
CREATE EXTERNAL TABLE site_datatype (
....
yada yada
....
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n'
LOCATION...
3344 просмотров
schedule
25.09.2023
Как заставить hive запускать задания mapreduce одновременно?
Я новичок в улье и столкнулся с проблемой,
У меня есть таблица в улье, как это:
create table td(id int, time string, ip string, v1 bigint, v2 int, v3 int,
v4 int, v5 bigint, v6 int) PARTITIONED BY(dt STRING)
ROW FORMAT DELIMITED FIELDS...
10092 просмотров
schedule
11.04.2023
Hive JDBC против клиента CLI
Мне нужно программно получить доступ к данным с помощью Hive (данные в порядке ГБ на запрос). Я оценивал драйвер CLI против драйвера Hive JDBC.
Когда мы используем JDBC, возникают дополнительные накладные расходы на резервный сервер, и я пытаюсь...
1874 просмотров
schedule
24.02.2023
Проблема с запросом HIVE (выберите количество (*))
Я создал таблицу кустов, как в Создать внешний с разделом
Я использую кустовую версию hive-0.7.1-cdh3u2 . Когда я выполняю простой запрос, т.е. выбираю количество (*), я получаю сообщение об ошибке.
hive> select count(*) from test where...
5704 просмотров
schedule
01.04.2022
Подсчет в Hadoop Hive
Я хочу подсчитать значения, похожие на карту, где ключ будет значением в столбце таблицы Hive, а соответствующее значение - счетчиком.
Например, для таблицы ниже:
+-------+-------+
| Col 1 | Col 2 |
+-------+-------+
| Key1 | Val1 |
| Key1 |...
15178 просмотров
schedule
22.05.2022
Hadoop mapred job - Ошибка инициализации попытки mapred задачи
Я случайно удалил hadoop.tmp.dir, в моем случае /tmp/{user.name}/*. Теперь каждый раз, когда я запускаю запрос куста из CLI, задание mapred завершается ошибкой при попытке выполнить задание, как показано ниже:
Error initializing...
2583 просмотров
schedule
16.02.2023
Запрос улья на существующей таблице в HBase
Я создал таблицу в HIVE, используя команду CREATE EXTERNAL TABLE для существующей таблицы в HBase.
Я могу видеть таблицу через оболочку HIVE
но при запросе к таблице через HIVE возвращает «0» записей. По журналам установлено, что HIVE выполняет...
980 просмотров
schedule
07.12.2022
Как сопоставить динамические столбцы DynamoDB в EMR Hive
У меня есть таблица в Amazon DynamoDB со структурой записи, например
{"username" : "joe bloggs" , "products" : ["1","2"] , "expires1" : "01/01/2013" , "expires2" : "01/02/2013"}
где свойство products представляет собой список продуктов,...
1806 просмотров
schedule
26.02.2023