Статьи по тематике hadoop2

Вопросы по теме 'hadoop2'

загрузка 1 ГБ данных в hbase занимает 1 час

Я хочу загрузить CSV-файл размером 1 ГБ (10 миллионов записей) в Hbase. Я написал для него программу Map-Reduce. Мой код работает нормально, но на выполнение требуется 1 час. Последний редуктор занимает более получаса. Может ли кто-нибудь помочь...

2830 просмотров

04.04.2022

свинья на латыни - не показывает правильные номера записей

Я написал pig script для wordcount , который отлично работает. Я мог видеть результаты сценария свиньи в моем выходном каталоге в hdfs. Но ближе к концу моей консоли я вижу следующее: Success! Job Stats (time in seconds): JobId Maps...

782 просмотров

hadoop2 apache-pig

02.01.2023

Проблема при установке hadoop-2.2.0 на 64-битной Linux-машине

Используя эту ссылку, попытался установить версию Hadoop - 2.2.0 (кластер с одним узлом) в Ubuntu 12.04 (64-разрядная машина) http://bigdatahandler.com/hadoop-hdfs/installing-single-node-hadoop-2-2-0-on-ubuntu/ при форматировании файловой...

182 просмотров

hadoop hadoop-partitioning hadoop2 hadoop-plugins hadoop-streaming

27.02.2023

Как установить точное максимальное количество одновременно запущенных задач на узел в Hadoop 2.4.0 на Elastic MapReduce

Согласно http://blog.cloudera.com/blog/2014/04/apache-hadoop-yarn-avoiding-6-time-using-gotchas/ формула для определения количества одновременно выполняющихся задач на узел: min (yarn.nodemanager.resource.memory-mb /...

2301 просмотров

amazon-web-services yarn hadoop2 hadoop-streaming elastic-map-reduce

26.08.2022

Ошибка Hadoop — прерывание работы всех узлов данных

Я использую версию Hadoop 2.3.0. Иногда, когда я выполняю задание по уменьшению карты, отображаются следующие ошибки. 14/08/10 12:14:59 INFO mapreduce.Job: Task Id : attempt_1407694955806_0002_m_000780_0, Status : FAILED Error:...

13445 просмотров

hadoop hdfs mapreduce yarn hadoop2

24.12.2022

Как решить, что chainmapper неприменим для ошибки аргументов при выполнении цепочки заданий в Mapreduce?

Я использую Hadoop 1.2.1, eclipse juno. Я пытаюсь связать три задачи карты в одном задании Mapreduce. при написании кода Mapreduce в eclipse я получаю сообщение об ошибке, например, chainmapper неприменим для аргументов, а также я не могу установить...

757 просмотров

eclipse hadoop hadoop-partitioning hadoop2 hadoop-streaming

16.08.2022

Разделение ввода для функции Map в Hadoop

Это моя первая реализация в Hadoop. Я пытаюсь реализовать свой алгоритм вероятностного набора данных в Map Reduce. В моем наборе данных последний столбец будет иметь некоторый идентификатор (количество уникальных идентификаторов в наборе данных...

1339 просмотров

python hadoop hadoop-partitioning hadoop2 hadoop-streaming

23.07.2022

ошибка при запуске сервера sqoop2 на Amazon EMR с пряжей

Я пытаюсь установить sqoop 2 (версия 1.99.3) в кластере Amazon EMR (AMI версии 3.2.0 / Hadoop версии 2.4.0). Когда я запускаю сервер sqoop, я вижу эту ошибку в localhost.log: Sep 10, 2014 4:55:56 PM org.apache.catalina.core.StandardContext...

615 просмотров

amazon-emr sqoop2 yarn hadoop2

26.09.2023

Нужно вручную создать dfs.domain.socket.path в Hadoop-2.0.0, чтобы использовать Impala?

Я следую инструкциям по настройке кластера hadoop-2.0.0 для установки Impala. В hdfs-site.xml я добавляю два свойства «dfs.client.read.shortcircuit» и «dfs.domain.socket.path» (/var/lib/hadoop-hdfs/dn_socket). Но когда я запускаю кластер Hadoop с...

1931 просмотров

linux hadoop impala hadoop2

04.09.2022

Процессы, работающие на всех узлах, кроме узлов данных, не подключенных к namenode.

У меня есть кластер из 4 узлов, 1 главный и 3 подчиненных устройства на CentOs и HADOOP 2.5.0. Все конфиги и ssh тоже хороши :). Но когда я запускаю start-dfs.sh в мастере namenod , а в подчиненных datanode задания выполняются, но в web...

55 просмотров

hadoop hadoop2

24.02.2023

в таблице восстановления hive 0.13 msck перечислены только разделы, которых нет в хранилище метаданных

Я пытаюсь использовать команду Hive (0.13) msck repair table для восстановления разделов, и в ней перечислены только разделы, не добавленные в хранилище метаданных, вместо того, чтобы добавлять их в хранилище метаданных. вот вывод команды...

23323 просмотров

hive hiveql hadoop2

10.08.2022

Сортировка по Pig Latin

Я тестирую следующий пример из документов Apache Pig: http://pig.apache.org/docs/r0.14.0/basic.html#order-by но функция сортировки, похоже, не работает. Есть идеи? $ pig -version Apache Pig version 0.14.0 (r1640057) compiled Nov 16 2014,...

141 просмотров

sorting hadoop2 apache-pig

29.10.2022

Данные Hive, HDFS в локальную систему и обратно

Я новичок в администрировании Hadoop :) У меня есть кластер Apache Hadoop 2.4.1 из 8 узлов, используется DFS 16 ТБ (не удалось найти фактор репликации ни в одном из файлов xml), Hive 0.13 с хранилищем метаданных MySQL. Цель : сделать резервную...

862 просмотров

hadoop hdfs hive hadoop2

28.08.2022

Ошибка выполнения Hive при обработке строки в Hive

У меня проблема при запросе к таблице форматов файлов ORC Я пытался выполнить запрос ниже: INSERT INTO TABLE <db_name>.<table_name> SELECT FROM <db_name>.<table_name> WHERE CONDITIONS; что приводит к: TaskAttempt 2...

22309 просмотров

hadoop hive yarn hadoop2

01.07.2022

Задание Hadoop MapReduce зависает

Я пытаюсь смоделировать среду Hadoop, используя последнюю версию Hadoop 2.6.0, Java SDK 1.70 на моем рабочем столе Ubuntu. Я настроил hadoop с необходимыми параметрами среды, и все его процессы запущены и работают, и их можно увидеть с помощью...

1992 просмотров

mapreduce hadoop2

06.01.2023

Команда оболочки для передачи файлов из HDFS в локальную файловую систему в Hadoop 2.6.9

Я новичок в Hadoop. Есть ли команда bash для переноса файлов из распределенной файловой системы Hadoop в стандартную файловую систему на узле Hadoop. Я использую Hadoop 2.6.0 Я видел еще один похожий вопрос, в котором спрашивалось, как...

2266 просмотров

hadoop hortonworks-data-platform hadoop2

10.06.2023

Использование моментального снимка таблицы HBase в рабочем процессе Oozie

Я пытаюсь запустить задание MapReduce на oozie, которое использует снимок таблицы HBase в качестве входных данных. В настоящее время я могу это сделать (не используя рабочий процесс oozie), используя...

329 просмотров

hadoop mapreduce hbase hadoop2 oozie

04.01.2024

Команда hdfs устарела в Hadoop

Я следую этой процедуре ( ссылка на YouTube ). При выполнении команды c :/hadoop-2.3.0/bin/hadoop namenode -format я получил сообщение об ошибке, приведенное ниже **DEPRECATED:Use of this script to execute hdfs command is deprecated. Instead...

6729 просмотров

java hadoop hadoop2 hadoop-plugins hadoop-streaming

09.10.2022

Добавление поддержки Zip-файлов в Hadoop

Hadoop по умолчанию поддерживает чтение сжатых файлов .gz, я хочу иметь аналогичную поддержку для файлов .zip. Я должен иметь возможность читать содержимое zip-файлов с помощью команды hadoop -text. Я ищу подход, при котором мне не нужно...

642 просмотров

hadoop zip hadoop2 hadoop-streaming

09.02.2024

Hadoop 2.x на amazon ec2 t2.micro

Я пытаюсь установить и настроить Hadoop 2.6 на экземпляре Amazon EC2 t2.micro (бесплатный, только с 1 ГБ ОЗУ) в псевдораспределенном режиме. Я мог настроить и запустить все демоны (например, Namenode, Datanode, ResourceManager, NodeManager). Но...

414 просмотров

amazon-ec2 hadoop yarn hadoop2

11.02.2024

Вопросы по теме 'hadoop2'

Похожие вопросы