Гарантировано ли, что при использовании Hadoop мои редукторы получат все записи с одним и тем же ключом?

Я запускаю задание Hadoop с использованием Hive, которое должно содержать uniq строки во многих текстовых файлах. На этапе сокращения он выбирает для каждого ключа самую последнюю запись с отметкой времени.

Гарантирует ли Hadoop, что каждая запись с одним и тем же ключом, выводимая на этапе сопоставления, попадет в один редюсер, даже если в кластере запущено много редюсеров?

Я беспокоюсь, что вывод картографа может быть разделен после того, как перетасовка произойдет в середине набора записей с одним и тем же ключом.

samg 13.04.2010 источник

Ответы (3)

arrow_upward
14
arrow_downward

Все значения для ключа отправляются в один и тот же редюсер. См. это Yahoo! учебник для дальнейшего обсуждения.

Это поведение определяется разделителем и может быть неверным, если вы используете разделитель, отличный от используемого по умолчанию.

Karl Anderson 13.04.2010

comment

на самом деле я не уверен в этом. См. stackoverflow.com/questions/26693034/ . Я не менял разделитель в своей программе. - Madrugada; 02.11.2014

arrow_upward
5
arrow_downward

Вообще-то, нет! Вы можете создать Partitioner, который отправляет один и тот же ключ другому редуктору каждый раз, когда вызывается getPartition. Это просто не очень хорошая идея для большинства приложений.

Bkkbrad 14.04.2010

arrow_upward
3
arrow_downward

Да, Hadoop гарантирует, что все одинаковые ключи будут переданы одному и тому же редюсеру. Это достигается с помощью функции Partition, которая группирует ключи с помощью хеш-функции.

Для получения дополнительной информации о процессе создания разделов см. здесь: Разделение данных

В частности, говорится о том, как разные преобразователи, обрабатывающие один и тот же ключ, гарантируют, что все ключи с заданным значением окажутся в одном разделе и, таким образом, обрабатываются одним и тем же редюсером.

Binary Nerd 13.04.2010

Гарантировано ли, что при использовании Hadoop мои редукторы получат все записи с одним и тем же ключом?

Ответы (3)

Похожие вопросы