Версия улья: 1.2.1
Конфигурация:
set hive.execution.engine=tez;
set hive.merge.mapredfiles=true;
set hive.merge.smallfiles.avgsize=256000000;
set hive.merge.tezfiles=true;
Высокий уровень качества:
ALTER TABLE `table_name` PARTITION (partion_name1 = 'val1', partion_name2='val2', partion_name3='val3', partion_name4='val4') CONCATENATE;
Я использую HQL для объединения файлов определенной таблицы/раздела. Однако после выполнения в выходном каталоге остается много файлов; и их размер намного меньше 256000000. Итак, как уменьшить количество выходных файлов.
Кстати, использование MapReduce вместо Tez тоже не сработало.