Я работаю на клиента, где я должен поместить некоторые файлы в HDFS с сжатием Snappy. Моя проблема в том, что кодек snappy не определен в mapred-site.xml
или hdfs-site.xml
Каким-то образом мне приходится помещать файлы, желательно с помощью команды hdfs put
, и они должны быть сжаты. Нет возможности изменить файлы конфигурации, так как это производственная машина, и другие люди активно ее используют.
Другое предлагаемое решение заключалось в том, чтобы импортировать файлы в HDFS без сжатия, а затем создавать внешние таблицы куста со сжатием и использовать его исходные файлы при удалении несжатых файлов. Но это долгий путь, и он не гарантирует работу.
Будем признательны за любые предложения по использованию hdfs put
с какими-либо параметрами для сжатия файлов.
put
просто перемещает данные. - person Binary Nerd   schedule 03.08.2016