Hadoop по умолчанию поддерживает чтение сжатых файлов .gz, я хочу иметь аналогичную поддержку для файлов .zip. Я должен иметь возможность читать содержимое zip-файлов с помощью команды hadoop -text.
Я ищу подход, при котором мне не нужно реализовывать формат ввода и средство чтения для zip-файлов. Я хочу, чтобы мои задания были полностью независимы от формата входных файлов, они должны работать независимо от того, заархивированы или разархивированы данные. Аналогично тому, как это делается для файлов .gz.