Я знаю, что distcp не может использовать подстановочные знаки. Однако мне нужно будет планировать distcp при смене каталогов. (т. е. копировать только данные из каталога «пятница» в понедельник и т. д.), но также и из всех проектов в указанном каталоге.
Есть ли какой-то шаблон проектирования для написания сценариев такого рода?
Короче говоря, я хочу иметь возможность:
hadoop distcp /foo/*/bar/$year/$month/$day hdfs://namespace-foo/replication-dir/