Вопросы по теме 'distcp'
Почему анонимный FTP на HDFS DistCp не работает?
Я попробовал команду ниже, чтобы скопировать данные FTP в HDFS,
hadoop distcp ftp://ftp.ncdc.noaa.gov/pub/data/noaa/1901/ data/noaa/1901/
Вот какую ошибку я получил
15/03/04 11:29:13 INFO tools.DistCp: Input Options:...
528 просмотров
schedule
01.08.2023
Hadoop distcp поднимает Не удалось найти или загрузить основной класс org.apache.hadoop.mapreduce.v2.app.MRAppMaster
Когда я запускаю distcp для перемещения данных из s3 в мои локальные hdfs, я получаю это исключение во время задания уменьшения карты, запущенного для копирования данных:
Error: Could not find or load main class...
6607 просмотров
schedule
06.08.2023
шаблон проектирования для каталогов distcp с подстановочными знаками или переменными (glob)
Я знаю, что distcp не может использовать подстановочные знаки. Однако мне нужно будет планировать distcp при смене каталогов. (т. е. копировать только данные из каталога «пятница» в понедельник и т. д.), но также и из всех проектов в указанном...
599 просмотров
schedule
18.04.2022
Hadoop distcp со списком файлов
Я хотел бы использовать distcp для копирования списка файлов (> 1K файлов) в hdfs. Я уже сохранил список файлов в локальном каталоге, теперь я могу использовать -f для копирования всех файлов? если да, то какой формат я должен поддерживать в моем...
599 просмотров
schedule
18.06.2022
Шифрование на стороне сервера s3 с использованием рабочего процесса oozie
У меня есть задание sqoop, которое будет записывать данные в ведро s3. Если я запускаю это задание из командной строки, оно шифрует файлы s3. Но если я использую тот же файл jar для запуска задания sqoop с использованием рабочего процесса oozie,...
164 просмотров
schedule
26.03.2023
Hadoop distcp Учетные данные AWS не предоставлены
У меня есть огромное количество файлов S3, которые я хочу поместить в HDFS. Учитывая количество задействованных файлов, я предпочитаю использовать «распределенную копию». Однако по какой-то причине я не могу заставить hadoop distcp использовать мои...
5745 просмотров
schedule
11.10.2022
Соединитель HDFS для хранилища объектов: не содержит допустимого хоста: полномочия порта.
Я настроил HDFS Connector для хранилища объектов, как описано здесь: https://docs.us-phoenix-1.oraclecloud.com/Content/API/SDKDocs/hdfsconnector.htm#troubleshooting
Когда я запускаю distcp со следующей командой:
hadoop distcp -libjars...
383 просмотров
schedule
15.04.2023
локальный файл distcp для hadoop
У меня есть файл размером 1 Гб в локальной файловой системе /tmp/dist_testfle
Я могу скопировать это: hadoop fs -put file:///tmp/dist_testfile maprfs:///
Но не может расшифровать его. Команда hadoop distcp file:///tmp/dist_testfile...
585 просмотров
schedule
24.06.2022