Я запускаю задание sqoop в облаке Google для импорта данных из базы данных psql после применения соединений к 3 таблицам. Однако задание sqoop завершается с ошибкой, указанной ниже, хотя оно импортирует данные из таблицы в течение 15 минут, но завершается сбоем после работы в течение 2 часов. Я могу легко извлечь другие таблицы.
Размер данных: 13 ГБ
Запрос: gcloud вычисление ssh $INSTANCE_NAME --project=$PROJECT_ID --service-account=$ACCOUNT --command="""$SQOOP_HOME/bin/sqoop-import -D mapreduce.output.basename='$TABLE_EXPORT' -- connect jdbc:$JDBC://$HOST_NAME:$PORT/$DATABASE --username $USERNAME --password '$PASSWORD' --target-dir $BUCKET_STORAGE -m $NUM_WORKERS --split-by $SPLIT_BY --query ' $QUERY \$CONDITIONS ' --map-column-java $MAPPING_COLUMNS --fields-terminated-by '|' --null-string '' """ --zone=$ZONE 2>&1
Ошибка:
20/06/12 22:14:36 ИНФО mapreduce.Job: карта 0% уменьшить 0%
20/06/12 22:14:49 ИНФО mapreduce.Job: карта 50% уменьшение 0%
20/06/12 22:14:50 ИНФО mapreduce.Job: карта 75% редукция 0%
package_write_wait: подключение к порту XX.XX.XXX.XXX XX: сломанный канал
ОШИБКА: (gcloud.compute.ssh) [/usr/bin/ssh] завершился с кодом возврата [255].
Команда завершилась с кодом возврата 1