Я пытаюсь обучить модель с помощью Amazon Sagemaker (xgboost: eu-west-1 ':' 685385470294.dkr.ecr.eu-west-1.amazonaws.com/xgboost:latest '). Но вскоре после начала обучения я всегда получаю одно и то же сообщение об ошибке:
«ClientError: в пути к данным найден скрытый файл! Удалите его перед обучением».
Консоль S3 показывает, что выходной путь пуст (я также пытался создать новый каталог, но безрезультатно). Для сегмента не включено управление версиями.
Удивительно, но Google ничего не находит под этим сообщением об ошибке.
Я настроил вход и выход следующим образом:
"InputDataConfig": [
{
"ChannelName": "train",
"DataSource": {
"S3DataSource": {
"S3DataType": "S3Prefix",
"S3Uri": "s3://{}/{}-inputdata/train".format(s3_utils.bucket, LABEL)
}
},
"ContentType": "csv",
"CompressionType": "None"
},
{
"ChannelName": "validation",
"DataSource": {
"S3DataSource": {
"S3DataType": "S3Prefix",
"S3Uri": "s3://{}/{}-inputdata/validation".format(s3_utils.bucket, LABEL)
}
},
"ContentType": "csv",
"CompressionType": "None"
}
],
"OutputDataConfig": {
"S3OutputPath": "s3://{}/{}-xgboost-output".format(s3_utils.bucket, LABEL) },
Поле
"RoleArn": role,
откуда взялась роль
from sagemaker import get_execution_role
role = get_execution_role()
и является
arn:aws:iam::<ACCOUNT>:role/service-role/AmazonSageMaker-ExecutionRole-<HIDDEN>
Вот снимок экрана, показывающий путь к данным: представление пути к данным на панели управления S3. Два файла csv - это все, что есть. В частности, нет пустого «каталога», который мог бы означать «скрытый файл».