Google Cloud TPU: gcloud compute tpus create не работает с отказом в разрешении

Я пытаюсь следовать официальному руководству по модели обучения с облачными TPU Google. Это руководство: https://cloud.google.com/tpu/docs/tutorials/transformer-pytorch

На шаге Launch a Cloud TPU resource я делаю следующее

:~$ gcloud compute tpus create train-bert-one \
> --zone=europe-west4-a \
> --network=default \
> --version=pytorch-1.6 \
> --accelerator-type=v3-8

Как и в туториале, я просто адаптировал регион.

Команда не работает с

ERROR: (gcloud.compute.tpus.create) PERMISSION_DENIED: Permission 'tpu.nodes.create' denied on 'projects/bert-archaea-fine-tuning/locations/europe-west4-a/nodes/train-bert-one'

Кто-нибудь знает эту ошибку? Ничего не могу найти на нем.


person fteufel    schedule 06.10.2020    source источник


Ответы (1)


Служба поддержки Google смогла это исправить, проблема заключалась в том, что по какой-то причине не было рабочей учетной записи службы API, созданной автоматически при создании проекта с помощью

gcloud compute --project=${PROJECT_ID} instances create transformer-tutorial \
--zone=us-central1-a  \
--machine-type=n1-standard-16  \
--image-family=torch-xla \
--image-project=ml-images  \
--boot-disk-size=200GB \
--scopes=https://www.googleapis.com/auth/cloud-platform

Исправлено добавление флага --service-account= к команде и ручное указание учетной записи службы.

person fteufel    schedule 06.10.2020