Отказ от ответственности: я новичок в нейронных сетях и Tensorflow.
Я пытаюсь создать приложение QA, где пользователь задает вопрос, а приложение дает ответ. Большинство традиционных методов, которые я пробовал, не работают, недостаточно точны или требуют ручного вмешательства. Я изучал неконтролируемое приложение QA, то есть когда я наткнулся на BERT.
BERT, как утверждает Google, является современной моделью нейронной сети и набрал наивысший балл в таблице лидеров для Отряд 2.0. Я хочу использовать эту модель в своем приложении и протестировать ее работоспособность.
Я создал виртуальную машину Windows 2012 Datacenter edition в Compute Engine. Я создал облако TPU с использованием ctpu.
У меня есть большая модель BERT без корпуса в облачном хранилище .
Как обучить большую модель BERT без корпуса с помощью SQUAD 2.0?
Пожалуйста, не стесняйтесь поправлять меня, если я ошибаюсь, я понимаю, что Cloud TPU - это просто устройство, такое как CPU или GPU. Однако, если вы читаете это, они объясняют, что Cloud TPU - это виртуальная машина. (В Cloud TPU вы можете запускать BERT-Large как ...).
Где запустить run_squad.py, как указано в здесь?
python run_squad.py \
--vocab_file=$BERT_LARGE_DIR/vocab.txt \
--bert_config_file=$BERT_LARGE_DIR/bert_config.json \
--init_checkpoint=$BERT_LARGE_DIR/bert_model.ckpt \
--do_train=True \
--train_file=$SQUAD_DIR/train-v2.0.json \
--do_predict=True \
--predict_file=$SQUAD_DIR/dev-v2.0.json \
--train_batch_size=24 \
--learning_rate=3e-5 \
--num_train_epochs=2.0 \
--max_seq_length=384 \
--doc_stride=128 \
--output_dir=gs://some_bucket/squad_large/ \
--use_tpu=True \
--tpu_name=$TPU_NAME \
--versionvocab_file
with_negative=True
Как получить доступ к файлам хранилища из виртуальной машины для этого аргумента vocab_file
?
Является ли внешний IP-адрес значением переменной среды $TPU_NAME
?