Проблема с загрузкой разложимого-внимания-elmo с помощью `Predictor.from_path`

Я пытаюсь загрузить модель разложимого внимания, предложенную в этой статье Модель декомпозируемого внимания (Парих и др., 2017) в сочетании с встраиванием ELMo, обученным на SNLI., и использованный код, предложенный в качестве демонстрационный веб-сайт описан:

predictor = Predictor.from_path("https://storage.googleapis.com/allennlp-public-models/decomposable-attention-elmo-2020.04.09.tar.gz", "textual_entailment")
predictor.predict(
  hypothesis="Two women are sitting on a blanket near some rocks talking about politics.",
  premise="Two women are wandering along the shore drinking iced tea."
)

Я нашел это из журнала:

Did not use initialization regex that was passed: .*token_embedder_tokens\._projection.*weight

и прогноз также отличался от того, что я получил на демонстрационном веб-сайте (который я намеревался увидеть). Я что-то здесь пропустил?

Кроме того, я попробовал две другие версии предварительно обученной модели, decomposable-attention-elmo-2018.02.19.tar.gz и decomposable-attention-elmo-2020.02.10.tar.gz. Ни один из них не работает, и я получил эту ошибку:

ConfigurationError: key "token_embedders" is required at location "model.text_field_embedder."

Что мне нужно сделать, чтобы получить точный результат, представленный на демонстрационном веб-сайте?


person yunyy    schedule 02.12.2020    source источник


Ответы (1)


ELMo в этом смысле немного сложен, поскольку он сохраняет состояние, и вы не получите тот же результат, если вызовете его дважды. Это зависит от того, что вы обработали заранее. В общем, следует разогреть ELMo несколькими вопросами, прежде чем использовать его всерьез.

Если вы по-прежнему видите большие расхождения в результатах, сообщите нам, и мы рассмотрим их.

Старые версии модели не работают с новым кодом. Поэтому мы опубликовали новые версии модели.

person Dirk Groeneveld    schedule 12.12.2020