Теггер Stanford NER генерирует исключение «файл не найден» с предоставленными моделями

Я скачал stanford NER 3.4.1, распаковал его, и попытался запустить распознавание именованных объектов в локальном файле, используя обученную модель по умолчанию (предоставленную). Я получил это:

 `java.io.FileNotFoundException: /u/nlp/data/pos_tags_are_useless/egw4-reut.512.clusters (No such file or directory) at edu.stanford.nlp.io.IOUtils.inputStreamFromFile(IOUtils.java:481)`

Что не так и как я могу это исправить?


person drevicko    schedule 29.08.2014    source источник


Ответы (2)


Оказывается, предоставленные модели используют «функции сходства распределения», для которых требуется файл .clusters в месте, указанном в сжатом файле модели (сложно изменить). Если вы находитесь в Стэнфордской сети, предположительно, необходимые файлы там. Если нет, я нашел два варианта:

  1. Загрузите stanford NER без функций подобия дистрибутива ( немного снижает производительность, но работает быстрее). отказ от ответственности: я на самом деле не пробовал это, но это должно сработать.
  2. Download the distsim file (look here) from stanford and create a sym-link to it so it appears to be in the correct location. In my case on a Mac, I did this:
    • I created a heirarchy of folders u/nlp/data/pos_tags_are_useless/ somewhere,
    • скопировал туда загруженный egw4-reut.512.clusters файл,
    • затем cd /; sudo ln -s <somewhere>/u.
person drevicko    schedule 29.08.2014
comment
Это ошибка в моделях классификаторов, выпущенных с версией 3.4.1. Пока ваш обходной путь работает, кластеры подобия распределения должны находиться в сериализованной модели (и были в предыдущих выпусках). Я перевыпущу вещи с фиксированными моделями через день или около того, как только переделаю модели.... - person Christopher Manning; 01.09.2014
comment
Кажется, существует такая же или похожая проблема с немецкими и испанскими моделями, доступными по состоянию на 25 октября 2015 г. по адресу nlp.stanford.edu/software/CRF-NER.shtml ? По крайней мере, когда я пытаюсь загрузить библиотеки версии 3.4? - person jpp1; 25.10.2015
comment
Я бы порекомендовал прокомментировать ответ @ChristopherManning, чтобы он узнал об этом (: - person drevicko; 25.10.2015

Это была ошибка в файлах модели, сопровождавшая первоначальный выпуск кода версии 3.4.1, и она была исправлена. Повторно загрузите, и все должно работать нормально, без обходного пути символической ссылки.

person Christopher Manning    schedule 01.09.2014