У меня возникли трудности с извлечением отношений, опосредованных существительными, как описано в Angeli et al.
Когда я запускаю OpenIE локально с вводом «Президент США Барак Обама отправился в Индию в понедельник», извлекаются только две связи:
- (Президент США Барак Обама, путешествовал, понедельник)
- (Президент США Барак Обама, поездка в Индию)
- Не найдено, но ожидается: (Барак Обама, президент США)
Однако, когда я запускаю тот же ввод на http://corenlp.run/, эта третья связь выглядит извлеченной. Что еще более интересно, если я удалю «Именованные сущности» в качестве возможного аннотатора из corenlp.run, эта третья связь больше не будет найдена.
Итак, я думаю, мой вопрос заключается в том, какая правильная конфигурация (версии, модели, аннотаторы...) необходима для правильного извлечения отношений, опосредованных существительными? На моем локальном компьютере я загрузил v3.6.0, скомпилировал последний исходный код из ветки Master на GitHub, а затем заменил stanford-corenlp-3.6.0.jar ранее скомпилированным файлом jar. Затем я выполнил следующую команду из папки v3.6.0:
java -mx1g -cp "*" edu.stanford.nlp.naturalli.OpenIE -format ollie
Любая помощь или понимание будет большой помощью. Спасибо большое!