Создайте свой собственный список географических справочников

Я новичок в обработке естественного языка и GATE. В настоящее время я учусь использовать GATE / ANNIE. Списки географических справочников ANNIE по умолчанию великолепны, но очевидно, что они не предоставляют списки для всего. Мне нужно создать список персонажей в сборнике рассказов.
Создание списков и добавление записей в каждый из списков с помощью редактора GATE Gazetteer Editor (как указано в руководстве Gate 13.2.2) или с помощью текстового редактора не представляется возможным. осуществимо. Итак, кто-нибудь знает способ создания наших собственных списков географических справочников, кроме создания/редактирования непосредственно через GATE или с помощью текстового редактора?


person usr256    schedule 26.03.2014    source источник


Ответы (2)


Как сказано в руководстве по GATE, любой из существующих списков можно редактировать в текстовом редакторе. Вероятно, наиболее простым способом является создание этих списков программно. т.е. если они есть в базе данных, сбрасывайте записи в формате географического справочника (в основном по одному слову в строке). Если они у вас есть в формате csv или на веб-странице, экспортируйте их в нужный формат.

Другим вариантом является использование более продвинутого географического справочника, который использует онтологию или семантический репозиторий. См. ссылку выше, чтобы узнать о различных справочниках и о том, как с ними работать.

person Yasen    schedule 26.03.2014

Я создал список, используя содержимое столбца из таблицы базы данных, как было предложено выше. Просто сохранил его как файл .lst с помощью Notepad++ в том же каталоге, что и все остальные файлы .lst (я использую справочник ANNIE), а затем добавил его с помощью редактора справочника. Одна проблема, с которой я столкнулся, заключалась в том, что он не был сохранен в правильной кодировке (UTF-8). GATE это не понравилось и это отображалось в сообщениях при загрузке. Как только я это понял и исправил, все заработало.

Если вам нужно создать список сущностей из текста, возможно, вы могли бы заглянуть в сборщик списков справочника - http://gate.ac.uk/sale/tao/splitch13.html — 13,7

person Finbarr    schedule 07.08.2014