В чем разница между WordNet 3.1 и WordNet 3.0?

Кажется, на wordnet.princeton.edu нет журнала изменений или чего-то подобного.


person piggs_boson    schedule 06.09.2015    source источник


Ответы (2)


Чтобы добавить к ответу @abarisone, сами фактические идентификаторы synset могут различаться между WordNet 3.0 и WordNet 3.1 :(

Например, в WordNet 3.1 стул — это 103005231- п.

Однако в WordNet 3.0 это было 103001627-n. Но вы не можете найти это в http://wordnet-rdf.princeton.edu/wn31/103001627-n или http://wordnet-rdf.princeton.edu/wn30/103001627-n, но вместо этого вам нужно использовать http://wordnet-rdf.princeton.edu/wn30/03001627-n, который неправильно перенаправляет на 102992974-n.

Я думаю, что это ошибка в онлайн-приложении WordNet RDF 3.1, потому что 102992974-n официально не существует. Вы даже не можете найти его (и онлайн, и оффлайн). И если вы получите файл RDF/JSON-LD на этой странице, он даст вам 103005231-n.

In wn3.1.dict/dict/index.noun :

chair n 5 4 @ ~ %p + 5 2 03005231 00599171 10488547 03275941 03005700  

Нигде в этом файле нет упоминания о 02992974.

Обе эти проблемы сбивают с толку. Интересно, почему они изменили идентификаторы синсетов в минорной ревизии.


Относительно статуса идентификаторов synset WordNet:

Вывод: в настоящее время использование идентификаторов synset WordNet 3.0 является наиболее безопасным.

Для будущей работы можно рассмотреть возможность использования Inter-Lingual Index от Global Wordnet Association (скоро). Которые будут иметь идентификаторы, совместимые с Wordnet 3.0.

Ссылки из списка рассылки wn-users, 30 октября 2015 г.:

Откуда: Рафаэль, Николас

URI строится из поля «dblocation», которое представляет собой смещение в байтах от начала соответствующего символьного файла базы данных (я не уверен, какого именно). Это будет меняться от выпуска к выпуску, поскольку элементы удаляются, добавляются и перемещаются.

.

От: Питер Кларк

Насколько мне известно…. К вашему сведению, малоизвестный факт заключается в том, что ключи чувств (например, «способность% 1:07:00::») неизменны между выпусками, за исключением случаев, когда чувства разделены или объединены. Это обеспечивает стабильный способ обращения к синсетам в разных выпусках вместо использования номеров синсетов. Также вы можете найти сопоставления между номерами синсетов в разных выпусках, ища одинаковые смысловые ключи. (sensekey->synset — это сопоставление «многие к 1»: синсет может иметь несколько смысловых ключей, по одному для каждого слова+смысла в синсете. Но смысловой ключ сопоставляется ровно с одним синсетом). С наилучшими пожеланиями, Пит

.

От: Джон МакКрей

Привет, Хенди,

Да. Идентификаторы синсетов WordNet основаны на смещении байтов дескриптора в данном выпуске WordNet, поэтому они далеко не стабильны в разных версиях WordNet. Идентификаторы смысла более стабильны, но все же могут быть ненадежными, поскольку смысл разделяется и объединяется. Кроме того, есть две немного разные версии WordNet 3.1, и версия WordNet RDF принимает идентификаторы синсетов от любой из них... это, конечно, как уже отмечали другие, очень запутанно.

По этой причине Глобальная ассоциация WordNet начала работу над межъязыковым указателем, который, как мы ожидаем, скоро появится в сети (т. е. ко времени проведения глобальной конференции WordNet в январе) и предоставит каждому синсету один неизменный URI.

Пик Фоссен недавно хорошо рассказал об этом, и эти слайды доступны в Интернете здесь: http://ldl2014.org/slides/Vossen-LOD-CILI.pdf

На данный момент я бы рекомендовал использовать идентификаторы WN 3.0 для связывания синсетов, на которых также будет основан межъязыковой индекс WordNet.

С уважением, Джон

person Hendy Irawan    schedule 26.10.2015
comment
Межъязыковой указатель Глобальной ассоциации WordNet: github.com/globalwordnet/ili - person Nicolas Raoul; 02.07.2019

Если вы заглянете в раздел Текущая версия WordNet, вы обнаружите, что:

Самая последняя версия WordNet для Windows — 2.1, выпущенная в марте 2005 г. Версия 3.0 для Unix/Linux/Solaris/и т. д. был выпущен в декабре 2006 г. Версия 3.1 в настоящее время доступна только в Интернете.

Более того, говоря о разнице между версией 3.0 и 3.1 можно прочитать:

ТОЛЬКО ФАЙЛЫ БАЗ ДАННЫХ WordNet 3.1

Вы можете скачать файлы базы данных WordNet 3.1 отсюда. Обратите внимание, что это не полный пакет, как приведенный выше, и он не содержит никакого кода для запуска WordNet. Однако вы можете заменить файлы в каталоге базы данных вашей локальной установки 3.0 этими файлами, и интерфейс WordNet запустится, возвращая записи из базы данных 3.1. Это просто сжатый tar-файл файлов базы данных WordNet 3.1.

Таким образом, разница в том, что WordNet 3.1 доступен только онлайн, но вы можете заменить базу данных версии 3.0 и использовать локальную установку.

Вы можете найти документацию по версии 3.0 здесь.

person abarisone    schedule 24.09.2015