Стэнфордское НЛП: арабская часть ярлыков речи?

Я хочу знать значение меток, которые теггер части речи арабский (версия 2015.1.30) ставит для каждого слова.

как المدرسة / DTNN, я знаю, что он отличается от английских меток.

Я искал их веб-сайт и документацию, но ничего не нашел относительно стандартных арабских этикеток.


person Afnan Ahmad    schedule 19.04.2015    source источник
comment
возможный дубликат Java Stanford NLP: часть речевых меток?   -  person houssam    schedule 19.04.2015
comment
@houssam Я ищу значение арабских меток, а не английских.   -  person Afnan Ahmad    schedule 19.04.2015
comment
вы правы, я думал, они используют один и тот же набор тегов; Надеюсь, мой ответ будет вам полезен.   -  person houssam    schedule 19.04.2015


Ответы (2)


Во-первых, я не уверен в этом ответе; но я надеюсь, что это поможет вам. То, что вы просили, должно быть расположено по следующей ссылке: Набор тегов POS парсер используете? (но, к сожалению, есть много неработающих ссылок !!).
Как они уже упоминали, вы можете найти набор тегов (вы назвали метки) в следующем файле atb1-v4.1-taglist-conversion-to-PennPOS -forrelease.lisp. Насколько я понимаю, они сопоставляют одну или несколько последовательностей английских тегов с одним или несколькими арабскими тегами. например: отображение:

(DET + ADJ_COMP + NSUFF_MASC_DU_GEN DT + JJR)

означает, что мы сопоставляем английскую последовательность тегов (DET + ADJ_COMP + NSUFF_MASC_DU_GEN) с арабскими тегами (DT + JJR).
Что касается вашего вопроса (المدرسة / DTNN), они упомянули, что он состоит из двух тегов (DT + NN), где DT = (الــ) (произносится как 'Al') и NN = (Существительное, единственное число или масса) см. Penn Treebank.

person houssam    schedule 19.04.2015

Они использовали список этикеток, называемый списком POS.

Под DTNN они имели в виду определяющее существительное. Например, когда вы говорите по-английски, что девушка очень красивая, это не то же самое, что когда вы говорите, что моя девушка красивая.

Вот список POS:

Список POS

person SlaimanK    schedule 01.08.2017