Я работаю над поисковой системой на естественном языке для CDS Страсбурга. (Центр астрономических данных Страсбурга)
Мне было интересно, как Стэнфордский тегировщик частей речи помечает аббревиатуры, поскольку аббревиатура иногда помечается как NNP, а иногда помечается как NN.
Я не смог точно определить, как программа решает, является ли аббревиатура, такая как «CDS» или «NASA», NNP или NN.
Если кто-то может помочь мне по теме, я буду очень рад. :)
Хорошего дня.