скажем, у меня есть тегированный корпус (например, коричневый корпус), и я хочу извлечь слова, которые помечены только «/ nn». Например :
Daniel/np termed/vbd ``/`` extremely/rb conservative/jj ''/'' his/pp$ estimate/nn.....
это часть помеченного корпуса «коричневый». что я хочу сделать, так это извлечь слова, например, оценка (поскольку они помечены /nn) и добавить их в список. Но большинство примеров, которые я нашел, обычно касаются тегов корпуса. Я действительно запутался, увидев эти примеры. Может ли кто-нибудь помочь мне, предоставив пример или руководство по извлечению слов из помеченного корпуса.
Заранее спасибо.