Вопросы по теме 'part-of-speech'

Маркировка части речи и распознавание именованных сущностей для C/C++/Obj-C
нужна помощь! Я пытаюсь написать некоторый код в Objective-C, который требует маркировки части речи и, в идеале, также именованного распознавания сущностей. Я не очень заинтересован в том, чтобы «сворачивать свои собственные», поэтому я ищу...
1889 просмотров

Как извлечь номера строк, соответствующие регулярному выражению в текстовом файле
Я делаю проект по статистическому машинному переводу, в котором мне нужно извлечь номера строк из текстового файла с POS-тегами, которые соответствуют регулярному выражению (любому неразделенному фразовому глаголу с частицей «out»), и записать номера...
10056 просмотров
schedule 21.07.2022

Учебный корпус для Brill Tagger на других языках, кроме английского
Кто-нибудь знает какой-нибудь тегированный корпус или лексикон для использования тега Brill Part-of-Speech (POS) на других языках, кроме английского? Спасибо!
1588 просмотров
schedule 18.09.2022

группировка всех именованных объектов в документе
Я хотел бы сгруппировать все именованные объекты в данном документе. Например, **Barack Hussein Obama** II is the 44th and current President of the United States, and the first African American to hold the office. Я не хочу использовать...
1584 просмотров

Существуют ли глубокие синтаксические анализаторы с открытым исходным кодом для английского языка, которые принимают «токены, POS-теги» в качестве входных данных и создают дерево синтаксического анализа?
Мне интересно, есть ли вероятностные глубокие синтаксические анализаторы с открытым исходным кодом для английского языка, которые принимают в качестве входных данных последовательность токенов и соответствующих им частей речи (теги POS) и создают...
216 просмотров

Часть речевого тегирования в OpenNLP по сравнению со StanfordNLP
Я новичок в тэгинге речи (pos), и я использую тэг pos для текстового документа. Я подумываю использовать для этого OpenNLP или StanfordNLP. Для StanfordNLP я использую MaxentTagger и использую english-left3words-distsim.tagger для его...
507 просмотров
schedule 09.03.2023

У Stanford NLP POS Tagger есть проблемы с очень простыми фразами?
Я нашел примеры непоследовательного поведения в своем приложении с использованием Stanford NLP Parser / POS Tagger, и я смог воспроизвести его в Интернете http://nlp.stanford.edu:8080/corenlp/process . Я использую версию 3.60: Вот 3 проблемы,...
803 просмотров

Тег Python NLTK PoS неточен
Я несколько дней пытался улучшить POS-тегер на NLTK, но не могу понять. Прямо сейчас теггер по умолчанию действительно неточен и помечает большинство слов как «NN». Как я могу улучшить теггер, чтобы сделать его более точным? Я уже искал обучение...
872 просмотров

Определение имен собственных в аббревиатурах с помощью POS Tagger
Я работаю над поисковой системой на естественном языке для CDS Страсбурга. (Центр астрономических данных Страсбурга) Мне было интересно, как Стэнфордский тегировщик частей речи помечает аббревиатуры, поскольку аббревиатура иногда помечается как...
130 просмотров

Нахождение отношений между местоимениями и существительными в предложениях
Я работаю над проектом НЛП, и мне нужна следующая функциональность, проиллюстрированная примером. Скажи, что есть предложение Скажите Сэму, что ему придется уйти без Артура, так как он болен. В этом заявлении первый he должен быть...
1591 просмотров
schedule 28.01.2023

Как сделать POS-теги для биграмм в Python
Во-первых, я должен признать, что я новичок в Python или R. Здесь я пытаюсь создать файл со списком биграмм / 2-грамм вместе с их POS-тегами (NN, VB и т. Д.). Это используется для легкой идентификации значимых биграмм и их комбинаций тегов POS....
2817 просмотров
schedule 09.10.2022

Как передать часть речи в WordNetLemmatizer?
Я предварительно обрабатываю текстовые данные. Однако я столкнулся с проблемой лемматизации. Ниже приведен образец текста: «В четверг 18-летний мальчик был передан в прокуратуру за предполагаемую кражу криптовалюты на сумму около 15 миллионов...
71 просмотров

Счетчик для возврата нулевого значения, если тег части речи отсутствует
В настоящее время я пытаюсь подсчитать случаи, когда определенная часть речи встречается в данном онлайн-обзоре. Хотя я могу получить определенные теги, соответствующие каждому слову, и подсчитать эти экземпляры, я сталкиваюсь с трудностями при...
48 просмотров
schedule 11.07.2022

Как выполнить лемматизацию с помощью NLTK или pywsd
Я знаю, что мое объяснение довольно длинное, но я счел его необходимым. Надеюсь, кто-то терпелив и готов помочь :) Я занимаюсь проектом анализа настроений, и я застрял в части предварительной обработки. Я сделал импорт CSV-файла, превратил его в...
275 просмотров