Вопросы по теме 'part-of-speech'
Маркировка части речи и распознавание именованных сущностей для C/C++/Obj-C
нужна помощь!
Я пытаюсь написать некоторый код в Objective-C, который требует маркировки части речи и, в идеале, также именованного распознавания сущностей. Я не очень заинтересован в том, чтобы «сворачивать свои собственные», поэтому я ищу...
1889 просмотров
schedule
12.07.2023
Как извлечь номера строк, соответствующие регулярному выражению в текстовом файле
Я делаю проект по статистическому машинному переводу, в котором мне нужно извлечь номера строк из текстового файла с POS-тегами, которые соответствуют регулярному выражению (любому неразделенному фразовому глаголу с частицей «out»), и записать номера...
10056 просмотров
schedule
21.07.2022
Учебный корпус для Brill Tagger на других языках, кроме английского
Кто-нибудь знает какой-нибудь тегированный корпус или лексикон для использования тега Brill Part-of-Speech (POS) на других языках, кроме английского?
Спасибо!
1588 просмотров
schedule
18.09.2022
группировка всех именованных объектов в документе
Я хотел бы сгруппировать все именованные объекты в данном документе. Например,
**Barack Hussein Obama** II is the 44th and current President of the United States, and the first African American to hold the office.
Я не хочу использовать...
1584 просмотров
schedule
06.07.2022
Существуют ли глубокие синтаксические анализаторы с открытым исходным кодом для английского языка, которые принимают «токены, POS-теги» в качестве входных данных и создают дерево синтаксического анализа?
Мне интересно, есть ли вероятностные глубокие синтаксические анализаторы с открытым исходным кодом для английского языка, которые принимают в качестве входных данных последовательность токенов и соответствующих им частей речи (теги POS) и создают...
216 просмотров
schedule
15.01.2023
Часть речевого тегирования в OpenNLP по сравнению со StanfordNLP
Я новичок в тэгинге речи (pos), и я использую тэг pos для текстового документа. Я подумываю использовать для этого OpenNLP или StanfordNLP. Для StanfordNLP я использую MaxentTagger и использую english-left3words-distsim.tagger для его...
507 просмотров
schedule
09.03.2023
У Stanford NLP POS Tagger есть проблемы с очень простыми фразами?
Я нашел примеры непоследовательного поведения в своем приложении с использованием Stanford NLP Parser / POS Tagger, и я смог воспроизвести его в Интернете http://nlp.stanford.edu:8080/corenlp/process . Я использую версию 3.60:
Вот 3 проблемы,...
803 просмотров
schedule
03.05.2022
Тег Python NLTK PoS неточен
Я несколько дней пытался улучшить POS-тегер на NLTK, но не могу понять. Прямо сейчас теггер по умолчанию действительно неточен и помечает большинство слов как «NN». Как я могу улучшить теггер, чтобы сделать его более точным? Я уже искал обучение...
872 просмотров
schedule
30.06.2022
Определение имен собственных в аббревиатурах с помощью POS Tagger
Я работаю над поисковой системой на естественном языке для CDS Страсбурга. (Центр астрономических данных Страсбурга)
Мне было интересно, как Стэнфордский тегировщик частей речи помечает аббревиатуры, поскольку аббревиатура иногда помечается как...
130 просмотров
schedule
02.06.2022
Нахождение отношений между местоимениями и существительными в предложениях
Я работаю над проектом НЛП, и мне нужна следующая функциональность, проиллюстрированная примером. Скажи, что есть предложение
Скажите Сэму, что ему придется уйти без Артура, так как он болен.
В этом заявлении первый he должен быть...
1591 просмотров
schedule
28.01.2023
Как сделать POS-теги для биграмм в Python
Во-первых, я должен признать, что я новичок в Python или R.
Здесь я пытаюсь создать файл со списком биграмм / 2-грамм вместе с их POS-тегами (NN, VB и т. Д.). Это используется для легкой идентификации значимых биграмм и их комбинаций тегов POS....
2817 просмотров
schedule
09.10.2022
Как передать часть речи в WordNetLemmatizer?
Я предварительно обрабатываю текстовые данные. Однако я столкнулся с проблемой лемматизации. Ниже приведен образец текста:
«В четверг 18-летний мальчик был передан в прокуратуру за предполагаемую кражу криптовалюты на сумму около 15 миллионов...
71 просмотров
schedule
06.12.2022
Счетчик для возврата нулевого значения, если тег части речи отсутствует
В настоящее время я пытаюсь подсчитать случаи, когда определенная часть речи встречается в данном онлайн-обзоре. Хотя я могу получить определенные теги, соответствующие каждому слову, и подсчитать эти экземпляры, я сталкиваюсь с трудностями при...
48 просмотров
schedule
11.07.2022
Как выполнить лемматизацию с помощью NLTK или pywsd
Я знаю, что мое объяснение довольно длинное, но я счел его необходимым. Надеюсь, кто-то терпелив и готов помочь :) Я занимаюсь проектом анализа настроений, и я застрял в части предварительной обработки. Я сделал импорт CSV-файла, превратил его в...
275 просмотров
schedule
16.03.2023