Вопросы по теме 'pos-tagger'

что такое вывод MeCab и набор тегов?
Может ли кто-нибудь просветить меня по поводу вывода MeCab по умолчанию? какая аннотация выводит MeCab и где я могу найти набор тегов для морфо-анализатора http://mecab.sourceforge.net/ кто-нибудь может расшифровать этот вывод от MeCab?...
1727 просмотров
schedule 23.06.2023

Как использовать Regexp Tagger в nltk?
Если я попробую этот код: import nltk pattern = [(r'(March)$','MAR')] tagger=nltk.RegexpTagger(pattern) print tagger.tag('He was born in March 1991') Я получаю вывод likr: [('H', Нет), ('e', Нет), (' ', Нет), ('w', Нет), ('a', Нет),...
3379 просмотров
schedule 06.06.2023

Учебный корпус для Brill Tagger на других языках, кроме английского
Кто-нибудь знает какой-нибудь тегированный корпус или лексикон для использования тега Brill Part-of-Speech (POS) на других языках, кроме английского? Спасибо!
1588 просмотров
schedule 18.09.2022

Распознавание именованных объектов: как пометить обучающий набор и выбрать алгоритм?
Для текста, содержащего названия компаний, я хочу обучить модель, которая автоматически помечает подрядчиков (компания, выполняющая задачу) и руководителей (компания, нанимающая подрядчика). Примером предложения может быть: Blossom Inc....
2681 просмотров

Пользовательские теги NER и POS
Я проверял Stanford CoreNLP, чтобы понять теги NER и POS. Но что, если я хочу создать собственные теги для таких сущностей, как <title>Nights</title>, <genre>Jazz</genre>, <year>1992</year> . Как я могу это...
2224 просмотров

Как отделить POS от слов
Необходимо создать текстовую разреженную матрицу (DTM) для классификации. Чтобы подготовить текст, сначала мне нужно удалить (отделить) POS-теги от текста. Мое предположение состояло в том, чтобы сделать это, как показано ниже. Я новичок в R и не...
89 просмотров
schedule 06.02.2023

Существуют ли глубокие синтаксические анализаторы с открытым исходным кодом для английского языка, которые принимают «токены, POS-теги» в качестве входных данных и создают дерево синтаксического анализа?
Мне интересно, есть ли вероятностные глубокие синтаксические анализаторы с открытым исходным кодом для английского языка, которые принимают в качестве входных данных последовательность токенов и соответствующих им частей речи (теги POS) и создают...
216 просмотров

startProbability в скрытых марковских моделях
Как рассчитать startProbabilitise в скрытой марковской модели для POS-тегов? это означает: (# повторений одного тега)/(# повторений всех тегов)? или (количество предложений, начинающихся с одного тега)/(все предложения)? если нет, то что?
105 просмотров

Как взять суффикс при сглаживании тегов частей речи
Я делаю "Часть речи Tagger". Я обрабатываю неизвестное слово с суффиксом. Но главная проблема заключается в том, как бы я определил количество суффиксов... должно ли оно быть заранее определено (например, подход Вайшеделя) или мне нужно взять...
189 просмотров
schedule 07.07.2022

Извлечь именную фразу, используя Stanford NLP
Я пытаюсь найти фразу «Тема/существительное» в предложении, используя Стэнфордский НЛП. Например: предложение «белый тигр», которое я хотел бы получить Тема/сочетание как: белый тигр. Для этого я использовал pos tagger. Мой пример кода ниже....
4086 просмотров

Стэнфордское НЛП: арабская часть ярлыков речи?
Я хочу знать значение меток, которые теггер части речи арабский (версия 2015.1.30) ставит для каждого слова. как المدرسة / DTNN, я знаю, что он отличается от английских меток. Я искал их веб-сайт и документацию, но ничего не нашел относительно...
823 просмотров
schedule 07.08.2023

Применить функцию с кадром данных pandas - время вычисления POS-тегера
Я очень запутался в функции применения для панд. У меня есть большой фрейм данных, где один столбец представляет собой столбец строк. Затем я использую функцию для подсчета вхождений частей речи. Я просто не уверен, как настроить мой оператор...
587 просмотров
schedule 04.01.2023

Как использовать POS-теги Stanford CoreNLP для получения синсетов из WordNet?
Я работаю с Java в Eclipse и Stanford CoreNLP. Я хочу знать, как использовать теги POS, сгенерированные Stanford CoreNLP, для извлечения синсетов слов с тегами из WordNet. (Я токенизировал предложение перед POS-тегированием) Поскольку WordNet...
848 просмотров
schedule 15.12.2022

ошибка пути для тега дерева с пакетом koRPus R
Я пытаюсь использовать treeTagger, который установил здесь в R с пакетом koRpus. library(koRpus) tagged.results <- treetag(as.factor("salut ça va"), treetagger="manual", lang="fr",...
1762 просмотров
schedule 27.07.2022

сопоставить тег POS и последовательность слов
У меня есть следующие две строки с их тегами POS: Sent1 : " что-то вроде того, как работает писатель или фразеологизм, было бы действительно здорово ". [('что-то', 'NN'), ('нравится', 'IN'), ('как', 'WRB'), ('писатель', 'NN'), ('профи',...
2377 просмотров
schedule 21.11.2023

Проблема POS Tagger для существительных в единственном и множественном числе
ввод текста: мне всегда нравятся горячие яйца вывод [('i', 'NN'), ('всегда', 'RB'), ('лайк', 'IN'), ('hot', 'JJ'), («Яйца», «ННП»)] согласно почтовому тегу PTB NNP является единственным, но почему в этом случае он дает NNP , а почему не NNS
171 просмотров
schedule 13.01.2023

StanfordPOSTagger не работает с NLTK
У меня возникли проблемы с тем, чтобы последний StanfordPOSTagger работал в python 2.7.1 с NLTK 3.2.1 на Mac с установленной Java 8. Я нашел несколько других тем с очень похожими проблемами, но ни одно из решений не сработало для меня. Ниже приведен...
489 просмотров

Где в коде CoreNLP на самом деле представлены сами символы части речи Penn Treebank?
Я специально ищу какую-то структуру данных, перечисление или генеративный процесс, посредством которого различные части речи представляются внутри. Я потратил много времени на сканирование Javadoc и исходного кода и не могу найти то, что ищу. Я...
185 просмотров
schedule 26.08.2022

Ошибка StanfordCoreNLP: такой обученный файл конфигурации тегера не найден
Я использую библиотеку StanfordCoreNLP (stanford-corenlp.jar) и получаю сообщение об ошибке при выполнении следующих строк кода. protected StanfordCoreNLP pipeline; public LemmatizerHelper() { Properties props; props = new Properties();...
633 просмотров
schedule 08.12.2022

Определение имен собственных в аббревиатурах с помощью POS Tagger
Я работаю над поисковой системой на естественном языке для CDS Страсбурга. (Центр астрономических данных Страсбурга) Мне было интересно, как Стэнфордский тегировщик частей речи помечает аббревиатуры, поскольку аббревиатура иногда помечается как...
130 просмотров