Вопросы по теме 'sentence'

RegEx для соответствия конкретному предложению, а также дате и времени
Я попытался выяснить, как заставить регулярное выражение соответствовать чему-то конкретному после даты и времени. Я не могу для жизни меня понять это! Я хочу сопоставить следующее предложение, где дата и время, конечно, могут быть случайными:...
436 просмотров
schedule 05.08.2023

Подсчет предложений, только предложения, заканчивающиеся знаками препинания + 2 пробела
Я пытаюсь понять, как сделать счетчик предложений, который у меня есть, но дело в том, что мне нужно, чтобы он подсчитывал предложение ТОЛЬКО тогда, когда после точки/вопросительного знака/и т. д. идут два пробела. Например, с кодом, который у меня...
1479 просмотров
schedule 20.09.2022

N-граммы из предложения [Lucene 4.9]
Я пытаюсь реализовать пример, который может генерировать n граммов из предложения (тот же вопрос задан здесь Генерация N-грамм из предложения ) с помощью последней версии Lucene (Lucene 4.9). Я нашел несколько примеров, но сделанных с предыдущими...
498 просмотров
schedule 23.09.2022

Подсчитать количество предложений Ruby
Мне довелось искать повсюду, и мне не удалось найти решение для подсчета количества предложений в строке с использованием Ruby. Кто-нибудь как это сделать? Пример string = "The best things in an artist’s work are so much a matter of intuition,...
2589 просмотров
schedule 06.07.2023

Пример обучения предложений OpenNLP
Я пытаюсь использовать официальный пример руководства на веб-сайте OpenNLP для обучения новой модели, вот пример: Charset charset = Charset.forName("UTF-8"); ObjectStream lineStream = new PlainTextByLineStream(new...
1238 просмотров
schedule 14.07.2023

Выбор подсписка из списка списков после использования Sentence Tokenizer
Итак, у меня есть несколько предложений в списке, например: some_list = ['Joe is travelling via train.' 'Joe waited for the train, but the train was late.' 'Even after an hour, there was no sign of the...
70 просмотров
schedule 16.01.2023

Java Regex для определения конца предложения, НО игнорировать (число) (период), например. 15
Попытка найти хорошее регулярное выражение для определения конца предложения в java. Основная проблема заключается в том, что если есть число, а затем точка, он определяет его как конец предложения (см. Демонстрационную ссылку). Но в моем случае я...
54 просмотров
schedule 13.03.2023

количество токенизированных предложений не соответствует количеству предложений в тексте
У меня есть некоторые проблемы с функцией nltk.sent_tokenize . Мой текст (который я хочу токенизировать) состоит из 54116 предложений, разделенных точкой. Я удалил другие знаки препинания. Я хочу маркировать свой текст на уровне предложения с...
22 просмотров
schedule 25.04.2024

Слова без гласных [дубликаты]
В этом коде в основном я пытаюсь посчитать те слова в этом предложении, в которых нет гласной, но есть что-то (а может и все) что я делаю не так, вот код par="zyz how are you" count=0 for i in range(len(par)): if par[i]=="...
52 просмотров
schedule 04.01.2023