Вопросы по теме 'words'

Списки слов для множества статей - матрица документов и терминов
У меня почти 150 тысяч статей на турецком языке. Я буду использовать статьи для исследования обработки естественного языка. Я хочу хранить слова и их частоту в статье после обработки статей. Я храню их в RDBS сейчас. У меня есть 3 таблицы:...
580 просмотров

Как загрузить файл со словами в список, где в файле более 3 миллионов строк
Можно ли загрузить файл с 3 или 4 миллионами строк менее чем за 1 секунду (1.000000)? В одной строке содержится одно слово. Слова могут иметь длину от 1 до 17 (это имеет значение?). Мой код сейчас: List<string> LoadDictionary(string...
734 просмотров
schedule 22.10.2022

Php проверяет, содержит ли строка несколько слов
Я искал в Интернете что-то, что будет делать это, но это будет работать только с одним словом. Я пытаюсь создать скрипт, который обнаружит неправильное имя пользователя для моего сайта, неправильное имя пользователя будет обнаружено, если имя...
16909 просмотров
schedule 29.04.2023

Aspose.Words, охватывающий страницы с таблицей C# MVC3
У меня есть веб-приложение MVC3 С#.Net. Мы используем Aspose.Words для экспорта наших данных в текстовый документ. Одним из элементов, создаваемых в документе, является сводная таблица трудозатрат. Эта таблица начинается в середине страницы...
1059 просмотров
schedule 27.05.2022

Фильтр стоп-слов Java Lucene
У меня есть около 500 предложений, в которых я хотел бы составить набор нграмм. У меня возникли проблемы с удалением стоп-слов. Я попытался добавить lucene StandardFilter и StopFilter, но у меня все та же проблема. Вот мой код: for(String curS:...
6302 просмотров
schedule 19.06.2022

Регулярное выражение удаляет определенные слова в любом порядке
Я хочу заменить (удалить) определенные необязательные слова (AAA, BBB, CCC), которые находятся в любом порядке непосредственно перед и после определенного слова (ALWAYS_THERE) this is important AAA BBB ALWAYS_THERE CCC this is important BBB AAA...
5873 просмотров
schedule 22.11.2023

Internet Explorer 11 продолжает разбивать слова
Internet Explorer продолжает разбивать мои слова. Хром и Файрфокс работают нормально. Вот мой код и ссылка на сайт: http://www.hgsainc.com/about/ Спасибо за помощь! .page #main .entry-content { width: 100%; padding-right: 0;...
3356 просмотров
schedule 14.10.2022

как посчитать количество слов в строке
Я довольно новичок в java. Я хочу подсчитать количество слов в определенной строке. Пока я могу только считать слова, но не знаю, как считать вхождения. Есть ли простой способ сделать это? Scanner file = new Scanner(new...
1242 просмотров
schedule 13.08.2022

Подсчет предложений, только предложения, заканчивающиеся знаками препинания + 2 пробела
Я пытаюсь понять, как сделать счетчик предложений, который у меня есть, но дело в том, что мне нужно, чтобы он подсчитывал предложение ТОЛЬКО тогда, когда после точки/вопросительного знака/и т. д. идут два пробела. Например, с кодом, который у меня...
1479 просмотров
schedule 20.09.2022

Получить термины, присутствующие в документе с коллекцией
Я разрабатываю функцию для поиска терминов в документе. В параметре моей функции я даю HashSet из String . Я просматриваю HashSet для анализа каждой строки (с помощью класса Lucene Analyzer), затем ищу проанализированную строку в тексте с...
63 просмотров
schedule 22.11.2022

Прочитайте текстовый файл и найдите определенные слова в списке ключевых слов.
Я новичок в Python и пытаюсь создать скрипт, в котором я импортирую text_file_1, содержащий текст. Я хочу, чтобы сценарий читал основной текст и искал определенные слова, которые я определил в списке под названием (key_words), который содержит слова...
13353 просмотров
schedule 19.03.2024

Хеш-таблица на C (найдите частоту каждого слова)
Я хочу создать хеш-таблицу для упражнения, которое я должен отправить в свой университет. Программа откроет несколько файлов, разделит содержимое каждого файла на <<words>> (токены) и сохранит каждый <<word>> в хеш-таблице...
4026 просмотров
schedule 14.05.2022

Найдите семантически похожее слово для обработки естественного языка
Я работаю над проектом обработки естественного языка на Java. У меня есть требование, в котором я хочу идентифицировать слова, принадлежащие к аналогичным семантическим группам. например : если встречаются такие слова, как study , university ,...
1059 просмотров
schedule 25.08.2022

Слова, отсортированные по частоте, в книге (файл .txt)
Я использую: from collections import Counter wordlist = open('mybook.txt','r').read().split() c = Counter(wordlist) print c # result : # Counter({'the': 9530, 'to': 5004, 'a': 4203, 'and': 4202, 'was': 4197, 'of': 3912, 'I': 2852, 'that': 2574,...
360 просмотров
schedule 13.04.2023

itextsharp: слова разбиваются при разделении textchunk на слова
Я хочу выделить несколько ключевых слов в наборе файлов PDF. Во-первых, мы должны определить отдельные слова и сопоставить их с моими ключевыми словами. Я нашел пример: class MyLocationTextExtractionStrategy : LocationTextExtractionStrategy {...
707 просмотров
schedule 08.08.2023

ограничения myhdl, связывающие несколько выводов с переменной
Я буду использовать iCE40HX8K. учитывая файл ограничений оценочных плат set_io LED3 A2 set_io LED7 B3 ... etc как лучше всего объединить все 8 светодиодов в одну переменную. У меня были проблемы с ассоциацией вещей с моим файлом...
54 просмотров
schedule 18.12.2022

Как проверить одинаковые слова в двух разных списках?
Как я могу проверить наличие одинаковых слов в двух разных списках, если слова имеют разные строчные и прописные буквы? Я написал это: current_users=["michael", "peta", "jennifer", "clark", "tony"] new_users=["jeffry", "PETA", "shuff", "TOny",...
190 просмотров
schedule 06.01.2024

как сгенерировать строку букв на основе некоторых параметров
У меня есть набор предложений с разным количеством слов в каждом предложении. Мне нужно заменить каждое слово строкой букв, но строка букв должна основываться на определенных критериях. Например, букву «т» можно заменить только буквами «и», «л»,...
66 просмотров
schedule 29.09.2022

Один и тот же ввод 2 разных результата
Я очень новичок в программировании, и я надеюсь, что кто-то может мне помочь. Я пытаюсь создать игру, в которой 2 игрока должны вводить слова на основе двух последних букв слова, в которое вставил другой игрок. У меня работает эта часть, но я не...
106 просмотров
schedule 20.12.2022

Postgres word_similarity не сравнивает слова
"Возвращает число, указывающее, насколько первая строка похожа на наиболее похожее слово второй строки. Функция ищет во второй строке наиболее похожее слово, а не наиболее похожую подстроку. Диапазон результата равен нулю (что указывает на то, что два...
3080 просмотров
schedule 25.02.2023