Вопросы по теме 'fuzzy-comparison'
Lucene.net Нечеткий поиск фраз
Я пробовал это сам в течение значительного периода времени и искал повсюду в сети, но не смог найти НИКАКИХ примеров поиска нечеткой фразы через Lucene.NET 2.9.2. (С#)
Может ли кто-нибудь посоветовать, как это сделать подробно, и/или предоставить...
3961 просмотров
schedule
11.12.2022
Как нормализовать названия компаний
У нас есть сгенерированные пользователем имена работодателей во всех вариациях. Например, люди ввели или импортировали:
Google Google, Inc. Google Inc. Google Inc.
Для поиска в базе данных это выглядит как другая компания. Мы изменили...
1878 просмотров
schedule
15.09.2022
Лучшая производительность нечеткого сопоставления?
В настоящее время я использую метод get_close_matches из difflib для перебора списка из 15 000 строк, чтобы получить наиболее близкое совпадение с другим списком примерно из 15 000 строк:
a=['blah','pie','apple'...]
b=['jimbo','zomg','pie'...]...
5572 просмотров
schedule
01.02.2023
R: Хотите проверить словарь и удалить ненужный пробел между ними, где удаление пробела сделает это слово правильным.
Я использую R для интеллектуального анализа текста и имею данные, которые были объединены из разных текстовых столбцов. Бывают случаи, когда слова разделяются пробелом, например «функция». Я хочу обнаружить все такие случаи и удалить пробел между...
331 просмотров
schedule
06.02.2023
Как создать группы похожих по звучанию имен в R?
Я хотел бы создать групповые переменные на основе того, насколько похож выбор имен. Я начал с использования пакета stringdist для создания меры расстояния. Но я не уверен, как использовать эту выходную информацию для создания группы по переменной....
1707 просмотров
schedule
21.02.2024
нечеткое сопоставление регулярных выражений в julia
Есть ли способ выполнить нечеткое сопоставление регулярных выражений в Джулии?
Я построил следующий тест регулярного выражения:
toMatch = Regex(word,"i")
ismatch(toMatch,input_string)
Я хотел бы иметь возможность выполнить этот тест, но...
523 просмотров
schedule
02.06.2023
Нечеткое соответствие ключевому слову в большей строке — SAS
Используя SAS, у меня есть таблица с предложениями, и я ищу строки в таблице, где ключевое слово находится в предложении с использованием нечеткого соответствия ( complev function ). Есть ли способ в SAS найти строку ключевого слова в предложениях?...
139 просмотров
schedule
16.10.2023
Ограничение количества сравнений нечетких строк путем сравнения по подгруппе
У меня есть два следующих набора данных:
DT1 <- structure(list(Province = c(1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2,
2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3), Year = c(2000,
2000, 2000, 2001, 2001, 2001, 2002, 2002, 2002, 2000, 2000, 2000,...
91 просмотров
schedule
08.09.2022
Нечеткое сопоставление в R; сопоставление идентификаторов пользователей и добавление префикса к совпадающим идентификаторам пользователей
Я выполняю вторичный анализ данных в наборе данных журнала, созданном пользователем, и я заметил, что для одного пользователя существует 2 разных идентификатора пользователя; главное отличие в том, что перед дублирующимся идентификатором стоит...
20 просмотров
schedule
21.12.2022