Вопросы по теме 'fuzzy-comparison'

Lucene.net Нечеткий поиск фраз
Я пробовал это сам в течение значительного периода времени и искал повсюду в сети, но не смог найти НИКАКИХ примеров поиска нечеткой фразы через Lucene.NET 2.9.2. (С#) Может ли кто-нибудь посоветовать, как это сделать подробно, и/или предоставить...
3961 просмотров

Как нормализовать названия компаний
У нас есть сгенерированные пользователем имена работодателей во всех вариациях. Например, люди ввели или импортировали: Google Google, Inc. Google Inc. Google Inc. Для поиска в базе данных это выглядит как другая компания. Мы изменили...
1878 просмотров
schedule 15.09.2022

Лучшая производительность нечеткого сопоставления?
В настоящее время я использую метод get_close_matches из difflib для перебора списка из 15 000 строк, чтобы получить наиболее близкое совпадение с другим списком примерно из 15 000 строк: a=['blah','pie','apple'...] b=['jimbo','zomg','pie'...]...
5572 просмотров

R: Хотите проверить словарь и удалить ненужный пробел между ними, где удаление пробела сделает это слово правильным.
Я использую R для интеллектуального анализа текста и имею данные, которые были объединены из разных текстовых столбцов. Бывают случаи, когда слова разделяются пробелом, например «функция». Я хочу обнаружить все такие случаи и удалить пробел между...
331 просмотров
schedule 06.02.2023

Как создать группы похожих по звучанию имен в R?
Я хотел бы создать групповые переменные на основе того, насколько похож выбор имен. Я начал с использования пакета stringdist для создания меры расстояния. Но я не уверен, как использовать эту выходную информацию для создания группы по переменной....
1707 просмотров
schedule 21.02.2024

нечеткое сопоставление регулярных выражений в julia
Есть ли способ выполнить нечеткое сопоставление регулярных выражений в Джулии? Я построил следующий тест регулярного выражения: toMatch = Regex(word,"i") ismatch(toMatch,input_string) Я хотел бы иметь возможность выполнить этот тест, но...
523 просмотров
schedule 02.06.2023

Нечеткое соответствие ключевому слову в большей строке — SAS
Используя SAS, у меня есть таблица с предложениями, и я ищу строки в таблице, где ключевое слово находится в предложении с использованием нечеткого соответствия ( complev function ). Есть ли способ в SAS найти строку ключевого слова в предложениях?...
139 просмотров
schedule 16.10.2023

Ограничение количества сравнений нечетких строк путем сравнения по подгруппе
У меня есть два следующих набора данных: DT1 <- structure(list(Province = c(1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3), Year = c(2000, 2000, 2000, 2001, 2001, 2001, 2002, 2002, 2002, 2000, 2000, 2000,...
91 просмотров

Нечеткое сопоставление в R; сопоставление идентификаторов пользователей и добавление префикса к совпадающим идентификаторам пользователей
Я выполняю вторичный анализ данных в наборе данных журнала, созданном пользователем, и я заметил, что для одного пользователя существует 2 разных идентификатора пользователя; главное отличие в том, что перед дублирующимся идентификатором стоит...
20 просмотров
schedule 21.12.2022