Вопросы по теме 'fuzzyjoin'

Нечеткое логическое соединение с использованием двух столбцов
Я использую пакет r fuzzyjoin для объединения двух наборов данных. В настоящее время я присоединяюсь к одному столбцу и хотел бы присоединиться по двое. первый набор данных имеет имя местоположения и столбец с именем config второй набор...
1346 просмотров
schedule 13.11.2022

нечеткое соединение с перестановками в строках
Я использую fuzzyjoin для пересечения политиков и их регионов: library(dplyr) library(fuzzyjoin) x <- tibble(name = c("Fulvio Rossi Ciocca", "Rigoberto Del Carmen Rojas Sarapura", "Lorena Vergara Bravo", "Lily Perez San Martin"),...
433 просмотров
schedule 04.07.2023

Сравнение каждой строки из одного фрейма данных с каждой строкой другого в тидиверсе
Мне нужно сравнить каждую строку из одного фрейма данных с каждой строкой другого: id first_name last_name account_nr amount currency comment 1 wW3A4QgpQQd Lynnett Labadini ES46 2569 1625 6669 5490...
76 просмотров
schedule 05.11.2022

Как присоединить данные о местоположении (широта, долгота)
У меня есть набор данных, один с некоторым местоположением (широта, долгота), это тест, а другой с информацией о широте и долготе всех почтовых индексов в Нью-Йорке, это test2. test <- structure(list(trip_count = 1:10, dropoff_longitude =...
65 просмотров
schedule 28.04.2022

Ограничение количества сравнений нечетких строк путем сравнения по подгруппе
У меня есть два следующих набора данных: DT1 <- structure(list(Province = c(1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3), Year = c(2000, 2000, 2000, 2001, 2001, 2001, 2002, 2002, 2002, 2000, 2000, 2000,...
91 просмотров

группировка двух кадров данных и зацикливание с помощью stringdist_join
Я хочу провести нечеткое сопоставление американских округов по десятилетиям, используя stringdist_join. Поскольку названия округов меняются с течением времени, я хочу, чтобы каждое десятилетие соответствовало правильному названию округа. Если я...
19 просмотров
schedule 16.04.2022

Как сопоставить один нечеткий и один точный столбцы data.table с помощью StringDist
Мне нужно найти лучшее совпадение / слияние базы данных со словарем. Основываясь на информации, которую я получил здесь , я смог найти решение ниже: dt <- fread(c(" id ; value a1 ; aaaa a1 ; aaa...
20 просмотров
schedule 19.02.2023