У меня есть таблица со статистикой описания (значения для a, b и c) по типу
### stats
type <- c("a","b","c","d","e","f","g","h","i","j","k","l")
mean_a <- c(0,1,1,0,2,2,0,4,4,0,5,5)
mean_b<- c(4,7,8,0,3,10,5,4,7,0,1,6)
mean_c<- c(1,2,0,3,4,5,1,24,3,0,4,5)
stats <- data.frame(type, mean_a, mean_b, mean_c)
У меня есть набор данных с наблюдениями за образцом для параметров a, b и c. Каждый из экземпляров имеет определенный тип
# data
Id <- c("ted","bert","test","john","elf","fea","goul","houl","ili","jok","ko","lol")
type <- c("a","a","b","d","f","f","c","d","a","b","k","l")
a <- c(2,1,3,2,1,2,0,1,2,1,5,5)
b<- c(1,3,4,7,5,4,5,6,5,0,1,6)
c<- c(3,5,2,6,8,5,1,5,3,1,6,6)
data <- data.frame(Id, type, a, b, c )
Следуя этим двум таблицам, я хотел бы получить от data
образец, наиболее представительный для типа, согласно статистике в stats
. Наиболее репрезентативным я хотел бы получить тот, у которого значения a, b и c наиболее близки к их соответствующим средним значениям.
Я не могу найти в Интернете идеи, соответствующие трем средним значениям (а, б и в). Помощь приветствуется! Требуемый результат (но не уверен, что ted, test и john ближе всего к средним значениям для типов a, b и c):
# output wanted
Id <- c("ted","test","john")
type <- c("a","b","c")
a <- c(2,3,2)
b<- c(1,4,7)
c<- c(3,2,6)
data2 <- data.frame(Id, type, a, b, c )