У меня есть список из 6 в data.frame
Он имеет 3 столбца:
идентификатор, T_C, продажи
T_C - ТЕСТ или КОНТРОЛЬ
Кто-то помог мне здесь, и я научился находить mean() и sd() с помощью цикла, а не делать отдельные операторы.
Теперь моя цель - удалить выбросы из 6 списков и создать список из 6 (после удаления выбросов).
str(dfList) # это список из 6 в data.frames
Я могу получить среднее значение() и sd() каждого списка следующим образом:
list_mean_sd <- lapply(dfList,
function(df)
{
df %>%
group_by(TC_INDICATOR) %>%
summarise(mean = mean(NET_SPEND),
sd = sd(NET_SPEND))
})
> str(list_mean_sd)
List of 6 (1 obs. of 2 variables:)
Я могу выбрать их по отдельности для среднего или sd:
sapply(list_mean_sd, "[", "mean")
sapply(list_mean_sd, "[", "sd")
В основном, моя цель состоит в том, чтобы определить выбросы и удалить их, создать альтернативный набор или последующий набор.
**outliers are: mean - 3*sd() or mean + 3*sd()
Я сделал это, но с большим количеством ручных шагов, чтобы научиться перебирать эти наборы и тому подобное, заранее спасибо за помощь!