Я хотел бы иметь возможность создать логическую переменную, которая указывает для конкретной категории, суммируются ли подсчеты набора строк подгруппы (т. е. A, B, C в переменной «группа») с тем же значением, что и мой «Все» / общие строки группы.
Мои данные выглядят так:
group = c("All", "A", "B", "C", "All", "A", "B", "C")
category = c("music", "music", "music", "music", "movies", "movies", "movies", "movies")
count = c(120, 15, 75, 30, 250, 36, 28, 72)
data <- data.frame(cbind(group, category, count))
Я бы хотел добавить столбец sum_to_all, например:
sum_to_all = c(TRUE, TRUE, TRUE, TRUE, FALSE, FALSE, FALSE, FALSE)
data <- data.frame(cbind(group, category, count, sum_to_all))
В этом случае подгруппы переменных счета A, B и C суммируются с количеством в группе «Все» (ИСТИНА) для музыкальной категории, но не для категории фильмов (ЛОЖЬ).
Я знаю, что могу изменить набор данных на широкий, в котором каждая группа будет иметь свой собственный столбец подсчета и сравнивать столбцы, но мне интересно, есть ли простое решение для строк. Заранее спасибо.
data.frame(cbind(group, category, count))
преобразует все ваши числа в текст из-заcbind
, который делаетmatrix
первым. Вы можете пропустить эту часть и просто сделатьdata.frame(group, category, count)
- person thelatemail   schedule 05.05.2021