Статьи по тематике dplyr [r, dplyr, data.table, tidyeval, nse]

Вопросы по теме 'dplyr'

Как найти разницу между значениями в двух строках в кадре данных R с помощью dplyr

У меня есть кадр данных R, например: df <- data.frame(period=rep(1:4,2), farm=c(rep('A',4),rep('B',4)), cumVol=c(1,5,15,31,10,12,16,24), other = 1:8); period farm cumVol other 1 1...

48932 просмотров

r dplyr

13.09.2022

могу ли я переключить группирующую переменную в одном операторе dplyr?

Вот простой пример, иллюстрирующий проблему: library(data.table) dt = data.table(a = c(1,1,2,2), b = 1:2) dt[, c := cumsum(a), by = b][, d := cumsum(a), by = c] # a b c d #1: 1 1 1 1 #2: 1 2 1 2 #3: 2 1 3 2 #4: 2 2 3 4 Попытка сделать то...

2961 просмотров

r data.table dplyr

22.12.2022

dplyr: Как использовать group_by внутри функции?

Я хочу использовать функцию dplyr::group_by внутри другой функции, но я не знаю, как передать аргументы этой функции. Может кто-нибудь привести рабочий пример? library(dplyr) data(iris) iris %.% group_by(Species) %.% summarise(n = n()) # ##...

21534 просмотров

r dplyr tidyeval nse

13.07.2022

Как указать имена столбцов для x и y при объединении в dplyr?

У меня есть два фрейма данных, которые я хочу объединить с помощью dplyr. Один - это фрейм данных, содержащий имена. test_data <- data.frame(first_name = c("john", "bill", "madison", "abby", "zzz"), stringsAsFactors =...

135724 просмотров

r join left-join dplyr

01.01.2024

Работа с уникальными значениями в масштабе (для циклов, применения или плира)

Я не уверен, что это возможно, но если это возможно, это сделало бы жизнь намного эффективнее. Общая проблема, которая была бы интересна более широкому сообществу SO: циклы for (и базовые функции, такие как apply) применимы для...

138 просмотров

r for-loop apply dplyr plyr

11.09.2022

Суммировать больше не группировать

Я думаю, что dplyr потрясающий. Однако я недавно обновил пакет, и мне кажется, что суммирование для меня больше не агрегирует по группам. Что-то похожее на следующий код, используемый для суммирования по группам перед обновлением: iris_tdt <-...

211 просмотров

r dplyr

24.02.2022

Переопределение переменных, не отображаемых в dplyr, для отображения всех столбцов из df

Когда у меня есть столбец в локальном фрейме данных, иногда я получаю сообщение Variables not shown , такое как этот (смехотворный) пример, просто нужно достаточно столбцов. library(dplyr) library(ggplot2) # for movies movies %.%...

18183 просмотров

r options dplyr output-formatting displayformat

30.08.2022

Столбец формата в цепочке dplyr

У меня есть этот набор данных: dat <- structure(list(date = structure(c(1L, 1L, 1L, 2L, 2L, 2L, 3L, 3L, 3L, 4L, 4L), .Label = c("3/31/2014", "4/1/2014", "4/2/2014", "4/3/2014"), class = "factor"), site = structure(c(1L, 2L, 1L, 2L, 1L, 2L,...

20786 просмотров

r dplyr date-formatting

22.10.2022

Аннотация сводной статистики на ggplot над полосами на гистограмме

Я создал функцию, которая принимает переменные dataframe, x и y и групповую переменную в качестве аргументов, она выводит гистограмму по уровням переменной x и граням по групповой переменной. Я хочу поместить текстовую метку над полосой, которая...

2067 просмотров

r annotations ggplot2 dplyr

26.09.2023

Применить сгруппированную модель обратно к данным

Я подхожу таким моделям groupedTrainingSet = group_by(trainingSet, geo); models = do(groupedTrainingSet, mod = lm(revenue ~ julian, data=.)) grouptedTestSet = group_by(testSet, geo); // TODO: apply model back to test set Где модели выглядят...

895 просмотров

r dplyr

14.01.2023

Как использовать dplyr для устранения циклов for?

Кто-нибудь знает метод dplyr для попарного сопоставления данных с отсутствующими наблюдениями, за которыми следует последующая арифметика? Приведенный ниже тяжелый код цикла for представляет собой MWE в основе, но я не смог справиться с подходом...

2807 просмотров

r for-loop dplyr spatial

25.02.2024

Получите доступ к "родительскому" data.frame после использования group_by в dplyr

Я хотел бы сравнить стандартное отклонение переменной со стандартными отклонениями переменной, сгруппированной по фактору. Это общий sd () require(dplyr) iris %.% summarise( Overall.SD = sd(Sepal.Length) ) Однако я не могу получить к...

161 просмотров

r dplyr

14.12.2023

Пакет dplyr: как я могу запросить большой фрейм данных, используя синтаксис SQL типа "% xyz%"?

dplyr - единственный пакет, который может обрабатывать мой 843k data.frame и быстро запрашивать его. Я могу точно фильтровать, используя математику и критерии равенства, однако мне нужно реализовать поиск концепции. Мне нужно что-то вроде этого...

8968 просмотров

r dplyr

28.04.2022

Добавление нескольких столбцов в вызове dplyr mutate

У меня есть фрейм данных с разделенным точками символьным столбцом: > set.seed(310366) > tst = data.frame(x=1:10,y=paste(sample(c("FOO","BAR","BAZ"),10,TRUE),".",sample(c("foo","bar","baz"),10,TRUE),sep="")) > tst x y 1 1...

11968 просмотров

r dplyr

17.03.2022

Переменная веса в dplyr top_n

Я пытаюсь использовать функцию top_n в пакете dplyr , но она работает только тогда, когда я разрешаю функции использовать вес по умолчанию (последняя переменная в фрейме данных). Следующий пример (с использованием веса по умолчанию) работает:...

1501 просмотров

r dplyr

12.02.2024

group_by не подводит итоги

Мне сложно работать с библиотекой dplyr. Я пытался реализовать относительно простой фрагмент кода, но по какой-то причине, когда я группирую по одной переменной и пытаюсь суммировать, чтобы получить общую сумму для этой переменной, я получаю только...

248 просмотров

r dplyr

01.02.2022

Использование mutate сразу для многих столбцов без явного их вывода

Предположим, у меня есть такой фрейм данных d <- data.frame(id = 1:5, var1 = rep(1, 5), var2 = rep(2, 5), var3 = rep(3, 5), m = seq(0, 1, length.out = 5)) d # id var1 var2 var3 m # 1 1 2 3 0.00 # 2 1 2 3 0.25 # 3...

127 просмотров

r dplyr

30.08.2022

Более приятный вывод для вывода функции, применяемой к каждому столбцу

Я пытаюсь найти сводную статистику о data.frame: avg.nas <- apply(my.data, 2, function(x) mean(is.na(x))) Это дает ожидаемый результат: именованный числовой вектор со значением для каждого столбца. Проблема в том, что это значение...

80 просмотров

r apply dplyr

25.09.2023

Группировка DataFrame и усреднение строк в несколько столбцов на основе группирования, игнорирование нулей

Мой фрейм данных data выглядит следующим образом: Week Group Cost Revenue Wk1 A 104 148 Wk1 A 0 159 Wk1 A 92 151 Wk1 A 113 144 Wk1 B 331 500 WK1 B 325 524 Wk1 B...

199 просмотров

r dplyr

25.02.2022

left_join(x,y) и нет данных

Увидев это сообщение с хорошим ответом @akrun, я хотел поиграть с dplyr . Вот примеры данных из поста и akrun. df = data.frame( id1 = c(1,1,2,2,2,3,3,3,3), id2 = c(1,2,1,2,3,1,2,3,4), X1 = letters[1:9], X2 =...

231 просмотров

r dplyr

29.06.2022

Вопросы по теме 'dplyr'

Похожие вопросы